Виртуальный тренажер «Базовые элементы обработки естественного языка (NLP — Natural Language Processing) «


Виртуальный тренажер «Базовые элементы обработки естественного языка» предназначен для обучения, изучения и проведения экспериментов с обработкой естественного языка, позволяющего в интерактивном режиме собирать и тестировать различные NLP-конвейеры. Приложение-тренажер сочетает в себе мощь современных методов обработки естественного языка с интуитивно понятным визуальным интерфейсом, что делает его ценным ресурсом для исследователей и студентов.

Лабораторная работа “Оператор”

Функциональность

Система компонентов

  • Библиотека NLP-компонентов в виде 3D-объектов
  • Система соединений между компонентами через виртуальные «провода»
  • Перетаскивание и размещение компонентов на виртуальном столе
  • Изменение параметров компонентов через инспектор

Управление проектами

  • Создание/сохранение/загрузка NLP-сборок
  • Множественные рабочие области (scenes)

Компоненты NLP (модули)

2.2.1. Блоки ввода/вывода

  • Text Input: поле для ввода текста
  • Text Output: отображение результата

2.2.2. Блоки предобработки

  • To 3D: преобразование многомерного вектора в 3Д проекцию
  • Matrix Of Words: матрица векторов слов
  • Lstsq: вычисляет матрицу методом наименьших квадратов
  • Translate: производит перевод слова на другой язык используя предобученную матрицу
  • Tokenizer: разделение текста на токены
  • Normalizer: нормализация текста
  • LLM Model: блок реализации полной LLM

2.2.3. Блоки векторных представлений

  • Word2vec: преобразование слова в многомерный вектор
  • Most Similar: расчет семантической близости
  • Vector Operations: математические операции с векторами

2.2.4. Блоки визуализации

  • Tensor View: визуализация многомерного вектора в 3Д пространстве
  • Vectors View: визуализация многомерных векторов в 3Д пространстве
  • Graph Visualizer: графовая визуализация связей
  • Heatmap Generator: тепловые карты схожести

2.2.5. Блоки анализа

  • PCA Reducer: уменьшение размерности методом главных компонент
  • t-SNE Visualizer: визуализация t-SNE
  • Cluster Analyzer: кластерный анализ
  • Statistics Calculator: статистические метрики

Скриншоты

Главное меню

Список компонентов и инспектор свойств

3Д визуализация тензорного пространства

Минимальные системные требования

  • ОС: Windows 10
  • Процессор: Intel(R) Core(TM) i7-7700K, аналогичный AMD или лучше
  • Оперативная память: 8 Гб
  • Видеокарта: Nvidia GeForce GTX 1050Ti, AMD Radeon RX 550 или лучше
  • Место на диске: 2 Гб