Виртуальный тренажер «Базовые элементы обработки естественного языка» предназначен для обучения, изучения и проведения экспериментов с обработкой естественного языка, позволяющего в интерактивном режиме собирать и тестировать различные NLP-конвейеры. Приложение-тренажер сочетает в себе мощь современных методов обработки естественного языка с интуитивно понятным визуальным интерфейсом, что делает его ценным ресурсом для исследователей и студентов.

Лабораторная работа “Оператор”
Функциональность
Система компонентов
- Библиотека NLP-компонентов в виде 3D-объектов
- Система соединений между компонентами через виртуальные «провода»
- Перетаскивание и размещение компонентов на виртуальном столе
- Изменение параметров компонентов через инспектор
Управление проектами
- Создание/сохранение/загрузка NLP-сборок
- Множественные рабочие области (scenes)
Компоненты NLP (модули)
2.2.1. Блоки ввода/вывода
- Text Input: поле для ввода текста
- Text Output: отображение результата
2.2.2. Блоки предобработки
- To 3D: преобразование многомерного вектора в 3Д проекцию
- Matrix Of Words: матрица векторов слов
- Lstsq: вычисляет матрицу методом наименьших квадратов
- Translate: производит перевод слова на другой язык используя предобученную матрицу
- Tokenizer: разделение текста на токены
- Normalizer: нормализация текста
- LLM Model: блок реализации полной LLM
2.2.3. Блоки векторных представлений
- Word2vec: преобразование слова в многомерный вектор
- Most Similar: расчет семантической близости
- Vector Operations: математические операции с векторами
2.2.4. Блоки визуализации
- Tensor View: визуализация многомерного вектора в 3Д пространстве
- Vectors View: визуализация многомерных векторов в 3Д пространстве
- Graph Visualizer: графовая визуализация связей
- Heatmap Generator: тепловые карты схожести
2.2.5. Блоки анализа
- PCA Reducer: уменьшение размерности методом главных компонент
- t-SNE Visualizer: визуализация t-SNE
- Cluster Analyzer: кластерный анализ
- Statistics Calculator: статистические метрики
Скриншоты

Главное меню

Список компонентов и инспектор свойств

3Д визуализация тензорного пространства
Минимальные системные требования
- ОС: Windows 10
- Процессор: Intel(R) Core(TM) i7-7700K, аналогичный AMD или лучше
- Оперативная память: 8 Гб
- Видеокарта: Nvidia GeForce GTX 1050Ti, AMD Radeon RX 550 или лучше
- Место на диске: 2 Гб
