Эта таблица дополняет таблицу про 12 важнейших терминов AI.
Группа | Термин (английский и русский) | Описание термина |
---|---|---|
Архитектуры и базовые концепции | LLM (Большая языковая модель) | Продвинутые ИИ-системы, обученные на больших текстовых данных для понимания и генерации текста. |
Transformers (Трансформеры) | Архитектура нейросетей, использующая механизм самовнимания для обработки последовательностей. | |
Multimodal Models (Мультимодальные модели) | Модели, обрабатывающие одновременно несколько типов данных, например текст+изображение. | |
Работа с запросами и выводами | Prompt Engineering (Промпт-инжиниринг) | Проектирование эффективных запросов для управления поведением ИИ. |
Chain-of-Thought (Цепочка размышлений) | Пошаговое логическое рассуждение модели для сложных задач. | |
Fine-grained Control (Тонкое управление моделью) | Умение давать сложные инструкции для более точной генерации контента. | |
Тренировка и адаптация моделей | Fine-tuning (Тонкая настройка) | Дообучение модели на специализированных датасетах. |
LoRA (Низкоранговая адаптация) | Лёгкая адаптация модели через добавление малых матриц без полного переобучения. | |
Adapters (Адаптеры) | Встраиваемые слои для переобучения модели на новую задачу без изменения её основных весов. | |
Оптимизация моделей | Quantization (Квантизация) | Снижение разрядности весов модели для ускорения работы и уменьшения размера. |
Pruning (Обрезка нейронной сети) | Удаление несущественных нейронов для оптимизации модели. | |
Gradient Descent (Градиентный спуск) | Алгоритм оптимизации моделей путём минимизации функции потерь. | |
Работа с генерацией | Embeddings (Встраивания) | Векторные представления данных в высокоразмерном пространстве. |
Tokens (Токены) | Элементарные единицы текста (слова, подслова, символы) в модели. | |
RAG (Извлечение дополненной генерацией) | Комбинация поиска данных и их генерации в текстовый ответ. | |
Top-k Sampling (Выборка из топ-k) | Генерация текста из наиболее вероятных k токенов. | |
Top-p Sampling (Выборка из ядра) | Генерация текста из группы токенов, чья суммарная вероятность превышает порог p. | |
Качество и ошибки моделей | Hallucination (Галлюцинация) | Генерация неправдивой информации ИИ при высоком правдоподобии. |
Zero-shot (Нулевая выборка) | Решение задач без специального обучения на соответствующих примерах. | |
Context Window (Контекстное окно) | Ограничение на объём текста, который модель может учитывать одновременно. | |
Temperature (Температура) | Управление степенью случайности в генерации следующего токена. | |
Специализированные модели | Diffusion Models (Модели диффузии) | Модели, генерирующие данные путём восстановления из зашумленного состояния (например, для изображений). |