Обсуждение:Дистилляция моделей

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
 
Строка 18: Строка 18:
Важно:
Важно:
-
Избегай структуры «Введение Основная часть Заключение», характерной для рефератов. Это энциклопедическая статья.
+
Избегай структуры «Введение - Основная часть - Заключение», характерной для рефератов. Это энциклопедическая статья.
Никакой воды, только техническая конкретика.
Никакой воды, только техническая конкретика.

Текущая версия

История создания статьи «Дистилляция моделей» с помощью LLM

Первый промпт к DeepSeek-V3 был таким:

Ты - эксперт по машинному обучению и научный редактор энциклопедии MachineLearning.ru. Напиши глубокую и полезную статью на русском языке на тему «Дистилляция моделей» (Knowledge Distillation).

Целевая аудитория: мотивированные новички (студенты технических вузов) и профессионалы. Статья должна быть понятна тем, кто впервые встречает термин, но содержать детали и ссылки, ценные для экспертов. Стиль — спокойный, академический.

Создай текст, отвечающий таким критериям:

Новизна и глубина. Читатель должен дочитать до конца и узнать нечто новое. Раскрой тему через идею, что дистилляция - это не просто сжатие, а передача так называемого «тёмного знания» (dark knowledge).

Баланс сложности. Начни с простой аналогии и чёткого определения. Затем углубись в математику: дивергенция Кульбака–Лейблера, soft-таргеты, роль температуры (softmax temperature). Опиши виды дистилляции (офлайн, онлайн, самодистилляция) и их особенности.

Связность. Постоянно упоминай ключевые термины (например, teacher model, student model, soft labels) так, как если бы каждый из них был ссылкой на отдельную статью. При первом появлении термина выделяй его курсивом и поясняй.

Экспертность. Текст должен читаться так, будто его написал доцент кафедры ИИ, а не языковая модель.

Важно: Избегай структуры «Введение - Основная часть - Заключение», характерной для рефератов. Это энциклопедическая статья.

Никакой воды, только техническая конкретика.

Каждое важное понятие при первом упоминании выделяй курсивом и кратко поясняй, чтобы текст был самодостаточным.


Получившаяся статья оказалась структурно точной и содержательной, однако обнаружились две проблемы: формулы были записаны в тегах <math>, не поддерживаемых движком, и отсутствовал раздел «Литература».

Я составил второй промпт:

Доработай статью. Требуется два строгих исправления.

1. Формулы: замени все вхождения математических выражений, обрамлённых тегами <math>...</math>, на формат .... Пример: :p_i = \frac{\exp(z_i / T)}{\sum_j \exp(z_j / T)}. Убедись, что все переменные и индексы обёрнуты правильно.

2. Добавь после раздела «См. также» новый раздел «Литература». Включи в него исключительно фундаментальные работы, гарантированно существующие и общепризнанные в области дистилляции. Оформи каждую позицию в виде вики-ссылки на arXiv с краткой аннотацией. Не добавляй лишних или неопубликованных источников.

Выведи исправленную вики-разметку статьи целиком.


После этого модель заменила все формулы на корректный формат и добавила список литературы из шести ключевых работ. Я проверил все ссылки - они ведут на соответствующие препринты arXiv, ошибок не обнаружено.

Ручное вмешательство было минимальным. В целом опыт считаю успешным. — Mihail Mishin 15:00, 17 июня 2026 (MSD)