Обсуждение:Дистилляция моделей
Материал из MachineLearning.
(Различия между версиями)
(Новая: == История создания статьи «Дистилляция моделей» с помощью LLM == Для генерации материала использовала...) |
|||
| Строка 1: | Строка 1: | ||
== История создания статьи «Дистилляция моделей» с помощью LLM == | == История создания статьи «Дистилляция моделей» с помощью LLM == | ||
| - | + | Первый промпт к DeepSeek-V3 был таким: | |
| - | + | ||
| - | Первый промпт был таким: | + | |
{{tip| | {{tip| | ||
| - | + | Ты - эксперт по машинному обучению и научный редактор энциклопедии MachineLearning.ru. Напиши глубокую и полезную статью на русском языке на тему «Дистилляция моделей» (Knowledge Distillation). | |
| - | Целевая аудитория: студенты и | + | Целевая аудитория: мотивированные новички (студенты технических вузов) и профессионалы. Статья должна быть понятна тем, кто впервые встречает термин, но содержать детали и ссылки, ценные для экспертов. Стиль — спокойный, академический. |
| - | + | Создай текст, отвечающий таким критериям: | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | Новизна и глубина. Читатель должен дочитать до конца и узнать нечто новое. Раскрой тему через идею, что дистилляция - это не просто сжатие, а передача так называемого «тёмного знания» (dark knowledge). | |
| - | - | + | |
| - | - | + | Баланс сложности. Начни с простой аналогии и чёткого определения. Затем углубись в математику: дивергенция Кульбака–Лейблера, soft-таргеты, роль температуры (softmax temperature). Опиши виды дистилляции (офлайн, онлайн, самодистилляция) и их особенности. |
| - | + | ||
| - | + | Связность. Постоянно упоминай ключевые термины (например, teacher model, student model, soft labels) так, как если бы каждый из них был ссылкой на отдельную статью. При первом появлении термина выделяй его курсивом и поясняй. | |
| + | |||
| + | Экспертность. Текст должен читаться так, будто его написал доцент кафедры ИИ, а не языковая модель. | ||
| + | |||
| + | Важно: | ||
| + | Избегай структуры «Введение — Основная часть — Заключение», характерной для рефератов. Это энциклопедическая статья. | ||
| + | |||
| + | Никакой воды, только техническая конкретика. | ||
| + | |||
| + | Каждое важное понятие при первом упоминании выделяй курсивом и кратко поясняй, чтобы текст был самодостаточным. | ||
}} | }} | ||
| - | + | Получившаяся статья оказалась структурно точной и содержательной, однако обнаружились две проблемы: формулы были записаны в тегах <math>, не поддерживаемых движком, и отсутствовал раздел «Литература». | |
| - | + | Я составил второй промпт: | |
{{tip| | {{tip| | ||
| - | + | Доработай статью. Требуется два строгих исправления. | |
| - | + | 1. Формулы: замени все вхождения математических выражений, обрамлённых тегами <math>...</math>, на формат <tex>...</tex>. Пример: :<tex>p_i = \frac{\exp(z_i / T)}{\sum_j \exp(z_j / T)}</tex>. Убедись, что все переменные и индексы обёрнуты правильно. | |
| - | + | 2. Добавь после раздела «См. также» новый раздел «Литература». Включи в него исключительно фундаментальные работы, гарантированно существующие и общепризнанные в области дистилляции. Оформи каждую позицию в виде вики-ссылки на arXiv с краткой аннотацией. Не добавляй лишних или неопубликованных источников. | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | Выведи исправленную вики-разметку статьи целиком. | |
}} | }} | ||
| - | + | После этого модель заменила все формулы на корректный формат и добавила список литературы из шести ключевых работ. Я проверил все ссылки - они ведут на соответствующие препринты arXiv, ошибок не обнаружено. | |
| - | + | ||
| - | + | ||
| - | В целом опыт считаю успешным — | + | Ручное вмешательство было минимальным. В целом опыт считаю успешным. — ''[[Участник:Mihail Mishin|Mihail Mishin]] 15:00, 17 июня 2026 (MSD)'' |
Версия 12:04, 17 июня 2026
История создания статьи «Дистилляция моделей» с помощью LLM
Первый промпт к DeepSeek-V3 был таким:
Получившаяся статья оказалась структурно точной и содержательной, однако обнаружились две проблемы: формулы были записаны в тегах <math>, не поддерживаемых движком, и отсутствовал раздел «Литература».
Я составил второй промпт:
После этого модель заменила все формулы на корректный формат и добавила список литературы из шести ключевых работ. Я проверил все ссылки - они ведут на соответствующие препринты arXiv, ошибок не обнаружено.
Ручное вмешательство было минимальным. В целом опыт считаю успешным. — Mihail Mishin 15:00, 17 июня 2026 (MSD)

