Обсуждение:Проксимальный градиентный спуск

Материал из MachineLearning.

История создания статьи «Проксимальный градиентный спуск» с помощью LLM

Работа над статьей состояла из нескольких этапов. Для генерации материала использовалась модель Gemini 3.1 Pro. Главной задачей было не просто пересказать сухую теорию, а написать фундаментальную статью с современной инженерной практикой, учитывающую строгие академические и технические стандарты портала MachineLearning.ru.

Сначала был разработан базовый универсальный шаблон (Mega-Prompt), задающий общую структуру и правила форматирования:

✓

Роль: Ты — ведущий исследователь в области машинного обучения и математической оптимизации. Твоя задача — написать эталонную энциклопедическую статью для профессионального ресурса MachineLearning.ru на тему «Проксимальный градиентный спуск» (Proximal Gradient Descent).

Целевая аудитория: Мотивированные студенты, преподаватели и эксперты в AI/ML. Статья должна объяснять математическую базу (субградиенты, проксимальный оператор) новичкам и давать практическую ценность профессионалам (ускорение Нестерова, проксимальные стохастические методы с редукцией дисперсии).

Критерии качества (строго соблюдать):

Никакой «воды» и типичных нейросетевых штампов («Как мы все знаем...», «Подводя итог...»). Стиль — сухой, энциклопедичный, академичный. Пиши как суровый математик.

Высокая связность: оформляй профильные термины как внутренние вики-ссылки (например, [[Субградиент]], [[Выпуклая оптимизация]], [[Lasso-регрессия|LASSO]]).

Глубина материала: не ограничивайся базовым алгоритмом ISTA. Обязательно детально распиши аналитическое вычисление проксимального оператора для L1-нормы (мягкое пороговое отсечение). Сделай мощный раздел про применение метода к негладким штрафам в задаче LASSO, подробно разобрав проксимальные модификации алгоритмов с редукцией дисперсии (SVRG, SAGA, SARAH).

Формат и разметка (критично):

Используй только классическую вики-разметку ресурса (заголовки == Раздел == и === Подраздел ===, списки * и #). Никакого Markdown.

ВНИМАНИЕ: Математические формулы обрамляй ТОЛЬКО тегами <tex>...</tex>. Использование тегов <math>...</math> или символов $ строго запрещено. Пример: <tex>\operatorname{prox}_{\lambda g}(x) = \arg\min_z \left( g(z) + \frac{1}{2\lambda} ||z - x||_2^2 \right)</tex>.

Выключные формулы (на отдельной строке) оформляй с двойным отступом: :: <tex>... </tex>. Подряд идущие формулы в строке текста объединяй в один тег.

Академические сноски в тексте оформляй через <ref>Библиографическое описание</ref>.

Создай раздел == Литература == с тегом <references/>.

Внизу страницы проставь категории: [[Категория:Методы оптимизации]], [[Категория:Энциклопедия анализа данных]]. Добавь 1-2 подходящие категории от себя.

Требуемая структура статьи:

Введение и формальная математическая постановка задачи (минимизация суммы гладкой и негладкой функций).

Проксимальный оператор (строгое определение, геометрический смысл, связь с теоремой Моро).

Вычисление проксимальных операторов (подробный вывод для L1-регуляризатора и мягкого порогового отсечения).

Базовый алгоритм ISTA (шаги алгоритма, условия сходимости для выпуклых задач).

Ускоренные и стохастические методы (FISTA, проксимальные версии SVRG, SAGA и SARAH с акцентом на решение задачи LASSO).

Ссылки и Литература.

Выдай только готовый вики-код статьи. Никаких комментариев до и после кода.

Источник — «http://83.149.227.45/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%BE%D0%BA%D1%81%D0%B8%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B3%D1%80%D0%B0%D0%B4%D0%B8%D0%B5%D0%BD%D1%82%D0%BD%D1%8B%D0%B9_%D1%81%D0%BF%D1%83%D1%81%D0%BA»

Обсуждение:Проксимальный градиентный спуск

Материал из MachineLearning.

История создания статьи «Проксимальный градиентный спуск» с помощью LLM

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты