Flow Matching
Материал из MachineLearning.
| | Статья написана с использованием LLM Gemini 3.1 Pro и проверена участником Renal Gazizullin 18:50, 25 июня 2026 (MSD) |
Flow Matching (Сопоставление потоков) — метод обучения генеративных моделей, основанный на непрерывных нормализующих потоках (Continuous Normalizing Flows, CNF), который позволяет аппроксимировать распределения данных с помощью детерминированных обыкновенных дифференциальных уравнений (ОДУ). В отличие от классических диффузионных моделей, использующих стохастические дифференциальные уравнения, Flow Matching работает напрямую с векторными полями, обеспечивая построение прямолинейных траекторий генерации, что существенно снижает вычислительные затраты на этапе сэмплинга[1].
Содержание |
Введение и концепция пуш-аут распределений
В основе метода лежит концепция пуш-аут (push-forward) распределения вероятностей. Пусть задано простое базовое распределение (как правило, стандартное гауссово распределение
) в пространстве
, и целевое распределение данных
. Задача непрерывных нормализующих потоков заключается в поиске зависящего от времени векторного поля
, которое определяет траектории диффеоморфизма
посредством автономного ОДУ:
Диффеоморфизм переносит базовую плотность в зависящий от времени путь плотностей
. В момент времени
распределение
должно аппроксимировать эмпирическое распределение данных
.
Математическая постановка задачи Flow Matching
Пусть задан фиксированный путь плотностей для
и соответствующее ему векторное поле
. Связь между плотностью и векторным полем жестко задается уравнением непрерывности (continuity equation):
где обозначает дивергенцию векторного поля.
Если бы целевое векторное поле было известно, то задача аппроксимации сводилась бы к минимизации функционала Flow Matching:
где — параметризованная нейросеть (векторное поле). Однако данный лосс невычислим в практических задачах, поскольку истинный путь плотностей
и соответствующее поле
, порождающие распределение данных, неизвестны.
Conditional Flow Matching (CFM)
Для преодоления проблемы невычислимости вводится метод условного сопоставления потоков (Conditional Flow Matching, CFM)[1]. Вместо работы с маргинальными распределениями, траектории строятся относительно конкретного обуславливающего объекта (например, объекта выборки ).
Определим условный путь плотностей и условное векторное поле
, удовлетворяющие условному уравнению непрерывности:
Маргинальные величины выражаются через условные с помощью интегрирования по распределению данных:
Функционал Conditional Flow Matching имеет вид:
Важнейший теоретический результат Flow Matching состоит в том, что условный лосс и исходный лосс эквивалентны с точностью до константы, независимой от параметров модели, и их градиенты по совпадают:
Поскольку условные формы и
выбираются аналитически (например, в виде гауссовских переходов), функционал
становится полностью вычислимым.
Оптимальный транспорт во Flow Matching (OT-FM)
Выбор условного пути распределений определяет геометрические свойства траекторий ОДУ. В стандартном случае гауссовских условных путей, с обусловливанием как на начальную точку , так и на конечную
, условная плотность задается как:
Для реализации концепции оптимального транспорта (Optimal Transport Flow Matching, OT-FM) выбираются линейная интерполяция средних значений и постоянная дисперсия[1]:
где — малое скалярное значение, гарантирующее регуляризацию шума.
Тогда условное векторное поле принимает максимально простой вид, не зависящий от времени напрямую:
Использование OT-FM гарантирует, что индивидуальные условные траектории представляют собой прямые линии, соединяющие и
. Это минимизирует полную кинетическую энергию потока:
что математически связывает данный подход с Монжевской задачей оптимального транспорта. На практике прямолинейность траекторий минимизирует кривизну маргинального векторного поля .
Сравнение с диффузионными моделями
Flow Matching обладает рядом преимуществ перед классическими диффузионными моделями (такими как DDPM или SDE-подходы Сонга):
- Детерминированность траекторий: Вместо стохастических дифференциальных уравнений, требующих добавления шума на каждом шаге, генерация во Flow Matching реализуется через ОДУ (Probability Flow ODE). Это исключает случайность в процессе сэмплинга при фиксированном начальном шуме.
- Прямолинейность и скорость сэмплинга: В диффузионных моделях траектории сильно искривлены из-за дисперсионного расписания (variance schedule). Для их интегрирования требуются десятки и сотни шагов. Траектории OT-FM близки к прямым линиям, что позволяет использовать простейшие численные методы (например, метод Эйлера) с малым количеством шагов (вплоть до 4–10 шагов без потери качества).
- Отсутствие сингулярности в решении: Метод не требует бесконечного уровня шума или бесконечной скорости изменения в начальный момент времени, что стабилизирует процесс обучения численными методами.

