Участник:Dovlat Demin
Материал из MachineLearning.
Содержание |
Логистическая регрессия
Логистическая регрессия — это метод обучения с учителем для задач классификации, который моделирует вероятность принадлежности объекта к классу как функцию линейной комбинации признаков. Несмотря на название, метод относится к линейным моделям.
Модель является частным случаем обобщённых линейных моделей (GLM).
1. Определения
Пусть задана обучающая выборка:
,
где — вектор признаков, а
— метка класса.
Линейная модель задаёт скалярный отклик:
,
где — веса модели,
— смещение.
Далее этот отклик преобразуется в вероятность.
1.1. Случай двух классов
Для бинарной классификации используется сигмоидная функция:
Решающее правило:
2. Обоснования
2.1. С точки зрения минимизации эмпирического риска
Логистическая регрессия получается как решение задачи максимального правдоподобия, что эквивалентно минимизации логистической функции потерь:
где .
Эта функция также называется бинарной кросс-энтропией.
2.2. С точки зрения байесовской классификации
Если предположить, что:
- классы разделяются линейной функцией
- распределения принадлежат экспоненциальному семейству
то апостериорная вероятность принимает логистическую форму:
Таким образом, логистическая регрессия является параметрической моделью байесовского классификатора.
3. Методы настройки весов
3.1. Градиентный метод первого порядка
Градиент функции потерь:
Правило обновления:
где — шаг обучения.
3.2. Метод второго порядка IRLS
IRLS (Iteratively Reweighted Least Squares) основан на методе Ньютона:
где — гессиан функции потерь.
Алгоритм интерпретируется как последовательность взвешенных задач наименьших квадратов.
4. Геометрическая интерпретация
Логистическая регрессия задаёт гиперплоскость разделения:
Свойства:
- вероятность зависит от расстояния до гиперплоскости
- при удалении от границы вероятность стремится к 0 или 1
- поверхность уровня
совпадает с разделяющей гиперплоскостью
Таким образом модель можно рассматривать как «размытую» линейную классификацию.
5. Многоклассовая логистическая регрессия
Для классов используется обобщение — softmax-регрессия.
Для каждого класса вводится свой вектор параметров:
Вероятности задаются softmax-функцией:
Функция потерь:
где — one-hot представление меток.
Свойства:
-
- при
сводится к бинарной логистической регрессии
- является линейной моделью в пространстве признаков
6. Связь с другими методами
Логистическая регрессия связана с:
- линейная регрессия
- перцептрон
- SVM
- нейронные сети (softmax-слой)
7. Интерпретация как вероятностная модель
Логистическая регрессия является представителем GLM с логит-функцией связи:
8. Литература
- Bishop C. M. "Pattern Recognition and Machine Learning", 2006
- Hastie T., Tibshirani R., Friedman J. "The Elements of Statistical Learning", 2009
- Murphy K. "Machine Learning: A Probabilistic Perspective", 2012
- McCullagh P., Nelder J. "Generalized Linear Models", 1989
- Goodfellow I., Bengio Y., Courville A. "Deep Learning", 2016

