Заглавная страница
Материал из MachineLearning.
м (оформление) |
(стилевые правки) |
||
| Строка 90: | Строка 90: | ||
|count=10 | |count=10 | ||
}} | }} | ||
| - | '''[[:Категория:Публикации| | + | '''[[:Категория:Публикации|Все публикации]]''' |
}} | }} | ||
| | | | ||
| Строка 97: | Строка 97: | ||
{{Раздел заглавной страницы 2 | x=1 | y=0 | Заголовок =Последние новости |Содержание= | {{Раздел заглавной страницы 2 | x=1 | y=0 | Заголовок =Последние новости |Содержание= | ||
* C '''9 по 14 июня 2008 года''' в г. Алуште согласно планам [[:Категория:Мероприятия|научных мероприятий]] академий наук России, Украины и Беларуси будет проведена Международная конференция «[[Интеллектуализация обработки информации (конференция)|Интеллектуализация обработки информации]]». В рамках конференции планируется презентация и обсуждение Ресурса. | * C '''9 по 14 июня 2008 года''' в г. Алуште согласно планам [[:Категория:Мероприятия|научных мероприятий]] академий наук России, Украины и Беларуси будет проведена Международная конференция «[[Интеллектуализация обработки информации (конференция)|Интеллектуализация обработки информации]]». В рамках конференции планируется презентация и обсуждение Ресурса. | ||
| - | * '''20 мая 2008 года''' — Количество страниц в базе данных ресурса достигло '''500''' (из них '''97''' статей). | + | * '''20 мая 2008 года''' — Количество страниц в базе данных ресурса достигло '''500''' (из них '''97''' статей). Создано пространство имён [[Special:Allpages/Публикации:|«Публикация»]], {{S|в тестовом}} режиме заведено '''4''' публикации. |
[[Новости|'''Все новости''']] | [[Новости|'''Все новости''']] | ||
}} | }} | ||
Версия 20:40, 20 мая 2008
| MachineLearning.Ru
посвященный машинному обучению и интеллектуальному анализу данных. Сейчас ресурс содержит 1175 статей на русском языке. | ||
| Классификация | Обработка и анализ текста | |
| Прогнозирование | Анализ и понимание изображений | |
| Регрессионный анализ | Извлечение знаний из баз данных | |
| Прикладная статистика | Прикладные задачи анализа данных | |
| Распознавание образов | Прикладные системы анализа данных | |
| Обработка сигналов | Все направления |
| О проекте | Инструктаж | Все статьи | Ненаписанные статьи | Полезные ссылки | Частые вопросы | Справка |
|
Цели Ресурса
Основные принципы
Ресурс строится по принципам Википедии — свободной энциклопедии. Содержимое Ресурса создаётся всеми его пользователями и является общественным достоянием. Каждый пользователь ресурса может создать или модифицировать статью или раздел (категорию), в любое время, в любом месте, располагая только доступом в Интернет. Главное отличие от Википедии — профессиональная направленность тематики. Допускается (и поощряется) пополнение Ресурса специальными, исследовательскими, полемическими и учебными материалами. По этой причине Ресурс не может являться частью Википедии. В то же время, не исключается возможность обмена материалами с Википедией и другими сетевыми энциклопедиями. Новые статьи
Новое в разделе «Публикации»
@inproceedings{vangansbeke2020scan,
title={Scan: Learning to classify images without labels},
author={Van Gansbeke, Wouter and Vandenhende, Simon and Georgoulis, Stamatios and Proesmans, Marc and Van Gool, Luc},
booktitle={European Conference on Computer Vision},
pages={268--285},
year={2020},
organization={Springer}
}
АннотацияСтатья описывает алгоритм SCAN (Semantic Clustering by Adopting Nearest neighbors), предлагающий двухэтапный подход к задаче необучаемой классификации изображений. Метод изолирует процесс извлечения признаков от этапа кластеризации, что позволяет избежать группировки данных на основе низкоуровневых визуальных эвристик (цвет, текстура) в пользу семантически значимых признаков. Введение и мотивацияКлассические подходы к сквозному (end-to-end) обучению кластеризации часто сталкиваются с проблемой вырождения признаков, когда сверточные нейронные сети группируют объекты на основе низкоуровневых признаков (таких как цветовые гистограммы, текстуры или общие фоны), а не их реального семантического содержания. Кроме того, одновременная оптимизация репрезентаций и распределения по кластерам порождает нестабильность обучения и склонность к тривиальным решениям. Авторы SCAN констатируют, что разделение этих двух процессов позволяет использовать сильные стороны современных методов контрастивного самообучения (self-supervised learning) для формирования робастных семантических пространств, в которых геометрическая близость векторов соответствует категориальной близости объектов. Архитектура и метод SCANАлгоритм SCAN реализует последовательный трехстадийный конвейер:
Pretext Task (Обучение признаков)На первом этапе исходные изображения пропускаются через кодировщик признаков (архитектура ResNet-50), обучаемый без разметки с помощью алгоритмов контрастивного самообучения, таких как SimCLR[1] или MoCo[1]. Целевая функция нацелена на максимизацию сходства между различными случайными аугментациями одного и того же изображения (позитивные пары) и минимизацию сходства с другими изображениями батча (негативные пары). В результате формируется репрезентативное пространство, инвариантное к пространственным и цветовым искажениям, где взаимное расположение векторов определяется высокоуровневой семантикой. SCAN (Semantic Clustering by Adopting Nearest neighbors)Для каждого изображения Поверх замороженного кодировщика инициализируется классификационная голова, параметризованная весами Для предотвращения вырожденного решения, при котором модель присваивает все объекты выборки одному и тому же кластеру, вводится регуляризационный член, максимизирующий энтропию усредненного по мини-батчу распределения предсказаний: Где Итоговый функционал потерь на этапе кластеризации представляет собой линейную комбинацию: где Self-Labeling (Саморазметка)Этап семантической кластеризации позволяет сгруппировать основную массу данных, однако на границах кластеров могут оставаться неоднозначности, вызванные локальным шумом в графе ближайших соседей. Для очистки границ применяется шаг саморазметки. Объекты, для которых уверенность предсказания превосходит жестко заданный порог Эксперименты и результатыЭффективность алгоритма SCAN была подтверждена экспериментами на стандартных наборах данных для компьютерного зрения: CIFAR-10, CIFAR-100 (с использованием 20 суперклассов) и STL-10. Качество кластеризации измерялось с помощью метрик Accuracy (ACC), Normalized Mutual Information (NMI) и Adjusted Rand Index (ARI). На датасете CIFAR-10 метод SCAN достиг точности (ACC) 88.3%, на STL-10 — 76.7% (80.9% с последующей саморазметкой), превзойдя существовавшие на тот момент end-to-end подходы, такие как IIC[1] (показавший 61.7% на CIFAR-10). Примечания
Литература
|
Последние новости
Основные категории
Последние правки
|
| Работа над созданием Ресурса MachineLearning.Ru ведется при поддержке РФФИ (проект № 07-07-00372) и компании Forecsys |

