Результаты поиска
Материал из MachineLearning.
По запросу «Transformer»
Страницы с названием «Transformer» не существует.
Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.
Ниже показаны 20 результатов, начиная с № 1.
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)
Нет совпадений в названиях статей
Совпадения в текстах статей
- Алгебра над алгоритмами и эвристический поиск закономерностей (54 356 байт)
59: | [[Media:Transformer.pdf|слайды]] - Прогнозирование (47 383 байта)
85: # '''Temporal Fusion Transformer (TFT)''': специализированная и... - Методы анализа текстов (семинар, К.В.Воронцов) (8344 байта)
66: ...ний. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д. - Глубинное обучение (курс лекций)/2019 (7469 байт)
60: ...> [https://arxiv.org/abs/1706.03762 A paper about Transformer]<br> [https://arxiv.org/abs/1810.04805 A paper ab... - Математические методы анализа текстов (МФТИ) / 2021 (11 422 байта)
122: Архитектура transformer. - Моя первая научная статья (практика, В.В. Стрижов)/Группы 774, 794, весна 2020 (112 220 байт)
770: ...ers.nips.cc/paper/7181-attention-is-all-you-need] Transformer architecture
773: * «Базовый алгоритм»: Transformer model. The input sequence is a SMILES representat...
774: ...onal Graph Convolution Neural Network, Encoder of Transformer. The method is applied to solve yield predictions... - Математические методы анализа текстов (курс лекций) / осень 2020 (15 171 байт)
117: Архитектура transformer. - Математические методы анализа текстов (ВМК МГУ) / 2021 (11 369 байт)
83: RNN, LSTM. Transformer. - Моя первая научная статья (лекции и практика, В.В. Стрижов)/Группы 874, 821, 813, весна 2021 (120 239 байт)
335: ...ers.nips.cc/paper/7181-attention-is-all-you-need] Transformer architecture
338: * «Базовый алгоритм»: Transformer model. The input sequence is a SMILES representat...
339: ...onal Graph Convolution Neural Network, Encoder of Transformer. The method is applied to solve yield predictions... - Математические методы прогнозирования/Осень 2022 (61 096 байт)
88: * RNN, LSTM, attention, transformer models - Компьютерное зрение (19 510 байт)
55: ...я (Attention). Модели класса Vision Transformer (ViT), такие как '''SETR''' (Zheng et al.... - Трансформер (модель) (13 457 байт)
6: '''Трансфо́рмер''' (англ. Transformer) — архитектура [[Нейронная ...
90: ...омпьютерное зрение''' — Vision Transformer (ViT) делит изображение на па... - Механизм внимания (10 099 байт)
68: ...омпьютерное зрение''' — Vision Transformer (ViT) применяет self-attention к пат... - Диффузионная модель (10 337 байт)
40: ...следних моделях (DiT — Diffusion Transformer) U-Net заменяется [[Трансформ... - Ранжирование (47 401 байт)
176: [[Изображение:Transformer ranking architectures.svg|thumb|center|850px|Ри... - Адаптация низкого ранга (21 271 байт)
47: ...мпьютерное зрение]]''': [[Vision Transformer]] (ViT), свёрточные нейронные ... - Самостоятельное обучение (55 524 байта)
175: * [[Vision Transformer]] (ViT) — адаптация классичес... - Смесь экспертов (56 297 байт)
116: === Архитектура Switch Transformer ===
120: ...ставлена архитектура '''Switch Transformer'''<ref>{{статья
134: ...итивного шума:''' Авторы Switch Transformer показали, что при жестком в...
138: ...нженерной оптимизации Switch Transformer позволил масштабировать н...
182: ...ическая схема Шазира и Switch Transformer относится к классу стратег... - Квантование нейронных сетей (27 481 байт)
74: ...жных архитектур (например, Transformer) PTQ может быть нестабильным...
139: * Архитектуры на основе Transformer имеют свои особенности: self-...
160: * '''GPTQ''' (Generative Pre-trained Transformer Quantization) — метод пост-трени...
194: ... облегчения INT8-квантования Transformer-моделей. - Контекстное обучение (10 810 байт)
13: ...р (архитектура нейросетей)|Transformer]]) из-за квадратичной завис...
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

