Margin-infused relax algorithm (MIRA) [1] — это алгоритм машинного обучения , онлайн-алгоритм для задач многоклассовой классификации . Он разработан для изучения набора параметров (вектора или матрицы) путем обработки всех заданных обучающих примеров один за другим и обновления параметров в соответствии с каждым обучающим примером, так что текущий обучающий пример классифицируется правильно с запасом против неверных классификаций, по крайней мере, таким же большим, как их потери. [2] Изменение параметров сохраняется настолько малым, насколько это возможно.
Двухклассовая версия, называемая бинарным MIRA [1], упрощает алгоритм, не требуя решения задачи квадратичного программирования (см. ниже). При использовании в конфигурации «один против всех» бинарное MIRA может быть расширено до многоклассового обучающегося, который приближается к полному MIRA, но может быть быстрее в обучении.
Поток алгоритма [3] [4] выглядит следующим образом:
Алгоритм MIRA Вход: Примеры обучения Выход: Набор параметров
← 0, ← 0 для ← 1 для для ← 1 для ← обновить в соответствии с ← конец для конец для возврата
"←" обозначает назначение . Например, " largest ← item " означает, что значение largest изменяется на значение item .
« return » завершает алгоритм и выводит следующее значение.
Затем шаг обновления формализуется как задача квадратичного программирования [2] : найти , так что , т.е. оценка текущего правильного обучения должна быть больше оценки любого другого возможного по крайней мере на величину потерь (количества ошибок) этого обучения по сравнению с .
Ссылки
^ ab Crammer, Koby; Singer, Yoram (2003). «Ультраконсервативные онлайн-алгоритмы для многоклассовых задач». Журнал исследований машинного обучения . 3 : 951–991 .
^ ab Макдональд, Райан; Краммер, Коби; Перейра, Фернандо (2005). "Онлайн-обучение анализаторов зависимостей с большим запасом" (PDF) . Труды 43-го ежегодного собрания ACL . Ассоциация компьютерной лингвистики . С. 91–98 .
^ Ватанабэ, Т. и др. (2007): «Онлайн-обучение с большим объемом данных для статистического машинного перевода». В: Труды Объединенной конференции 2007 года по эмпирическим методам обработки естественного языка и компьютерному обучению естественному языку , 764–773.
^ Bohnet, B. (2009): Эффективный анализ структур синтаксической и семантической зависимости . Труды конференции по изучению естественного языка (CoNLL), Боулдер, 67–72.