Сеть замешательства

Метод обработки естественного языка

Сеть путаницы (иногда называемая сетью путаницы слов или неформально известной как колбаса ) — это метод обработки естественного языка , который объединяет выходные данные из нескольких систем автоматического распознавания речи или машинного перевода . [1] [2] Сети путаницы — это простые линейные направленные ациклические графы со свойством, что каждый путь от начального узла до конечного узла проходит через все остальные узлы. Набор слов, представленных ребрами между двумя узлами, называется множеством путаницы. В машинном переводе определяющей характеристикой сетей путаницы является то, что они допускают несколько неоднозначных входных данных, откладывая принятие решений о переводе до более поздних стадий обработки. [3] [4] Этот подход используется в программном обеспечении для машинного перевода с открытым исходным кодом Moses [5] и в проприетарном API перевода в IBM Bluemix Watson . [6]

Пример сети путаницы

Ссылки

  1. ^ Рости, Антти-Вейкко И.; Чжан, Бин; Мацукас, Спирос; Шварц, Ричард (2008). «Пошаговое выравнивание гипотез для построения сетей путаницы с применением к комбинированию систем машинного перевода». Труды Третьего семинара по статистическому машинному переводу . StatMT '08. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 183– 186. ISBN 9781932432091.
  2. ^ Матусов, Евгений; Уэффинг, Никола; Ней, Герман (2006). «Вычисление консенсусного перевода из нескольких систем машинного перевода с использованием улучшенного выравнивания гипотез». В Proc. EACL . CiteSeerX 10.1.1.483.5417 . 
  3. ^ Хоанг, Хьеу (2007). «Факторизованные модели перевода». В трудах Объединенной конференции 2007 года по эмпирическим методам обработки естественного языка и компьютерному обучению естественному языку (EMNLP-CoNLL : 868– 876. CiteSeerX 10.1.1.80.3572 . 
  4. ^ Koehn, Philipp; Hoang, Hieu; Birch, Alexandra; Callison-Burch, Chris; Federico, Marcello; Bertoldi, Nicola; Cowan, Brooke; Shen, Wade; Moran, Christine (2007). "Moses: Open Source Toolkit for Statistical Machine Translation". Труды 45-го ежегодного собрания ACL по интерактивным постерным и демонстрационным сессиям . ACL '07. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 177– 180. doi : 10.3115/1557769.1557821 . S2CID  794019.
  5. ^ "Моисей - Моисей/ConfusionNetworks". www.statmt.org . Получено 2017-11-09 .
  6. ^ "IBM® Speech to Text service provide an API Reference | IBM Watson Developer Cloud". www.ibm.com . Архивировано из оригинала 2017-11-09 . Получено 2017-11-09 . Значение достоверности, которое является нижней границей для определения гипотезы как возможной альтернативы слову (также известно как "Сети путаницы"). Альтернативное слово рассматривается, если его достоверность больше или равна пороговому значению. Укажите вероятность от 0 до 1 включительно. Альтернативные слова не вычисляются, если параметр опущен.


Retrieved from "https://en.wikipedia.org/w/index.php?title=Confusion_network&oldid=1030944106"