Алгоритм выравнивания Гейла–Черча

Алгоритм параллельного выравнивания текста

В вычислительной лингвистике алгоритм Гейла–Черча — это метод выравнивания соответствующих предложений в параллельном корпусе . Он работает по принципу, что эквивалентные предложения должны примерно соответствовать по длине; то есть более длинные предложения на одном языке должны соответствовать более длинным предложениям на другом языке. Алгоритм был описан в статье 1993 года Уильямом А. Гейлом и Кеннетом В. Черчем из AT&T Bell Laboratories .

Ссылки

  • Гейл, Уильям А.; Чёрч, Кеннет В. ( 1993 ), «Программа выравнивания предложений в двуязычных корпусах» (PDF) , Компьютерная лингвистика , 19 (1): 75–102


Взято с "https://en.wikipedia.org/w/index.php?title=Алгоритм_выравнивания_Гейла–Церкви&oldid=1245765377"