Филипп Кён | |
---|---|
Рожденный | ( 1971-08-01 )1 августа 1971 г. |
Гражданство | Германия |
Альма-матер | Средняя школа Альберта Швейцера (Эрланген) , Университет Эрлангена-Нюрнберга , Университет Теннесси , Университет Южной Калифорнии |
Известный | Европейский корпус , Моисей |
Награды | Финалист – Европейская премия изобретателя ЕПВ 2013 г. |
Научная карьера | |
Поля | компьютерные науки , обработка естественного языка , машинный перевод , кросс-языковой поиск информации |
Учреждения | Эдинбургский университет , Университет Джонса Хопкинса |
научный руководитель | Кевин Найт |
Филипп Кён (родился 1 августа 1971 года в Эрлангене , Западная Германия ) — учёный-компьютерщик и исследователь в области машинного перевода . [1] [2] Его основной исследовательский интерес — статистический машинный перевод , и он является одним из изобретателей метода, называемого машинным переводом на основе фраз. Это подраздел статистических методов перевода, который использует последовательности слов (или так называемые «фразы») в качестве основы перевода, расширяя предыдущие подходы, основанные на словах. Статья 2003 года, которую он написал совместно с Францем Йозефом Охом и Даниэлем Марку под названием «Статистический перевод на основе фраз», привлекла широкое внимание в сообществе машинного перевода и была процитирована более тысячи раз. [3] Методы, основанные на фразах, широко используются в приложениях машинного перевода в промышленности.
Филипп Кён получил докторскую степень в области компьютерных наук в 2003 году в Университете Южной Калифорнии , где он работал в Институте информационных наук под руководством Кевина Найта. После года работы в качестве постдокторанта под руководством Майкла Коллинза в Массачусетском технологическом институте , он присоединился к Эдинбургскому университету в качестве лектора в Школе информатики в 2005 году. Он был назначен рецензентом в 2010 году и профессором в 2012 году. В 2014 году он был назначен профессором на кафедре компьютерных наук Университета Джонса Хопкинса , где он связан с Центром обработки языка и речи .
Декодер машинного перевода Moses — проект с открытым исходным кодом, созданный и поддерживаемый под руководством Филиппа Кёна. [4] Декодер Moses — это платформа для разработки систем статистического машинного перевода с учетом параллельного корпуса для любой языковой пары. [5] Декодер был в основном разработан Хьеу Хоангом и Филиппом Кёном в Эдинбургском университете и расширен во время летнего семинара Университета Джонса Хопкинса и далее доработан при финансировании проектов Euromatrix и GALE. Декодер (который является частью полного набора инструментов статистического машинного перевода) является фактическим эталоном для исследований в этой области.
Хотя Кён продолжает играть важную роль в разработке Moses, декодер Moses поддерживался проектами European Framework 6 Euromatrix , TC-Star, проектами European Framework 7 EuroMatrixPlus , Let's MT, META-NET и MosesCore и проектом DARPA GALE, а также несколькими университетами, такими как Эдинбургский университет , Мэрилендский университет , ITC-irst, Массачусетский технологический институт и другими. Существенный дополнительный вклад в декодер Moses внесли Хьеу Хоанг, Крис Дайер, Джош Шредер, Марчелло Федерико, Ричард Зенс и Уэйд Шен.
Корпус Europarl представляет собой набор документов, который состоит из протоколов Европейского парламента с 1996 года по настоящее время. Корпус был составлен и расширен группой исследователей под руководством Филиппа Кёна из Эдинбургского университета . Данные, составляющие корпус, были извлечены с веб-сайта Европейского парламента, а затем подготовлены для лингвистического исследования. Последний выпуск (2012 г.) включал до 60 миллионов слов на язык, [6] с представленным 21 европейским языком: романские (французский, итальянский, испанский, португальский, румынский), германские (английский, голландский, немецкий, датский, шведский), славянские (болгарский, чешский, польский, словацкий, словенский), финно-угорские (финский, венгерский, эстонский), балтийские (латышский, литовский) и греческий.