Арви Хурскайнен | |
---|---|
Рожденный | ( 1941-01-25 )25 января 1941 г. Китеэ , Финляндия |
Национальность | финский |
Известный | разработка SALAMA, вычислительной среды для языковых технологий |
Научная карьера | |
Поля | Лингвистика Языковые технологии , Машинный перевод |
Учреждения | Университет Хельсинки |
Руководители докторской диссертации | Юха Пентикайнен и Марья-Лииза Сванц |
Арви Йоханнес Хурскайнен (родился 25 января 1941 года в Китее ) — финский ученый в области языковых технологий и лингвистики. С 1985 года он разрабатывал основанную на правилах языковую технологию в основном для суахили , но также и для других языков, включая машинный перевод с английского на финский. Он создал среду разработки под названием SALAMA (аббревиатура от Swahili Language Manager), но она подходит для любого языка. Основные приложения, разработанные на сегодняшний день, включают в себя следующее: проверка орфографии для суахили, [1] аннотатор корпусных текстов, [2] расширенный словарь между суахили и английским [3] и переводчики [4] с суахили на английский, с английского на суахили и с английского на финский. Он также разработал расширенную систему обучения для суахили [5] и систему для создания целевых словарей для изучающих языки. [2] Хурскайнен составил два аннотированных корпуса: Хельсинкский корпус суахили 1.0 и Хельсинкский корпус суахили 2.0. [6]
Сначала он изучал теологию в Университете Хельсинки. Позже, после работы в Танзании, он изучал антропологию и опубликовал докторскую диссертацию «Скот и культура. Структура пасторального общества Паракуджо». [7] В 1976 году он работал исследователем в проекте Jipemoyo, спонсируемом Академией Финляндии в Танзании, а в 1977–1980 годах — в службе Финской лютеранской миссии в Хельсинки.
Хурскайнен работал в Хельсинкском университете , сначала в качестве лектора в 1981–1989 годах, а затем в качестве профессора в 1989–2006 годах. В промежутке, в 1984–1985 годах, он работал в Университете Тумаини в Танзании . До начала университетской карьеры он восемь лет работал в Танзании на различных преподавательских должностях. Он был директором Департамента азиатских и африканских исследований в 1999–2001 годах. Он вышел на пенсию в 2006 году.
В 1988–1992 годах он руководил полевым проектом «Язык и фольклор суахили», спонсируемым Министерством иностранных дел Финляндии и Университетом Дар-эс-Салама . В результате проекта был создан речевой корпус DAHE (Дар-эс-Салам - Хельсинки), который впоследствии был оцифрован.
Хурскайнен разработал языковую технологию , используя подробный языковой анализ. Базовое описание языка выполняется с использованием конечных преобразователей , впервые разработанных Киммо Коскенниеми . Затем отдельные слова устраняются с помощью технологии грамматики ограничений . Также на этом этапе выполняется синтаксическое отображение. Устранение неоднозначности и синтаксическое отображение выполняются с помощью грамматики ограничений 3.0, изначально разработанной Фредом Карлссоном и реализованной Паси Тапанайненом из Connexor. [8]
Подход, основанный на правилах, разработанный Хурскайненом, имеет сходство с другими системами, основанными на правилах, такими как Grammatical Framework [9] и Nooj. [10] Подходы, основанные на правилах, к языковым технологиям, особенно в применении к машинному переводу, считаются подходящими для языков с низкими ресурсами и богатой морфологией, таких как языки банту. [11]
(менеджер языка суахили) — это среда для приложений языковых технологий. Все приложения в Саламе используют языковую технологию на основе правил, запущенную в 1985 году.