В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Текучая грамматика конструкций ( FCG ) — это формализм вычислительной грамматики конструкций с открытым исходным кодом , который позволяет компьютерным лингвистам формально записывать инвентарь лексических и грамматических конструкций, а также проводить эксперименты по изучению и эволюции языка. [1] FCG — это открытый инструмент, который могут использовать специалисты по грамматике конструкций, желающие точно сформулировать свои интуиции и данные и желающие проверить последствия своих грамматических конструкций для синтаксического анализа, производства и изучения языка. Формализм можно протестировать через интерактивный веб-интерфейс на веб-сайте FCG.
FCG объединяет многие понятия из современной компьютерной лингвистики, такие как структура признаков и обработка языка на основе унификации, но использует их новым способом для операционализации идей из теории грамматики конструкций. Конструкции считаются двунаправленными и, следовательно, пригодными как для синтаксического анализа, так и для производства. Обработка является гибкой в том смысле, что FCG обеспечивает обработку мета-слоя для работы с новыми, частично неграмматическими или неполными предложениями. FCG называется «текучей», потому что она признает предпосылку, что пользователи языка постоянно изменяют и обновляют свои грамматики. Исследования FCG в основном проводятся Люком Стилсом и его командами в лаборатории искусственного интеллекта VUB в Брюсселе и лаборатории эволюции языка в Барселоне, а также в лабораториях Sony Computer Science в Париже. Помимо Стилса, в число нынешних и бывших участников формализма FCG входят Катриен Бьюлс, Пол Ван Эке, Реми ван Трийп, Йорис Блейс, Иоахим Де Бёль, Мартин Лётч, Николас Нойбауэр, Михаэль Спрангер, Воутер Ван ден Брук, Питер Велленс и другие.
FCG рассматривает синтаксический анализ и производство как задачу поиска, в которой движок FCG ищет лучшее высказывание для вербализации значения (производство языка) или лучшую семантическую сеть (или представление значения) для анализа высказывания (анализ). Каждое представление состояния в процессе поиска называется переходной структурой. Переходную структуру можно рассматривать как расширенную структуру признаков, поскольку она состоит из (плоского) списка «единиц», которые состоят из имени единицы (уникального постоянного символа) и тела единицы (набора пар признак-значение). Более старые версии FCG (до 2011 года) использовали для разделения переходной структуры на два отдельных полюса для семантики и синтаксиса, но текущая версия реализует единое представление для всей лингвистической информации.
Конструкции FCG (или, технически говоря, схемы конструкций) рассматриваются как операторы процесса поиска. То есть, применяя конструкцию к переходной структуре, можно создать новую переходную структуру (или представление состояния) в пространстве поиска. Как и переходные структуры, конструкции в основном состоят из единиц пар признак-значение. Однако конструкции более структурированы, поскольку содержат две отдельные части:
Чтобы решить, может ли конструкция применяться, условная часть «сопоставляется» с текущей переходной структурой с использованием алгоритма на основе унификации. В производстве только признаки, которые являются частью блокировок формулировки конструкции, должны быть сопоставлены с переходной структурой; тогда как при синтаксическом анализе будут рассмотрены только признаки, которые являются частью блокировок понимания. Если сопоставление успешно, движок FCG «объединит» все единицы пар признак-значение с переходной структурой в аналогичном процессе на основе унификации.
FCG включает мета-слои диагностик, исправлений и стратегий консолидации, которые позволяют разработчику грамматики внедрять способы обработки новшеств, ошибок и неожиданных входных данных во время обработки. Эти диагностики и исправления также могут использоваться для исследования (автоматизированного) получения новых конструкций.