Грамматика текучей конструкции

Текучая грамматика конструкций ( FCG ) — это формализм вычислительной грамматики конструкций с открытым исходным кодом , который позволяет компьютерным лингвистам формально записывать инвентарь лексических и грамматических конструкций, а также проводить эксперименты по изучению и эволюции языка. [1] FCG — это открытый инструмент, который могут использовать специалисты по грамматике конструкций, желающие точно сформулировать свои интуиции и данные и желающие проверить последствия своих грамматических конструкций для синтаксического анализа, производства и изучения языка. Формализм можно протестировать через интерактивный веб-интерфейс на веб-сайте FCG.

FCG объединяет многие понятия из современной компьютерной лингвистики, такие как структура признаков и обработка языка на основе унификации, но использует их новым способом для операционализации идей из теории грамматики конструкций. Конструкции считаются двунаправленными и, следовательно, пригодными как для синтаксического анализа, так и для производства. Обработка является гибкой в ​​том смысле, что FCG обеспечивает обработку мета-слоя для работы с новыми, частично неграмматическими или неполными предложениями. FCG называется «текучей», потому что она признает предпосылку, что пользователи языка постоянно изменяют и обновляют свои грамматики. Исследования FCG в основном проводятся Люком Стилсом и его командами в лаборатории искусственного интеллекта VUB в Брюсселе и лаборатории эволюции языка в Барселоне, а также в лабораториях Sony Computer Science в Париже. Помимо Стилса, в число нынешних и бывших участников формализма FCG входят Катриен Бьюлс, Пол Ван Эке, Реми ван Трийп, Йорис Блейс, Иоахим Де Бёль, Мартин Лётч, Николас Нойбауэр, Михаэль Спрангер, Воутер Ван ден Брук, Питер Велленс и другие.

Переходная структура

FCG рассматривает синтаксический анализ и производство как задачу поиска, в которой движок FCG ищет лучшее высказывание для вербализации значения (производство языка) или лучшую семантическую сеть (или представление значения) для анализа высказывания (анализ). Каждое представление состояния в процессе поиска называется переходной структурой. Переходную структуру можно рассматривать как расширенную структуру признаков, поскольку она состоит из (плоского) списка «единиц», которые состоят из имени единицы (уникального постоянного символа) и тела единицы (набора пар признак-значение). Более старые версии FCG (до 2011 года) использовали для разделения переходной структуры на два отдельных полюса для семантики и синтаксиса, но текущая версия реализует единое представление для всей лингвистической информации.

Конструкции

Конструкции FCG (или, технически говоря, схемы конструкций) рассматриваются как операторы процесса поиска. То есть, применяя конструкцию к переходной структуре, можно создать новую переходную структуру (или представление состояния) в пространстве поиска. Как и переходные структуры, конструкции в основном состоят из единиц пар признак-значение. Однако конструкции более структурированы, поскольку содержат две отдельные части:

  • Условная часть: Эта часть конструкции определяет условия, при которых конструкция может применяться. Более того, единицы признаков, которые появляются в условной части, разделены на «блокировку понимания» и «блокировку формулировки». Это разделение важно для обеспечения двунаправленного применения конструкции FCG (см. ниже).
  • Вспомогательная часть: эта часть конструкции определяет информацию, которую конструкция может добавить к переходной конструкции, если выполнены условия применения.

Лингвистическая обработка

Чтобы решить, может ли конструкция применяться, условная часть «сопоставляется» с текущей переходной структурой с использованием алгоритма на основе унификации. В производстве только признаки, которые являются частью блокировок формулировки конструкции, должны быть сопоставлены с переходной структурой; тогда как при синтаксическом анализе будут рассмотрены только признаки, которые являются частью блокировок понимания. Если сопоставление успешно, движок FCG «объединит» все единицы пар признак-значение с переходной структурой в аналогичном процессе на основе унификации.

Гибкость

FCG включает мета-слои диагностик, исправлений и стратегий консолидации, которые позволяют разработчику грамматики внедрять способы обработки новшеств, ошибок и неожиданных входных данных во время обработки. Эти диагностики и исправления также могут использоваться для исследования (автоматизированного) получения новых конструкций.

Ссылки

  1. ^ Steels, Luc, ред. (2011). Шаблоны проектирования в грамматике текучего строительства . Амстердам: Джон Бенджаминс.
  • Люк Стилс (ред.) (2011). Шаблоны проектирования в грамматике текучего строительства. Джон Бенджаминс, Амстердам.
  • Люк Стилс (ред.) (в печати). Computational Issues in Fluid Construction Grammar . Springer, Нью-Йорк.
  • Реми ван Трайп, Люк Стилс , Катрин Беулс и Питер Велленс. Текучая грамматика конструкций: новый игрок в этом блоке. Труды 13-й конференции Европейского отделения Ассоциации компьютерной лингвистики, Авиньон, 2012. ACL.
  • Люк Стилс и Иоахим Де Бёль (2006) (Очень) краткое введение в грамматику гибких конструкций Третий международный семинар по масштабируемому пониманию естественного языка (ScaNaLU 2006) 8 июня 2006 г., после HLT/NAACL, Нью-Йорк
  • http://www.fcg-net.org/ (сайт сообщества FCG, с онлайн-демонстрациями и главами последней книги FCG)
  • http://www.emergent-languages.org/ (сайт, посвященный грамматическим экспериментам с использованием FCG).
Взято с "https://en.wikipedia.org/w/index.php?title=Грамматика_жидкостного_строительства&oldid=1261298565"