Эта статья может быть слишком технической для понимания большинства читателей . ( Ноябрь 2018 ) |
Комбинаторная категориальная грамматика ( CCG ) — это эффективно анализируемый , но лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, квантификацию и информационную структуру. Формализм генерирует структуры, основанные на членстве (в отличие от структур, основанных на зависимости), и, следовательно, является типом грамматики фразовой структуры (в отличие от грамматики зависимости ).
CCG опирается на комбинаторную логику , которая имеет ту же выразительную силу, что и лямбда-исчисление , но строит свои выражения по-другому. Первые лингвистические и психолингвистические аргументы в пользу того, чтобы базировать грамматику на комбинаторах, были выдвинуты Стидманом и Сабольчи .
Более поздними видными сторонниками подхода являются Полин Якобсон и Джейсон Болдридж. В этих новых подходах комбинатор B (композитор) полезен для создания дальних зависимостей, как в «Кто, по-вашему, говорит Мэри?», а комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, как в «Мэри говорит о себе». Вместе с I (отображение идентичности) и C (пермутатор) они образуют набор примитивных, невзаимоопределяемых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, а их связывание поддерживается сложным комбинатором Z, как в «Мэри потеряла свой путь». Z определяется с помощью W и B.
Формализм CCG определяет ряд комбинаторов (наиболее распространенными являются применение, композиция и повышение типа). Они работают с синтаксически типизированными лексическими элементами с помощью доказательств в стиле естественной дедукции . Цель доказательства — найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Результирующий тип после завершения доказательства — это тип всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S .
Синтаксический тип лексического элемента может быть либо примитивным, например S , N или NP , либо сложным, например S\NP или NP/N .
Сложные типы, схематизируемые как X/Y и X\Y , обозначают типы функторов, которые принимают аргумент типа Y и возвращают объект типа X . Прямая косая черта обозначает, что аргумент должен отображаться справа, а обратная косая черта обозначает, что аргумент должен отображаться слева. Здесь вместо X и Y может использоваться любой тип , что делает синтаксические типы в CCG рекурсивной системой типов.
Комбинаторы приложений, часто обозначаемые как > для прямого применения и < для обратного применения, применяют лексический элемент с типом функтора к аргументу с соответствующим типом. Определение приложения дается как:
Комбинаторы композиции, часто обозначаемые как прямая композиция и обратная композиция, аналогичны функциональной композиции из математики и могут быть определены следующим образом:
Комбинаторы повышения типа, часто обозначаемые как для прямого повышения типа и для обратного повышения типа, преобразуют типы аргументов (обычно примитивные типы) в типы функторов, которые принимают в качестве своих аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов.
Предложение "собака укусила Джона" имеет ряд различных возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.
Пусть типы этих лексических единиц будут
Простейшее доказательство (слегка изменив обозначения для краткости) можно выполнить следующим образом:
Выбрав type-raise и composs некоторые, мы могли бы получить полностью инкрементальное доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, поскольку слушатели фактически создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они были завершены.
This section needs expansion. You can help by adding to it. (June 2008) |
Известно, что CCG способны генерировать язык (который является неконтекстно-свободным индексированным языком ). Грамматику этого языка можно найти в Vijay-Shanker и Weir (1994). [1]
Виджай-Шанкер и Вейр (1994) [1] демонстрируют, что линейные индексированные грамматики , комбинаторные категориальные грамматики, древовидные примыкающие грамматики и грамматики голов являются слабо эквивалентными формализмами, поскольку все они определяют одни и те же строковые языки. Кульман и др. (2015) [2] показывают, что эта эквивалентность и способность CCG описывать в решающей степени зависят от возможности ограничивать использование комбинаторных правил определенными категориями способами, не объясненными выше.