Комбинаторная категориальная грамматика

Абстрактный грамматический формализм

Комбинаторная категориальная грамматика ( CCG ) — это эффективно анализируемый , но лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, квантификацию и информационную структуру. Формализм генерирует структуры, основанные на членстве (в отличие от структур, основанных на зависимости), и, следовательно, является типом грамматики фразовой структуры (в отличие от грамматики зависимости ).

CCG опирается на комбинаторную логику , которая имеет ту же выразительную силу, что и лямбда-исчисление , но строит свои выражения по-другому. Первые лингвистические и психолингвистические аргументы в пользу того, чтобы базировать грамматику на комбинаторах, были выдвинуты Стидманом и Сабольчи .

Более поздними видными сторонниками подхода являются Полин Якобсон и Джейсон Болдридж. В этих новых подходах комбинатор B (композитор) полезен для создания дальних зависимостей, как в «Кто, по-вашему, говорит Мэри?», а комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, как в «Мэри говорит о себе». Вместе с I (отображение идентичности) и C (пермутатор) они образуют набор примитивных, невзаимоопределяемых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, а их связывание поддерживается сложным комбинатором Z, как в «Мэри потеряла свой путь». Z определяется с помощью W и B.

Части формализма

Формализм CCG определяет ряд комбинаторов (наиболее распространенными являются применение, композиция и повышение типа). Они работают с синтаксически типизированными лексическими элементами с помощью доказательств в стиле естественной дедукции . Цель доказательства — найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Результирующий тип после завершения доказательства — это тип всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S .

Синтаксические типы

Синтаксический тип лексического элемента может быть либо примитивным, например S , N или NP , либо сложным, например S\NP или NP/N .

Сложные типы, схематизируемые как X/Y и X\Y , обозначают типы функторов, которые принимают аргумент типа Y и возвращают объект типа X . Прямая косая черта обозначает, что аргумент должен отображаться справа, а обратная косая черта обозначает, что аргумент должен отображаться слева. Здесь вместо X и Y может использоваться любой тип , что делает синтаксические типы в CCG рекурсивной системой типов.

Комбинаторы приложений

Комбинаторы приложений, часто обозначаемые как > для прямого применения и < для обратного применения, применяют лексический элемент с типом функтора к аргументу с соответствующим типом. Определение приложения дается как:

{\dfrac {\alpha :X/Y\qquad \beta :Y}{\alpha \beta :X}}>

{\dfrac {\beta :Y\qquad \alpha :X\обратная косая черта Y}{\beta \alpha :X}}<

Комбинаторы композиции

Комбинаторы композиции, часто обозначаемые как прямая композиция и обратная композиция, аналогичны функциональной композиции из математики и могут быть определены следующим образом: $B_{>}$ $B_{<}$

{\dfrac {\alpha:X/Y\qquad \beta:Y/Z}{\alpha \beta:X/Z}}B_{>}

{\dfrac {\beta :Y\обратная косая черта Z\qquad \alpha :X\обратная косая черта Y}{\beta \alpha :X\обратная косая черта Z}}B_{<}

Комбинаторы для увеличения типа

Комбинаторы повышения типа, часто обозначаемые как для прямого повышения типа и для обратного повышения типа, преобразуют типы аргументов (обычно примитивные типы) в типы функторов, которые принимают в качестве своих аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов. $T_{>}$ $T_{<}$

{\dfrac {\alpha :X}{\alpha :T/(T\backslash X)}}T_{>}

{\dfrac {\alpha :X}{\alpha :T\backslash (T/X)}}T_{<}

Пример

Предложение "собака укусила Джона" имеет ряд различных возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.

Пусть типы этих лексических единиц будут

{\text{the}}:NP/N\qquad {\text{dog}}:N\qquad {\text{John}}:NP\qquad {\text{bit}}:(S\backslash NP)/NP

Простейшее доказательство (слегка изменив обозначения для краткости) можно выполнить следующим образом:

{\dfrac {{\dfrac {{\dfrac {\text{the}}{NP/N}}\qquad {\dfrac {\text{dog}}{N}}}{NP}}>\qquad {\dfrac {{\dfrac {\text{bit}}{(S\backslash NP)/NP}}\qquad {\dfrac {\text{John}}{NP}}}{S\backslash NP}}>}{S}}<

Выбрав type-raise и composs некоторые, мы могли бы получить полностью инкрементальное доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, поскольку слушатели фактически создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они были завершены.

{\dfrac {{\dfrac {{\dfrac {{\dfrac {{\dfrac {\text{the}}{NP/N}}{\dfrac {\text{dog}}{N}}\qquad }{NP}}>}{S/(S\backslash NP)}}T_{>}\qquad {\dfrac {\text{bit}}{(S\backslash NP)/NP}}}{S/NP}}B_{>}\qquad {\dfrac {\text{John}}{NP}}}{S}}>

Формальные свойства

Известно, что CCG способны генерировать язык (который является неконтекстно-свободным индексированным языком ). Грамматику этого языка можно найти в Vijay-Shanker и Weir (1994). ^[1] ${a^{n}b^{n}c^{n}d^{n}:n\geq 0}$

Виджай-Шанкер и Вейр (1994) ^[1] демонстрируют, что линейные индексированные грамматики , комбинаторные категориальные грамматики, древовидные примыкающие грамматики и грамматики голов являются слабо эквивалентными формализмами, поскольку все они определяют одни и те же строковые языки. Кульман и др. (2015) ^[2] показывают, что эта эквивалентность и способность CCG описывать в решающей степени зависят от возможности ограничивать использование комбинаторных правил определенными категориями способами, не объясненными выше. ${a^{n}b^{n}c^{n}d^{n}}$

Смотрите также

Ссылки

^ ab Виджай-Шанкер, К. и Вейр, Дэвид Дж. 1994. Эквивалентность четырех расширений контекстно-свободных грамматик Архивировано 17 декабря 2018 г. в Wayback Machine . Математическая теория систем 27(6): 511–546.
^ Кульманн, М., Коллер, А. и Сатта, Г. 2015. Лексикализация и генеративная сила в CCG Архивировано 20 декабря 2019 г. в Wayback Machine . Компьютерная лингвистика 41(2): 215-247.

Болдридж, Джейсон (2002), «Лексически заданный деривационный контроль в комбинаторной категориальной грамматике». Кандидатская диссертация. Эдинбургский университет.
Карри, Хаскелл Б. и Ричард Фейс (1958), Комбинаторная логика, т. 1. Северная Голландия.
Якобсон, Полин (1999), «На пути к семантике, свободной от переменных». Лингвистика и философия 22, 1999. 117–184
Стидман, Марк (1987), «Комбинаторные грамматики и паразитические пробелы». Natural Language and Linguistic Theory 5, 403–439.
Стидман, Марк (1996), Структура поверхности и интерпретация. MIT Press.
Стидман, Марк (2000), Синтаксический процесс. MIT Press.
Сабольчи, Анна (1989), «Связанные переменные в синтаксисе (есть ли таковые?)». Семантика и контекстное выражение, под ред. Барча, ван Бентема и ван Эмде Боаса. Форис, 294–318.
Сабольчи, Анна (1992), «Комбинаторная грамматика и проекция из лексикона». Lexical Matters. CSLI Lecture Notes 24, под ред. Сага и Сабольчи. Стэнфорд, CSLI Publications. 241–269.
Сабольчи, Анна (2003), «Связывание на лету: кросс-предложенная анафора в семантике без переменных». Чувствительность к ресурсам в связывании и анафоре, под ред. Крюйффа и Оэрле. Клювер, 215–229.

Дальнейшее чтение

Майкл Муртгат, Логика категориальных типов , Глава вторая в книге J. van Benthem и A. ter Meulen (ред.) Handbook of Logic and Language . Elsevier, 1997, ISBN 0-262-22053-9
homepages.inf.ed.ac.uk

Внешние ссылки

Сайт комбинаторной категориальной грамматики
Вики-страница ACL CCG (вероятно, более актуальная, чем эта)
Семантический анализ с комбинаторными категориальными грамматиками – Учебное пособие, описывающее общие принципы построения семантических анализаторов.

[vijayshankarAndWeir1995-1] Виджай-Шанкер, К. и Вейр, Дэвид Дж. 1994. Эквивалентность четырех расширений контекстно-свободных грамматик Архивировано 17 декабря 2018 г. в Wayback Machine . Математическая теория систем 27(6): 511–546.

[KuhlmannKollerSatta2015-2] Кульманн, М., Коллер, А. и Сатта, Г. 2015. Лексикализация и генеративная сила в CCG Архивировано 20 декабря 2019 г. в Wayback Machine . Компьютерная лингвистика 41(2): 215-247.