ФреймНет

ФреймНет
Заявление о миссииСоздание лексической базы данных на основе теории значения, называемой семантикой фреймов .
Коммерческий?Нет (доступно для свободного скачивания)
Тип проектаЛексическая база данных (содержащая: фреймы, элементы фрейма (FE), лексические единицы (ЛЕ), примеры предложений и отношения фреймов)
РасположениеМеждународный институт компьютерных наук в Беркли, Калифорния
ВладелецКолин Бейкер (нынешний руководитель проекта)
ОсновательЧарльз Дж. Филмор
Учредил1997 ; 28 лет назад ( 1997 )
Веб-сайтframenet.icsi.berkeley.edu

FrameNet — это группа онлайновых лексических баз данных, основанных на теории значений, известной как семантика фреймов , разработанной лингвистом Чарльзом Дж. Филлмором . Основная идея проекта проста: большинство значений слов можно лучше всего понять в терминах семантического фрейма, который является описанием определенного вида события, связи или элемента и его участников.

В качестве иллюстрации, для процесса приготовления пищи обычно требуется следующее: повар, готовящаяся еда, контейнер для хранения пищи во время приготовления и нагревательный прибор. [1] В FrameNet этот процесс представлен фреймом с именем Apply_heat , а его компоненты ( Cook , Food , Container и Heating_instrument ) называются элементами фрейма (FE). Фрейм Apply_heat также содержит ряд слов, которые его представляют, известных как лексические единицы (ЛЕ), например fry , bake , boil и broil .

Другие фреймы проще. Например, Placing имеет только агента или причину, тему — что-то, что размещается — и место, где это размещается. Некоторые фреймы более сложные, например Revenge , который содержит больше FE (преступник, травма, пострадавшая сторона, мститель и наказание). [ необходима цитата ] Как и в примерах Apply_heat и Revenge ниже, роль FrameNet заключается в определении фреймов и аннотировании предложений для демонстрации того, как FE синтаксически вписываются вокруг слова, вызывающего фрейм. [1]

Концепции

Рамки

Фрейм — это схематическое представление ситуации, включающей различных участников, реквизит и другие концептуальные роли. Примерами имен фреймов являются Being_born и Locative_relation . Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и отношения между фреймами.

Элементы каркаса

Элементы фрейма (FE) предоставляют дополнительную информацию семантической структуре предложения. Каждый фрейм имеет ряд основных и дополнительных FE, которые можно рассматривать как семантические роли. Основные FE имеют важное значение для значения фрейма, в то время как дополнительные FE, как правило, являются описательными (например, время, место, манера и т. д.) [2] Например:

  • Единственная основная FE фрейма Being_born называется Child ; неосновные FE — Time , Place , Means и т. д. [3]
  • Основные элементы FE фрейма Commerce_goods-transfer включают Продавца , Покупателя и Товары , в то время как неосновные элементы FE включают Место , Цель и т. д. [4]

FrameNet включает поверхностные данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для предложения типа «Она родилась около 460 г. н. э.» FrameNet отметит She как именное словосочетание, ссылающееся на элемент фрейма Child , а «около 460 г. н. э.» как именное словосочетание, соответствующее элементу фрейма Time . Подробности того, как элементы фрейма могут быть реализованы в предложении, важны, поскольку они раскрывают важную информацию о фреймах подкатегоризации , а также о возможных диатезных чередованиях (например, «Джон разбил окно» против «Окно разбилось») глагола.

Лексические единицы

Лексические единицы (ЛЕ) — это леммы с их частью речи, которые вызывают определенный фрейм. Другими словами, когда ЛЕ идентифицируется в предложении, этот определенный ЛЕ может быть связан с его определенным фреймом(ами). Для каждого фрейма может быть много ЛЕ, связанных с этим фреймом, а также может быть много фреймов, которые разделяют определенный ЛЕ; это обычно происходит с ЛЕ, имеющими несколько значений слов. [2] Наряду с фреймом каждая лексическая единица связана с определенными элементами фрейма с помощью аннотированных примеров предложений.

Например, лексические единицы, которые вызывают фрейм «жалоба» (или, точнее, его более конкретные перспективизированные версии), включают глаголы жаловаться , ворчать , сетовать и другие. [5]

Примеры предложений

Рамки связаны с примерами предложений, а элементы рамок отмечены внутри предложений. Таким образом, предложение

Она родилась около 460 года нашей эры.

ассоциируется с фреймом Being_born , в то время как She отмечена как элемент фрейма Child , а «около 460 г. н.э.» отмечено как Time . [3]

С самого начала проект FrameNet был нацелен на изучение доказательств фактического использования языка, обнаруженных в текстовых коллекциях, таких как Британский национальный корпус . На основе таких примеров предложений автоматические инструменты маркировки семантических ролей способны определять фреймы и отмечать элементы фреймов в новых предложениях.

Валентности

FrameNet также предоставляет статистику по валентности каждого фрейма, то есть количество и положение элементов фрейма в примерах предложений. Предложение

Она родилась около 460 года нашей эры.

падает в валентной модели

NP Ext, INI --, NP Dep

который встречается дважды в отчете аннотации FrameNet для лексической единицы born.v , [3] , а именно:

Она родилась около 460 года н. э. , была дочерью и внучкой римских и византийских императоров, чья семья играла видную роль в римской политике на протяжении более 700 лет.
Вскоре его направили в Северную Африку, где он так и не увидел своего единственного ребенка — дочь , родившуюся 8 июня 1941 года .

Отношения фрейма

FrameNet дополнительно фиксирует отношения между различными фреймами с помощью отношений. Они включают в себя следующее:

  • Наследование : Когда один фрейм является более конкретной версией другого, более абстрактного, родительского фрейма. Все, что верно для родительского фрейма, должно быть верно и для дочернего фрейма, и между элементами фрейма родителя и элементами фрейма дочернего указывается соответствие.
  • Перспективизация : Нейтральный фрейм связан с фреймом с определенной перспективой того же сценария. Например, Commerce_transfer-goods рассматривается с точки зрения покупателя в Commerce_buy и с точки зрения продавца в Commerce_sell .
  • Подфрейм : Некоторые фреймы относятся к сложным сценариям, состоящим из нескольких отдельных состояний или событий, которые могут быть описаны отдельными фреймами. Например, Criminal_process состоит из Arrest , Trial и т. д.
  • Приоритет: Это отношение фиксирует временной порядок, который сохраняется между подкадрами сложного кадра. Например, в кадре Cycle_of_life_and_death подкадр Death предшествует подкадр Being_born .
  • Каузативный и инхоатив : Эти два отношения обозначают, для фреймов каузативного и инхоативного аспектов, отдельный фрейм статива, к которому они относятся. Например, стативный Position_on_a_scale (например, "У нее была высокая зарплата") описывается каузативным Cause_change_of_scalar_position (например, "Она повысила его зарплату") и инхоативным Change_position_on_a_scale фреймом (например, "Ее зарплата увеличилась ").
  • Использование : Это отношение отмечает фрейм, который каким-то образом включает другой фрейм. Например, Judgment_communication использует как Judgment , так и Statement , но не наследует ни от одного из них, поскольку нет четкого соответствия элементов фрейма.
  • См. также : Объединяет кадры, которые имеют некоторое сходство, но требуют тщательного различения.

Приложения

FrameNet доказал свою полезность в ряде вычислительных приложений, поскольку компьютерам требуются дополнительные знания для того, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают по сути одну и ту же ситуацию, несмотря на использование двух совершенно разных глаголов, разных предлогов и разного порядка слов. FrameNet использовался в таких приложениях, как ответ на вопрос , перефразирование , распознавание текстового вывода и извлечение информации , как напрямую, так и с помощью инструментов маркировки семантических ролей . Первая автоматическая система маркировки семантических ролей (SRL, иногда также называемая «поверхностным семантическим анализом») была разработана Дэниелом Джилдеа и Дэниелом Джурафски на основе FrameNet в 2002 году. [6] С тех пор маркировка семантических ролей стала одной из стандартных задач в обработке естественного языка, а последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit . [7]

Поскольку фреймы по сути являются семантическими описаниями, они схожи на разных языках, и за прошедшие годы появилось несколько проектов, которые опирались на исходную FrameNet как на основу для дополнительных FrameNet не на английском языке, среди прочего, для испанского, японского, немецкого и польского языков.

Смотрите также

Ссылки

  1. ^ ab "Что такое FrameNet?". FrameNet . Архивировано из оригинала 2023-08-03 . Получено 2023-09-09 .
  2. ^ ab "Glossary". FrameNet . Архивировано из оригинала 2023-08-03 . Получено 2023-09-09 .
  3. ^ abc "Being_born.born.v (Аннотация)". FrameNet . Архивировано из оригинала 2023-09-09 . Получено 2023-09-09 .
  4. ^ "Commerce_goods-transfer". FrameNet . Архивировано из оригинала 2023-09-09 . Получено 2023-09-09 .
  5. ^ "Жалоба". FrameNet . Архивировано из оригинала 2023-09-09 . Получено 2023-09-09 .
  6. ^ Джилдеа, Дэниел; Джурафски, Дэниел (2002). «Автоматическая маркировка семантических ролей» (PDF) . Компьютерная лингвистика . 28 (3): 245–288 . doi : 10.1162/089120102760275983 . S2CID  207747200.
  7. ^ Шнайдер, Натан; Вутерс, Чак (2017). «API FrameNet NLTK: проектирование для обеспечения доступности с богатым лингвистическим ресурсом». EMNLP 2017: Конференция по эмпирическим методам в обработке естественного языка . arXiv : 1703.07438 . Bibcode : 2017arXiv170307438S.

Дальнейшее чтение

  • Ruppenhofer, Josef; Ellsworth, Michael; Petruck, Miriam RL; Johnson, Christopher R.; Baker, Collin F.; Scheffczyk, Jan (1 ноября 2016 г.). FrameNet II: Extended Theory and Practice (PDF) (пересмотренное издание). Berkeley, CA: International Computer Science Institute. Архивировано из оригинала (PDF) 2022-10-26.
  • Домашняя страница FrameNet
  • Китайский FrameNet
  • Датский FrameNet
  • Немецкий FrameNet
  • Японский FrameNet
  • Корейский FrameNet
  • Польский FrameNet
  • Португальский FrameNet (Бразилия)
  • Испанский FrameNet
  • Шведский FrameNet
Retrieved from "https://en.wikipedia.org/w/index.php?title=FrameNet&oldid=1269250351"