ФреймНет | |
---|---|
Заявление о миссии | Создание лексической базы данных на основе теории значения, называемой семантикой фреймов . |
Коммерческий? | Нет (доступно для свободного скачивания) |
Тип проекта | Лексическая база данных (содержащая: фреймы, элементы фрейма (FE), лексические единицы (ЛЕ), примеры предложений и отношения фреймов) |
Расположение | Международный институт компьютерных наук в Беркли, Калифорния |
Владелец | Колин Бейкер (нынешний руководитель проекта) |
Основатель | Чарльз Дж. Филмор |
Учредил | 1997 ( 1997 ) |
Веб-сайт | framenet.icsi.berkeley.edu |
FrameNet — это группа онлайновых лексических баз данных, основанных на теории значений, известной как семантика фреймов , разработанной лингвистом Чарльзом Дж. Филлмором . Основная идея проекта проста: большинство значений слов можно лучше всего понять в терминах семантического фрейма, который является описанием определенного вида события, связи или элемента и его участников.
В качестве иллюстрации, для процесса приготовления пищи обычно требуется следующее: повар, готовящаяся еда, контейнер для хранения пищи во время приготовления и нагревательный прибор. [1] В FrameNet этот процесс представлен фреймом с именем Apply_heat , а его компоненты ( Cook , Food , Container и Heating_instrument ) называются элементами фрейма (FE). Фрейм Apply_heat также содержит ряд слов, которые его представляют, известных как лексические единицы (ЛЕ), например fry , bake , boil и broil .
Другие фреймы проще. Например, Placing имеет только агента или причину, тему — что-то, что размещается — и место, где это размещается. Некоторые фреймы более сложные, например Revenge , который содержит больше FE (преступник, травма, пострадавшая сторона, мститель и наказание). [ необходима цитата ] Как и в примерах Apply_heat и Revenge ниже, роль FrameNet заключается в определении фреймов и аннотировании предложений для демонстрации того, как FE синтаксически вписываются вокруг слова, вызывающего фрейм. [1]
Фрейм — это схематическое представление ситуации, включающей различных участников, реквизит и другие концептуальные роли. Примерами имен фреймов являются Being_born и Locative_relation . Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и отношения между фреймами.
Элементы фрейма (FE) предоставляют дополнительную информацию семантической структуре предложения. Каждый фрейм имеет ряд основных и дополнительных FE, которые можно рассматривать как семантические роли. Основные FE имеют важное значение для значения фрейма, в то время как дополнительные FE, как правило, являются описательными (например, время, место, манера и т. д.) [2] Например:
FrameNet включает поверхностные данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для предложения типа «Она родилась около 460 г. н. э.» FrameNet отметит She как именное словосочетание, ссылающееся на элемент фрейма Child , а «около 460 г. н. э.» как именное словосочетание, соответствующее элементу фрейма Time . Подробности того, как элементы фрейма могут быть реализованы в предложении, важны, поскольку они раскрывают важную информацию о фреймах подкатегоризации , а также о возможных диатезных чередованиях (например, «Джон разбил окно» против «Окно разбилось») глагола.
Лексические единицы (ЛЕ) — это леммы с их частью речи, которые вызывают определенный фрейм. Другими словами, когда ЛЕ идентифицируется в предложении, этот определенный ЛЕ может быть связан с его определенным фреймом(ами). Для каждого фрейма может быть много ЛЕ, связанных с этим фреймом, а также может быть много фреймов, которые разделяют определенный ЛЕ; это обычно происходит с ЛЕ, имеющими несколько значений слов. [2] Наряду с фреймом каждая лексическая единица связана с определенными элементами фрейма с помощью аннотированных примеров предложений.
Например, лексические единицы, которые вызывают фрейм «жалоба» (или, точнее, его более конкретные перспективизированные версии), включают глаголы жаловаться , ворчать , сетовать и другие. [5]
Рамки связаны с примерами предложений, а элементы рамок отмечены внутри предложений. Таким образом, предложение
ассоциируется с фреймом Being_born , в то время как She отмечена как элемент фрейма Child , а «около 460 г. н.э.» отмечено как Time . [3]
С самого начала проект FrameNet был нацелен на изучение доказательств фактического использования языка, обнаруженных в текстовых коллекциях, таких как Британский национальный корпус . На основе таких примеров предложений автоматические инструменты маркировки семантических ролей способны определять фреймы и отмечать элементы фреймов в новых предложениях.
FrameNet также предоставляет статистику по валентности каждого фрейма, то есть количество и положение элементов фрейма в примерах предложений. Предложение
падает в валентной модели
который встречается дважды в отчете аннотации FrameNet для лексической единицы born.v , [3] , а именно:
FrameNet дополнительно фиксирует отношения между различными фреймами с помощью отношений. Они включают в себя следующее:
FrameNet доказал свою полезность в ряде вычислительных приложений, поскольку компьютерам требуются дополнительные знания для того, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают по сути одну и ту же ситуацию, несмотря на использование двух совершенно разных глаголов, разных предлогов и разного порядка слов. FrameNet использовался в таких приложениях, как ответ на вопрос , перефразирование , распознавание текстового вывода и извлечение информации , как напрямую, так и с помощью инструментов маркировки семантических ролей . Первая автоматическая система маркировки семантических ролей (SRL, иногда также называемая «поверхностным семантическим анализом») была разработана Дэниелом Джилдеа и Дэниелом Джурафски на основе FrameNet в 2002 году. [6] С тех пор маркировка семантических ролей стала одной из стандартных задач в обработке естественного языка, а последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit . [7]
Поскольку фреймы по сути являются семантическими описаниями, они схожи на разных языках, и за прошедшие годы появилось несколько проектов, которые опирались на исходную FrameNet как на основу для дополнительных FrameNet не на английском языке, среди прочего, для испанского, японского, немецкого и польского языков.