Маркировка семантической роли

В обработке естественного языка маркировка семантических ролей (также называемая поверхностным семантическим анализом или заполнением слотов ) — это процесс, который присваивает метки словам или фразам в предложении, указывающие на их семантическую роль в предложении, например роль агента , цели или результата.

Он служит для поиска смысла предложения. Для этого он обнаруживает аргументы, связанные с предикатом или глаголом предложения , и то, как они классифицируются по своим конкретным ролям . Типичным примером является предложение «Мэри продала книгу Джону». Агент — «Мэри», предикат — «продано» (или, скорее, «продать»), тема — «книга», а получатель — «Джон». Другой пример — как «книга принадлежит мне» потребует двух меток, таких как «обладал» и «владелец», а «книга была продана Джону» потребует двух других меток, таких как тема и получатель, несмотря на то, что эти два предложения похожи на функции «субъект» и «объект». [1]

История

В 1968 году Чарльз Дж. Филлмор предложил первую идею для маркировки семантических ролей . [2] Его предложение привело к проекту FrameNet , который создал первый крупный вычислительный лексикон, который систематически описывал множество предикатов и соответствующих им ролей. Дэниел Джилдеа (в настоящее время в Университете Рочестера , ранее в Калифорнийском университете в Беркли / Международном институте компьютерных наук ) и Дэниел Джурафски (в настоящее время преподает в Стэнфордском университете , но ранее работал в Университете Колорадо и Калифорнийском университете в Беркли ) разработали первую автоматическую систему маркировки семантических ролей на основе FrameNet. Корпус PropBank добавил вручную созданные аннотации семантических ролей к корпусу Penn Treebank текстов Wall Street Journal . Многие автоматические системы маркировки семантических ролей использовали PropBank в качестве обучающего набора данных для обучения тому, как автоматически аннотировать новые предложения. [3]

Использует

Маркировка семантических ролей в основном используется машинами для понимания ролей слов в предложениях. [4] Это приносит пользу приложениям, подобным программам обработки естественного языка , которым необходимо понимать не только слова языков, но и то, как их можно использовать в различных предложениях. [5] Лучшее понимание маркировки семантических ролей может привести к прогрессу в вопросно-ответной обработке , извлечении информации , автоматическом реферировании текста , интеллектуальном анализе текстовых данных и распознавании речи . [6]

Смотрите также

Ссылки

  1. ^ Laux, Michael (2019-01-13). «Если вы еще не знали». Блог SunJackson (на упрощенном китайском) . Получено 2020-12-08 .
  2. ^ Боас, Ханс; Дюкс, Райан. «Из прошлого в настоящее: от фреймов кейсов к семантическим фреймам» (PDF).
  3. ^ Gildea, Daniel; Jurafsky, Daniel (2000). «Автоматическая маркировка семантических ролей». Труды 38-го ежегодного собрания Ассоциации компьютерной лингвистики — ACL '00 . Гонконг: Ассоциация компьютерной лингвистики: 512– 520. doi : 10.3115/1075218.1075283 .
  4. ^ Низамани, Сарват; Мемон, Насрулла; Низамани, Саад; Низамани, Сехриш (август 2017 г.). «TDC: модель фрагментации на основе типизированных зависимостей». Arabian Journal for Science and Engineering . 42 (8): 3585– 3595. doi :10.1007/s13369-017-2587-y. ISSN  2193-567X. S2CID  67233431.
  5. ^ Пак, Чжэхуэй (2019). «Избирательно связанные внутренние внимания для маркировки семантических ролей». Прикладные науки . 9 (8) – через ProQuest.
  6. ^ Джилдеа, Дэниел; Джурафски, Дэниел. «Автоматическая маркировка семантических ролей» (PDF) . Ассоциация компьютерной лингвистики . 28 (3).
  • CoNLL-2005 Совместное задание: Маркировка семантических ролей
  • Illinois Semantic Role Labeler — современная система маркировки семантических ролей. Демонстрация.
  • Предлог SRL: определяет семантические отношения, выраженные предлогами.
  • Салманасар — еще одна современная система назначения семантических предикатов и ролей.
Взято с "https://en.wikipedia.org/w/index.php?title=Семантическая_ролевая_маркировка&oldid=1136444266"