Эту статью необходимо обновить . Пожалуйста ( Март 2024 ) |
Вопросы и ответы ( QA ) — это дисциплина компьютерной науки в области поиска информации и обработки естественного языка (NLP), которая занимается созданием систем, которые автоматически отвечают на вопросы , задаваемые людьми на естественном языке . [1]
Реализация вопросов и ответов, обычно компьютерная программа, может строить свои ответы, запрашивая структурированную базу данных знаний или информации, обычно базу знаний . Чаще всего системы вопросов и ответов могут извлекать ответы из неструктурированной коллекции документов на естественном языке.
Вот некоторые примеры коллекций документов на естественном языке, используемых для систем вопросов и ответов:
Исследования с использованием метода ответов на вопросы направлены на разработку способов ответа на широкий спектр типов вопросов, включая вопросы о фактах, списках, определениях , как, почему, гипотетические, семантически ограниченные и кросс-языковые вопросы.
Другой способ категоризации вопросно-ответных систем — по используемому техническому подходу. Существует ряд различных типов систем QA, включая
Системы, основанные на правилах, используют набор правил для определения правильного ответа на вопрос. Статистические системы используют статистические методы для поиска наиболее вероятного ответа на вопрос. Гибридные системы используют комбинацию методов, основанных на правилах, и статистических методов.
Две ранние системы вопросов и ответов были BASEBALL [4] и LUNAR. [5] BASEBALL отвечала на вопросы о Главной лиге бейсбола в течение одного года [ неоднозначно ] . LUNAR отвечала на вопросы о геологическом анализе горных пород, возвращенных миссиями Apollo Moon. Обе системы вопросов и ответов были очень эффективны в своих выбранных областях. LUNAR была продемонстрирована на конференции по лунной науке в 1971 году и смогла ответить на 90% вопросов в своей области, которые были заданы людьми, не обученными работе с системой. В последующие годы были разработаны дополнительные системы вопросов и ответов с ограниченной областью. Общей чертой всех этих систем является то, что у них была основная база данных или система знаний, которая была написана вручную экспертами в выбранной области. Языковые способности BASEBALL и LUNAR использовали методы, похожие на ELIZA и DOCTOR , первые программы -чатботы .
SHRDLU была успешной вопросно-ответной программой, разработанной Терри Виноградом в конце 1960-х и начале 1970-х годов. Она имитировала работу робота в игрушечном мире («мире кубиков») и предлагала возможность задавать роботу вопросы о состоянии мира. Сила этой системы заключалась в выборе очень специфической области и очень простого мира с правилами физики, которые было легко закодировать в компьютерной программе.
В 1970-х годах были разработаны базы знаний , ориентированные на более узкие области знаний. Вопросно-ответные системы, разработанные для взаимодействия с этими экспертными системами, давали более повторяемые [ требуется разъяснение ] и обоснованные ответы на вопросы в области знаний. Эти экспертные системы очень напоминали современные вопросно-ответные системы, за исключением их внутренней архитектуры. Экспертные системы в значительной степени опираются на созданные и организованные экспертами базы знаний , тогда как многие современные вопросно-ответные системы опираются на статистическую обработку большого, неструктурированного корпуса текстов на естественном языке.
В 1970-х и 1980-х годах развивались всеобъемлющие теории в области компьютерной лингвистики , что привело к разработке амбициозных проектов в области понимания текста и ответов на вопросы. Одним из примеров был Unix Consultant (UC), разработанный Робертом Виленски в Калифорнийском университете в Беркли в конце 1980-х годов. Система отвечала на вопросы, относящиеся к операционной системе Unix . Она имела всеобъемлющую, созданную вручную базу знаний своей области и была нацелена на формулирование ответа для удовлетворения различных типов пользователей. Другим проектом была LILOG, система понимания текста , которая работала в области туристической информации в немецком городе. Системы, разработанные в проектах UC и LILOG, так и не вышли за рамки простых демонстраций, но они помогли разработать теории по компьютерной лингвистике и рассуждениям.
Разработаны специализированные системы вопросов и ответов на естественном языке, такие как EAGLi для ученых, занимающихся вопросами здоровья и жизни. [6]
Системы контроля качества используются в различных приложениях, включая
По состоянию на 2001 год [обновлять]вопросно-ответные системы обычно включали модуль классификатора вопросов , который определял тип вопроса и тип ответа. [7]
Различные типы вопросно-ответных систем используют разные архитектуры. Например, современные открытые вопросно-ответные системы могут использовать архитектуру извлекателя-считывателя. Извлекатель нацелен на извлечение соответствующих документов, связанных с заданным вопросом, в то время как считыватель используется для выведения ответа из извлеченных документов. Такие системы, как GPT-3 , T5, [8] и BART [9], используют сквозную [ жаргон ] архитектуру, в которой архитектура на основе трансформатора [ жаргон ] хранит крупномасштабные текстовые данные в базовых параметрах. Такие модели могут отвечать на вопросы без доступа к каким-либо внешним источникам знаний.
Ответы на вопросы зависят от хорошего корпуса поиска ; без документов, содержащих ответ, мало что может сделать любая система ответов на вопросы. Большие коллекции, как правило, означают лучшую производительность ответов на вопросы, если только домен вопроса не ортогонален коллекции. Избыточность данных в больших коллекциях, таких как веб, означает, что крупицы информации, вероятно, будут сформулированы многими разными способами в разных контекстах и документах, [10] что приводит к двум преимуществам:
Некоторые системы ответов на вопросы в значительной степени полагаются на автоматизированное рассуждение . [11] [12]
Этот раздел нуждается в дополнительных цитатах для проверки . ( Январь 2016 ) |
В информационном поиске система вопросов и ответов с открытым доменом пытается вернуть ответ в ответ на вопрос пользователя. Возвращаемый ответ имеет форму коротких текстов, а не списка соответствующих документов. [13] Система находит ответы, используя комбинацию методов из компьютерной лингвистики , информационного поиска и представления знаний .
Система принимает в качестве входных данных вопрос на естественном языке , а не набор ключевых слов, например: «Когда национальный день Китая?» Затем она преобразует это предложение ввода в запрос в его логической форме . Принятие вопросов на естественном языке делает систему более удобной для пользователя, но более сложной в реализации, поскольку существует множество типов вопросов, и системе придется определить правильный, чтобы дать разумный ответ. Назначение типа вопроса вопросу является важнейшей задачей; весь процесс извлечения ответа основан на поиске правильного типа вопроса и, следовательно, правильного типа ответа.
Извлечение ключевых слов является первым шагом в определении типа входного вопроса. [14] В некоторых случаях слова четко указывают на тип вопроса, например, «Кто», «Где», «Когда» или «Сколько» — эти слова могут подсказать системе, что ответы должны быть типа «Человек», «Местоположение», «Дата» или «Число» соответственно. Методы POS-тегирования (части речи) и синтаксического разбора также могут определять тип ответа. В приведенном выше примере подлежащее — «День китайского народа», сказуемое — «есть», а обстоятельство — «когда», поэтому тип ответа — «Дата». К сожалению, некоторые вопросительные слова, такие как «Кто», «Что» или «Как», не соответствуют однозначным типам ответов: каждое может представлять более одного типа. В таких ситуациях необходимо учитывать другие слова в вопросе. Для понимания контекста можно использовать лексический словарь, такой как WordNet .
После того, как система определяет тип вопроса, она использует систему поиска информации для поиска набора документов, содержащих правильные ключевые слова. Тегер и блокировщик групп NP/Verb могут проверить, упоминаются ли правильные сущности и отношения в найденных документах. Для таких вопросов, как «Кто» или «Где», распознаватель именованных сущностей находит соответствующие имена «Лицо» и «Местоположение» из извлеченных документов. Для ранжирования выбираются только соответствующие абзацы. [ необходимо уточнение ]
Модель векторного пространства может классифицировать возможные ответы. Проверьте [ who? ] , имеет ли ответ правильный тип, определенный на этапе анализа типа вопроса. Метод вывода может проверить возможные ответы. Затем каждому из этих кандидатов присваивается оценка в соответствии с количеством содержащихся в нем вопросительных слов и тем, насколько близки эти слова к кандидату — чем больше и чем ближе, тем лучше. Затем ответ переводится путем синтаксического анализа в компактное и осмысленное представление. В предыдущем примере ожидаемый выходной ответ — «1st Oct».
Система ответов на вопросы с открытым исходным кодом, поддерживающая математику, под названием MathQA , основанная на Ask Platypus и Wikidata , была опубликована в 2018 году. [15] MathQA принимает в качестве входных данных вопрос на естественном языке на английском или хинди и возвращает математическую формулу, извлеченную из Wikidata, в виде краткого ответа, переведенного в вычислимую форму, которая позволяет пользователю вставлять значения для переменных. Система извлекает имена и значения переменных и общих констант из Wikidata, если они доступны. Утверждается, что система превосходит коммерческую вычислительную математическую систему знаний на тестовом наборе. [15] MathQA размещена в Wikimedia по адресу https://mathqa.wmflabs.org/. В 2022 году она была расширена для ответа на 15 типов математических вопросов. [16]
Методы MathQA должны объединять естественный и формульный язык. Одним из возможных подходов является выполнение контролируемой аннотации с помощью Entity Linking . «Задача ARQMath» на CLEF 2020 [17] была запущена для решения проблемы связывания недавно опубликованных вопросов с платформы Math Stack Exchange с существующими, на которые уже ответило сообщество. Предоставление гиперссылок на уже отвеченные, семантически связанные вопросы помогает пользователям получать ответы раньше, но является сложной проблемой, поскольку семантическая связанность не является тривиальной. [18] Лаборатория была мотивирована тем фактом, что 20% математических запросов в поисковых системах общего назначения выражаются в виде правильно сформированных вопросов. [19] Задача состояла из двух отдельных подзадач. Задача 1: «Поиск ответа» сопоставление старых ответов на посты с новыми поставленными вопросами, и Задача 2: «Поиск формулы» сопоставление старых формул постов с новыми вопросами. Начиная с области математики, которая включает в себя язык формул, цель состоит в том, чтобы впоследствии распространить задачу на другие области (например, дисциплины STEM, такие как химия, биология и т. д.), которые используют другие типы специальных обозначений (например, химические формулы). [17] [18]
Также исследовался обратный процесс ответа на математические вопросы — генерация математических вопросов. Механизм генерации и тестирования вопросов по физике PhysWikiQuiz извлекает математические формулы из Wikidata вместе с семантической информацией об их составляющих идентификаторах (именах и значениях переменных). [20] Затем формулы перестраиваются для генерации набора вариантов формул. Впоследствии переменные заменяются случайными значениями для генерации большого количества различных вопросов, подходящих для индивидуальных тестов студентов. PhysWikiquiz размещен на Wikimedia по адресу https://physwikiquiz.wmflabs.org/.
В последние годы [ могут быть устаревшими по состоянию на апрель 2023 года ] системы ответов на вопросы были расширены , чтобы охватить дополнительные области знаний [21]. Например, были разработаны системы для автоматического ответа на временные и геопространственные вопросы, вопросы по определениям и терминологии, биографические вопросы, многоязычные вопросы и вопросы о содержании аудио, изображений [22] и видео. [23] Текущие темы исследований ответов на вопросы включают:
В 2011 году Watson , компьютерная система ответов на вопросы, разработанная IBM , участвовала в двух показательных матчах Jeopardy! против Брэда Раттера и Кена Дженнингса , одержав победу со значительным отрывом. [32] Facebook Research сделала свою систему DrQA [33] доступной по лицензии с открытым исходным кодом . Эта система использует Википедию в качестве источника знаний. [2] Фреймворк с открытым исходным кодом Haystack от deepset объединяет вопросы с открытым доменом и генеративные вопросы и поддерживает адаптацию домена [ требуется разъяснение ] базовых языковых моделей [ требуется разъяснение ] для вариантов использования в отрасли [ неопределенно ] . [34] [35]
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite web}}
: CS1 maint: бот: исходный статус URL неизвестен ( ссылка )