Разговорный пользовательский интерфейс ( CUI ) — это пользовательский интерфейс для компьютеров, который эмулирует разговор с реальным человеком. [1] Исторически компьютеры полагались на текстовые пользовательские интерфейсы и графические пользовательские интерфейсы (GUI) (например, нажатие пользователем кнопки «назад») для перевода желаемых действий пользователя в команды, которые понимает компьютер. Хотя это эффективный механизм выполнения вычислительных действий, для пользователя существует кривая обучения, связанная с GUI. [2] Вместо этого CUI предоставляют пользователю возможность общаться с компьютером на его естественном языке, а не с помощью синтаксиса определенных команд. [3]
Для этого разговорные интерфейсы используют обработку естественного языка (NLP), чтобы позволить компьютерам понимать, анализировать и создавать смысл из человеческого языка. [4] В отличие от текстовых процессоров, NLP учитывает структуру человеческого языка (то есть слова образуют фразы; фразы образуют предложения, которые передают идею или намерение, которое пользователь пытается вызвать). Неоднозначная природа человеческого языка затрудняет для машины всегда правильную интерпретацию запросов пользователя, поэтому мы наблюдаем сдвиг в сторону понимания естественного языка (NLU). [5]
NLU позволяет проводить анализ настроений и диалоговый поиск, что позволяет продолжить линию вопросов, сохраняя контекст на протяжении всего разговора. NLU позволяет диалоговым интерфейсам обрабатывать неструктурированные входные данные, которые человеческий мозг способен понять, такие как орфографические ошибки в последующих вопросах. [6] Например, используя NLU, пользователь может сначала спросить о населении Соединенных Штатов. Если затем пользователь спросит «Кто президент?», поиск перенесет контекст Соединенных Штатов и предоставит соответствующий ответ.
Диалоговые интерфейсы стали инструментом, с помощью которого компании могут эффективно и экономически эффективно предоставлять потребителям релевантную информацию. [7] Интерфейсы CUI обеспечивают конечному пользователю простой доступ к релевантной контекстной информации без сложностей и необходимости обучения, которые обычно связаны с технологиями.
Несмотря на то, что существует множество брендов интерфейсов, на сегодняшний день выделяют две основные категории разговорных интерфейсов: голосовые помощники и чат-боты . [8]
Голосовой пользовательский интерфейс позволяет пользователю выполнить действие, произнеся команду. Представленный в октябре 2011 года, Siri от Apple был одним из первых широко принятых голосовых помощников. Siri позволял пользователям iPhone получать информацию и выполнять действия на своем устройстве, просто спрашивая Siri. В более поздние годы Siri была интегрирована с устройствами HomePod от Apple .
Дальнейшее развитие продолжилось с момента появления Siri, включив в него домашние устройства, такие как Google Home или Amazon Echo (на базе Alexa), которые позволяют пользователям «подключать» свои дома через ряд интеллектуальных устройств , чтобы расширить возможности ощутимых действий, которые они могут выполнять. Теперь пользователи могут выключать свет, устанавливать напоминания и звонить своим друзьям — все это с помощью голосовой очереди.
Эти диалоговые интерфейсы, использующие голосового помощника, стали популярным способом взаимодействия компаний со своими клиентами, поскольку интерфейс устраняет некоторые трудности в пути клиента . Клиентам больше не нужно запоминать длинный список имен пользователей и паролей к своим различным аккаунтам; они просто привязывают каждый аккаунт к Google или Amazon один раз, и прошли те времена, когда нужно было ждать на линии в течение часа, чтобы задать простой вопрос.
Чат -бот — это веб- или мобильный интерфейс, который позволяет пользователю задавать вопросы и получать информацию . Эта информация может быть общей по своей природе, например, окно чата Google Assistant, которое позволяет выполнять поиск в Интернете, или это может быть конкретный бренд или услуга, которая позволяет пользователю получать информацию о состоянии своих различных учетных записей. Их внутренние системы работают так же, как голосовой помощник, с использованием визуального интерфейса для передачи информации. Этот визуальный интерфейс может быть полезен для компаний, которым необходимо выполнять более сложные деловые операции с клиентами, поскольку инструкции, глубокие ссылки и графика могут использоваться для передачи ответа. Сложность, с которой чат-бот отвечает на вопросы, зависит от развития внутреннего интерфейса. Чат-боты с жестко запрограммированными ответами имеют меньшую базу информации и соответствующих навыков. Чат-боты, которые используют машинное обучение, будут продолжать расти и разрабатывать более крупные базы контента для более сложных ответов [ необходима цитата ] . [9]
Чаще всего компании используют чат-ботов как способ разгрузить простых вопросов и транзакций от агентов-людей. [10] Эти чат-боты предоставляют возможность помогать пользователю, но затем напрямую переводить клиента к живому агенту в том же окне чата, если разговор становится слишком сложным, эта функция называется Human Handover, платформы чат-ботов, такие как BotPenguin и другие платформы, предлагают такие функции в своих чат-ботах. [11] Чат-боты развивались и прошли долгий путь с момента своего создания. Современные чат-боты имеют персоны , которые делают их более похожими на людей.