Обсуждение: Microsoft Speech API

Без названия

Эта страница начинает казаться завершенной. Некоторые разделы, например, SAPI версий 1–4, еще не закончены, и была выполнена лишь минимальная вычитка Dave w74 09:43, 9 февраля 2006 (UTC) [ ответить ]

Хорошо, это содержит большую часть того, что я считаю необходимым, и я считаю, что все это технически правильно. Я также сделал некоторые основные корректуры и подчистки. Дэйв w74 10:31, 10 февраля 2006 (UTC) [ ответить ]

SAPI не является эксклюзивным продуктом Microsoft

У меня возникла проблема, когда SAPI упомянул только определение Apache, но не стал комментировать его из-за сноски о SAPI Microsoft как об альтернативном значении. Я бы подумал, что принятие термина двусмысленно, и было бы лучше иметь вторую запись на странице для этой темы, но, честно говоря, мне это нравится меньше. В нем обсуждается ТОЛЬКО SAPI Microsoft и более подробно, чем это, вероятно, необходимо. Проблема в том, что Microsoft SAPI — не единственный доступный движок SAPI. Существует целое семейство, включая тот, что IBM, используемый в ViaVoice, и все они называются SAPI, что является общим отраслевым термином для типа движка, так же как TAPI обычно относится к движкам телефонии, независимо от производителя. Сосредоточение внимания на Microsoft SAPI как на чем-то исключительном не ощущается мной как запись в «общей энциклопедии», а скорее как реклама Microsoft, так же как последняя версия другой записи для SAPI выглядела как реклама Apache. Если SAPI нуждается в более подробном объяснении, чем просто «что такое SAPI», то оно должно быть разделено на слои и не фокусироваться на каких-либо конкретных версиях SAPI.

Я не программист SAPI, но я исследовал их, пытаясь создать очень специализированный SAPI, подробности о котором я сейчас не хотел бы раскрывать, так как у меня есть довольно глубокие знания о том, как они работают. Честно говоря, версия SAPI от Microsoft мне не нравится из всех существующих движков и непереносима между различными ОС, в отличие от SAPI ViaVoice.

Разделение SAPI на уровни может быть выполнено двумя способами. Общие уровни бывают высокими и низкими, как и весь жаргон кодирования. Высокоуровневое использование SAPI заключается в использовании SAPI для всего, что он может сделать, и доверии движку и вашей базе данных XML выполнять всю фактическую работу за вас. Низкоуровневое использование SAPI заключается в проникновении в недра движка и выполнении большей части фактической работы (определение голоса, компоновка таблиц аллофонии и т. д.) самостоятельно, в вашем коде, но при этом нужны только самые базовые возможности движка (обычно это пользовательский речевой движок).

Разделение SAPI на технические уровни приводит к 4 общим уровням SAPI, и они представляют собой порядок, в котором SAPI обрабатывает звук для распознавания речи. Создание речи намного проще и не использует все 4 уровня.

В типичном методе работы SAPI, с которым я знаком, уровни обработки звука следующие:

Уровень 1: Определение темпа речи говорящего... Процесс попытки выяснить, когда заканчивается одно слово и начинается следующее, и начать хотя бы немного понимать, что говорится.

Уровень 2: Преобразование слова в пригодный для использования фонетический код, который можно сверить с базой данных слов.

Уровень 3: Определите, какое слово(а) было сказано.

Уровень 4: В случае нескольких возможных слов с таким произношением попытайтесь определить, какое слово это может быть в контексте окружающих слов.

Это очень грубая анатомия SAPI, и некоторые делают некоторые его части лучше, чем другие, но на самом деле все сводится к тому, что я не ценю рекламу определенных продуктов в энциклопедии... Мне придется дважды проверить свою историю SAPI, но я даже не уверен, что именно Microsoft может приписать себе заслугу создания первого SAPI... Они просто случайно создали первый свободно используемый SAPI, эксклюзивный для своей (самой популярной) ОС.

Интересные комментарии. Я согласен с несколькими вашими словами: Dave w74 21:03, 21 марта 2006 (UTC) [ ответить ]
  • Да, я согласен, что эту страницу можно было бы назвать лучше, чтобы было ясно, что мы говорим о Microsoft API. Я предлагаю переместить эту страницу в "Microsoft Speech Application Programming Interface". То, что я написал на этой странице, совершенно не подразумевало, что это единственный Speech API в мире, или что он был первым, или что он был лучшим.
  • Затем на странице SAPI disambiguate можно добавить ссылки на страницы о других API Speech {если они существуют}. Однако, чтобы внести ясность, я думаю, что почти всегда аббревиатура "SAPI" относится к Microsoft API. Другие API, как правило, имеют немного другие аббревиатуры, такие как JSAPI для Java Speech API и SRAPI для Speech Recognition API. Но я думаю, что это было бы разумно, если бы это помогло избежать путаницы.
  • Я думаю, вы предлагаете страницу о речевых API в целом. Я не уверен, что считаю это необходимым - я не думаю, что есть страница "Telephony API" или страница "Mail API", так зачем добавлять ее для этого? Я также думаю, что было бы трудно обсуждать речевые API в целом - их так много видов {распознавание, синтез, рабочий стол, телефония, проверка говорящего и т. д.} Но если вы считаете, что это добавляет ценность, сделайте это ... Dave w74 21:03, 21 марта 2006 (UTC) [ ответить ]
Достаточно было бы просто переключить его на MS SAPI или Microsoft SAPI, но SAPI сам по себе является общим термином, используемым несколькими продуктами. Даже самый распространенный речевой движок, используемый в автоматизированных телефонных системах с голосовым распознаванием (все более распространенный в службах поддержки клиентов в наши дни), называет свой продукт SAPI, и он выполняет обе задачи. Я почти уверен (но могу ошибаться), что движок ViaVoice может выполнять обе функции, хотя фактическое приложение, которое они публикуют для распознавания речи, выполняет только одну функцию. SAPI также есть в других ОС. Я допускаю, что ДА, когда большинство людей говорят SAPI, они имеют в виду Microsoft SAPI, но когда большинство людей говорят компьютер, они имеют в виду и Winbox, но я не вижу, чтобы запись о компьютерах была сосредоточена на Windows. Хотя я часто использую Windows, я на самом деле неравнодушен к LINUX или Solaris. Что касается общей записи SAPI для интерфейса программирования речевых приложений, я не чувствую себя достаточно квалифицированным, чтобы дать ему ту историю, которой он заслуживает. Насколько мне известно, термин SAPI для Speech Application Programming Interface был впервые придуман в середине 80-х годов для описания программной части аппаратного устройства, которое позволяло старым 8-битным компьютерам использовать чип VOX для разговора. Не могу найти более старой истории, но она может быть. - Первоначальный комментатор - 12:53, 22 марта 2006 (UTC)
Если вы можете найти "Speech Application Programming Interface", который в общем использовании имеет это очень специфическое название, но не является API, обсуждаемым в этой статье, пожалуйста, не стесняйтесь дать ссылку на него здесь в разделе обсуждения, и мы разберемся. Правильная заглавная буква в названии не случайна; это действительно единственный API в мире, который имеет это точное название. Переименование этой статьи в "Microsoft SAPI" - очень плохая идея, так как это снижает читаемость заголовка статьи - тот факт, что это речевой API, гораздо важнее того, что его создала Microsoft . Единственное обстоятельство, при котором эта статья должна изменить название, - это если есть конкретная необходимость в устранении неоднозначности. Прямо сейчас ее просто нет. Warrens 14:20, 22 марта 2006 (UTC) [ ответить ]

101 занятие с Microsoft Sam

Список интересных занятий с Microsoft Sam см. на странице User:Martinultima/101 Things To Do With Microsoft Sam SpongeSebastian 04:58, 17 августа 2006 (UTC) [ ответить ]

Зачем объединяться с Microsoft Sam???

Я не понимаю, почему Microsoft Sam был удален и теперь перенаправляет сюда. Я думал, что страница Microsoft Sam была абсолютно нормальной. Теперь у нас есть странные разделы на этой странице, где люди указывают, что некоторые слова звучат смешно, что на самом деле не очень хорошо сочетается с остальным контентом.

Согласен, что добиться идеального расположения страниц, связанных с Microsoft Speech, немного сложно, но мне этот шаг кажется контрпродуктивным. Dave w74 02:24, 17 октября 2006 (UTC) [ ответить ]

Microsoft Sam — это TTS-движок, и он не должен быть разделом на этой странице. В противном случае эта страница должна перечислить все различные версии движка, которые были отправлены, включая движки распознавания речи. Возможно, организация должна быть разделена на SAPI и движки SAPI (включая движки SR и TTS). Charles Oppermann 04:31, 12 сентября 2007 (UTC)

Я также удалил раздел пасхальных яиц. Это не было преднамеренной шуткой Microsoft, это просто ошибка или ограничение в голосе TTS, и поэтому я не думаю, что это заметно. Ни один движок TTS не произносит каждое слово или фразу идеально — это просто факт технологии. Пользователь:Martinultima/101 Things To Do With Microsoft Sam — отличное место для такого рода забавных вещей.

К сожалению, User:Martinultima/101 Things To Do With Microsoft Sam был сначала заброшен, а затем удален. Особенно потому, что MS Sam глючит и уступает другим TTS-движкам, его особые недостатки, по-видимому, затрагивают людей по-разному. Как указано ниже, MS Sam и его юмористические аспекты имеют гораздо большее значение в культуре, чем многие другие части Windows. Кроме того, Sam, очевидно, содержит пасхальные яйца (намеренные шутки), такие как знаменитое "crotch" (он может прекрасно говорить "botch" или "notch"). Но неважно, намеренные эти шутки или нет, то, как эти ошибки (или нет) понимаются пользователями, является моментом, который оправдывает запись в WP. WP - это не только техническая энциклопедия. -- 213.39.222.75 (обсуждение) 05:08, 17 ноября 2007 (UTC) [ ответить ]

Что?

Нет ли ссылок на популярную культуру для Microsoft SAM?

Я поддерживаю этот вопрос. После удаления статьи Microsoft Sam не осталось никаких упоминаний о большой популярности этой (почти) бесполезной части XP. Но у Sam на самом деле есть "карьера" на Youtube и многих форумах, отражающая особую юмористическую ценность этого движка TTS, который, кажется, является заметной частью "фольклора Windows". —Предыдущий неподписанный комментарий добавлен 213.39.155.59 (обсуждение) 05:50, 16 ноября 2007 (UTC)[ отвечать ]

Streets and trips добавляет голос Анны, но остается SAPI 5.1?

Верно ли, что MS Streets and Trips добавляет голос Анны только в XP (без SAPI bump)? Reesd27 12:38, 3 июля 2007 (UTC) [ ответить ]

Это верно. SAPI — это промежуточное программное обеспечение, которое распространяется вместе с операционной системой (5.1 в Windows XP, 5.3 в Windows Vista). Microsoft Anna — это TTS-движок, реализующий интерфейсы SAPI. Charles Oppermann 15:23, 16 ноября 2007 (UTC) [ ответить ]

Ссылка на "Сайт Microsoft для SAPI 5" больше не работает. Кто-нибудь знает правильный URL? Я не смог его найти. --72.43.103.251 17:59, 3 октября 2007 (UTC) [ ответить ]


Распознавание речи против синтеза речи

Статья содержит информацию: «Поддержка распознавания речи для 8 языков на момент выпуска: американский английский, британский английский, традиционный китайский, упрощенный китайский, японский, немецкий, французский и испанский, и другие языки будут выпущены позже». Традиционный китайский и упрощенный китайский — это два разных способа написания китайских иероглифов, которые не связаны с распознаванием устной речи. Предполагается ли, что эта функция относится к синтезу речи, а не к распознаванию речи? — Предыдущий неподписанный комментарий добавлен 169.233.52.52 ( обсуждение ) 22:53, 6 февраля 2010 (UTC) [ ответить ]

Здравствуйте, уважаемые википедисты!

Я только что добавил архивные ссылки на одну внешнюю ссылку на Microsoft Speech API . Пожалуйста, уделите немного времени, чтобы просмотреть мои правки. Вы можете добавить после ссылки, чтобы я не мог ее изменить, если я продолжу добавлять неверные данные, но вместо этого следует сообщать об ошибках форматирования. В качестве альтернативы вы можете добавить , чтобы вообще не допустить меня на страницу, но это следует использовать в качестве крайней меры. Я внес следующие изменения:{{cbignore}}{{nobots|deny=InternetArchiveBot}}

  • Добавлен архив http://web.archive.org/web/20071016060248/http://www.microsoft.com:80/speech/speech2007/default.mspx в http://www.microsoft.com/speech/speech2007/default.mspx

Когда вы закончите просматривать мои изменения, пожалуйста, установите отмеченный параметр ниже на значение true или failed, чтобы сообщить об этом другим (документация по адресу ).{{Sourcecheck}}

Это сообщение было опубликовано до февраля 2018 года . После февраля 2018 года разделы страниц обсуждения "Внешние ссылки изменены" больше не генерируются и не отслеживаются InternetArchiveBot . Никаких специальных действий в отношении этих уведомлений на страницах обсуждения не требуется, кроме регулярной проверки с использованием инструкций инструмента архивации ниже. Редакторы имеют право удалять эти разделы страниц обсуждения "Внешние ссылки изменены", если они хотят очистить страницы обсуждения от загромождения, но перед выполнением массовых систематических удалений ознакомьтесь с RfC . Это сообщение динамически обновляется через шаблон (последнее обновление: 5 июня 2024 г.) .{{source check}}

  • Если вы обнаружили URL-адреса, которые бот ошибочно посчитал неработающими, вы можете сообщить о них с помощью этого инструмента.
  • Если вы обнаружили ошибку в архивах или самих URL-адресах, вы можете исправить их с помощью этого инструмента.

Привет.— cyberbot II Поговорить с моим владельцем : Онлайн 22:54, 27 марта 2016 (UTC) [ ответить ]

ГДЕ КИНИТОПЕТ????????????

'(

2A02:C7C:EA4C:ED00:F1E9:B92E:B9E5:9121 (обсуждение) 18:14, 27 апреля 2024 (UTC) [ ответить ]

Retrieved from "https://en.wikipedia.org/w/index.php?title=Talk:Microsoft_Speech_API&oldid=1263323711"