Эта статья имеет рейтинг C-класса по шкале оценки контента Википедии . Она представляет интерес для следующих WikiProjects : | |||||||||||||||||||||||||||||||||||||||||
|
This article links to one or more target anchors that no longer exist.
Please help fix the broken anchors. You can remove this template after fixing the problems. | Reporting errors |
Эта страница начинает казаться завершенной. Некоторые разделы, например, SAPI версий 1–4, еще не закончены, и была выполнена лишь минимальная вычитка Dave w74 09:43, 9 февраля 2006 (UTC)
Хорошо, это содержит большую часть того, что я считаю необходимым, и я считаю, что все это технически правильно. Я также сделал некоторые основные корректуры и подчистки. Дэйв w74 10:31, 10 февраля 2006 (UTC)
У меня возникла проблема, когда SAPI упомянул только определение Apache, но не стал комментировать его из-за сноски о SAPI Microsoft как об альтернативном значении. Я бы подумал, что принятие термина двусмысленно, и было бы лучше иметь вторую запись на странице для этой темы, но, честно говоря, мне это нравится меньше. В нем обсуждается ТОЛЬКО SAPI Microsoft и более подробно, чем это, вероятно, необходимо. Проблема в том, что Microsoft SAPI — не единственный доступный движок SAPI. Существует целое семейство, включая тот, что IBM, используемый в ViaVoice, и все они называются SAPI, что является общим отраслевым термином для типа движка, так же как TAPI обычно относится к движкам телефонии, независимо от производителя. Сосредоточение внимания на Microsoft SAPI как на чем-то исключительном не ощущается мной как запись в «общей энциклопедии», а скорее как реклама Microsoft, так же как последняя версия другой записи для SAPI выглядела как реклама Apache. Если SAPI нуждается в более подробном объяснении, чем просто «что такое SAPI», то оно должно быть разделено на слои и не фокусироваться на каких-либо конкретных версиях SAPI.
Я не программист SAPI, но я исследовал их, пытаясь создать очень специализированный SAPI, подробности о котором я сейчас не хотел бы раскрывать, так как у меня есть довольно глубокие знания о том, как они работают. Честно говоря, версия SAPI от Microsoft мне не нравится из всех существующих движков и непереносима между различными ОС, в отличие от SAPI ViaVoice.
Разделение SAPI на уровни может быть выполнено двумя способами. Общие уровни бывают высокими и низкими, как и весь жаргон кодирования. Высокоуровневое использование SAPI заключается в использовании SAPI для всего, что он может сделать, и доверии движку и вашей базе данных XML выполнять всю фактическую работу за вас. Низкоуровневое использование SAPI заключается в проникновении в недра движка и выполнении большей части фактической работы (определение голоса, компоновка таблиц аллофонии и т. д.) самостоятельно, в вашем коде, но при этом нужны только самые базовые возможности движка (обычно это пользовательский речевой движок).
Разделение SAPI на технические уровни приводит к 4 общим уровням SAPI, и они представляют собой порядок, в котором SAPI обрабатывает звук для распознавания речи. Создание речи намного проще и не использует все 4 уровня.
В типичном методе работы SAPI, с которым я знаком, уровни обработки звука следующие:
Уровень 1: Определение темпа речи говорящего... Процесс попытки выяснить, когда заканчивается одно слово и начинается следующее, и начать хотя бы немного понимать, что говорится.
Уровень 2: Преобразование слова в пригодный для использования фонетический код, который можно сверить с базой данных слов.
Уровень 3: Определите, какое слово(а) было сказано.
Уровень 4: В случае нескольких возможных слов с таким произношением попытайтесь определить, какое слово это может быть в контексте окружающих слов.
Это очень грубая анатомия SAPI, и некоторые делают некоторые его части лучше, чем другие, но на самом деле все сводится к тому, что я не ценю рекламу определенных продуктов в энциклопедии... Мне придется дважды проверить свою историю SAPI, но я даже не уверен, что именно Microsoft может приписать себе заслугу создания первого SAPI... Они просто случайно создали первый свободно используемый SAPI, эксклюзивный для своей (самой популярной) ОС.
Список интересных занятий с Microsoft Sam см. на странице User:Martinultima/101 Things To Do With Microsoft Sam SpongeSebastian 04:58, 17 августа 2006 (UTC)
Я не понимаю, почему Microsoft Sam был удален и теперь перенаправляет сюда. Я думал, что страница Microsoft Sam была абсолютно нормальной. Теперь у нас есть странные разделы на этой странице, где люди указывают, что некоторые слова звучат смешно, что на самом деле не очень хорошо сочетается с остальным контентом.
Согласен, что добиться идеального расположения страниц, связанных с Microsoft Speech, немного сложно, но мне этот шаг кажется контрпродуктивным. Dave w74 02:24, 17 октября 2006 (UTC)
Microsoft Sam — это TTS-движок, и он не должен быть разделом на этой странице. В противном случае эта страница должна перечислить все различные версии движка, которые были отправлены, включая движки распознавания речи. Возможно, организация должна быть разделена на SAPI и движки SAPI (включая движки SR и TTS). Charles Oppermann 04:31, 12 сентября 2007 (UTC)
Я также удалил раздел пасхальных яиц. Это не было преднамеренной шуткой Microsoft, это просто ошибка или ограничение в голосе TTS, и поэтому я не думаю, что это заметно. Ни один движок TTS не произносит каждое слово или фразу идеально — это просто факт технологии. Пользователь:Martinultima/101 Things To Do With Microsoft Sam — отличное место для такого рода забавных вещей.
Нет ли ссылок на популярную культуру для Microsoft SAM?
Верно ли, что MS Streets and Trips добавляет голос Анны только в XP (без SAPI bump)? Reesd27 12:38, 3 июля 2007 (UTC)
Это верно. SAPI — это промежуточное программное обеспечение, которое распространяется вместе с операционной системой (5.1 в Windows XP, 5.3 в Windows Vista). Microsoft Anna — это TTS-движок, реализующий интерфейсы SAPI. Charles Oppermann 15:23, 16 ноября 2007 (UTC)
Ссылка на "Сайт Microsoft для SAPI 5" больше не работает. Кто-нибудь знает правильный URL? Я не смог его найти. --72.43.103.251 17:59, 3 октября 2007 (UTC)
Статья содержит информацию: «Поддержка распознавания речи для 8 языков на момент выпуска: американский английский, британский английский, традиционный китайский, упрощенный китайский, японский, немецкий, французский и испанский, и другие языки будут выпущены позже». Традиционный китайский и упрощенный китайский — это два разных способа написания китайских иероглифов, которые не связаны с распознаванием устной речи. Предполагается ли, что эта функция относится к синтезу речи, а не к распознаванию речи? — Предыдущий неподписанный комментарий добавлен 169.233.52.52 ( обсуждение ) 22:53, 6 февраля 2010 (UTC)
Здравствуйте, уважаемые википедисты!
Я только что добавил архивные ссылки на одну внешнюю ссылку на Microsoft Speech API . Пожалуйста, уделите немного времени, чтобы просмотреть мои правки. Вы можете добавить после ссылки, чтобы я не мог ее изменить, если я продолжу добавлять неверные данные, но вместо этого следует сообщать об ошибках форматирования. В качестве альтернативы вы можете добавить , чтобы вообще не допустить меня на страницу, но это следует использовать в качестве крайней меры. Я внес следующие изменения:{{cbignore}}
{{nobots|deny=InternetArchiveBot}}
Когда вы закончите просматривать мои изменения, пожалуйста, установите отмеченный параметр ниже на значение true или failed, чтобы сообщить об этом другим (документация по адресу ).{{Sourcecheck}}
Это сообщение было опубликовано до февраля 2018 года . После февраля 2018 года разделы страниц обсуждения "Внешние ссылки изменены" больше не генерируются и не отслеживаются InternetArchiveBot . Никаких специальных действий в отношении этих уведомлений на страницах обсуждения не требуется, кроме регулярной проверки с использованием инструкций инструмента архивации ниже. Редакторы имеют право удалять эти разделы страниц обсуждения "Внешние ссылки изменены", если они хотят очистить страницы обсуждения от загромождения, но перед выполнением массовых систематических удалений ознакомьтесь с RfC . Это сообщение динамически обновляется через шаблон (последнее обновление: 5 июня 2024 г.) .{{source check}}
Привет.— cyberbot II Поговорить с моим владельцем : Онлайн 22:54, 27 марта 2016 (UTC)
2A02:C7C:EA4C:ED00:F1E9:B92E:B9E5:9121 (обсуждение) 18:14, 27 апреля 2024 (UTC)