В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Корпус арабской речи — это современный стандартный арабский (MSA) речевой корпус для синтеза речи . Корпус содержит фонетические и орфографические транскрипции более 3,7 часов речи MSA, согласованные с записанной речью на уровне фонем. Аннотации включают в себя ударения в словах на отдельных фонемах. [1]
Корпус арабской речи был создан в рамках докторского проекта Навара Халаби в Университете Саутгемптона , финансируемого MicroLinkPC, владеющей исключительной лицензией на коммерциализацию корпуса, но корпус доступен для строго некоммерческих целей через официальный веб-сайт Корпуса арабской речи. Он распространяется по лицензии Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International. [2]
Корпус был в основном создан для целей синтеза речи, в частности, синтеза речи , но корпус использовался для создания голосов на основе HMM в арабском языке. Он также использовался для автоматического выравнивания других речевых корпусов с их фонетической транскрипцией и мог использоваться как часть большего корпуса для обучения систем распознавания речи. [1]
В комплект поставки входит следующее:
Корпус также использовался для доказательства того, что использование автоматически извлеченных знаков ударения на основе орфографии [3] улучшает качество синтеза речи в MSA.