База данных неродной речи

База данных речевых сообщений

База данных неродной речи — это речевая база данных неродного произношения английского языка . Такие базы данных используются при разработке: многоязычных систем автоматического распознавания речи , систем преобразования текста в речь , тренажеров произношения и систем обучения второму языку . [1]

Список

Таблица 1: Сокращения языков, используемых в Таблице 2
арабскийАяпонскийДж.
китайскийСкорейскийК
чешскийЧехиямалазийскийМ
датскийДнорвежскийН
ГолландскийДатпортугальскийП
АнглийскийЭРусскийР
ФранцузскийФиспанскийС
немецкийГшведскийШве
греческийГретайскийТ
индонезийскийИндвьетнамскийВ
итальянскийя  


Фактическая таблица с информацией о различных базах данных представлена ​​в Таблице 2.

Таблица 2: Обзор неродных баз данных
КорпусАвторДоступно наЯзыки#СпикерыРодной язык#Утт.ПродолжительностьДатаЗамечания
АМИ [2]ЕвросоюзЭДут и другие100чзаписи встреч
ATR-Gruhn [3]ГрюнАТРЭ96CGFJ Инд15000 2004рейтинг квалификации
BAS Странный Корпус 1+10 [4] ЭЛРАГ13950 стран7500 1998 
Ресторан Беркли [5]ИКСИЭ55GIHCFSJ25001994 
Новости вещания [6] НРСЭ    1997 
Кембридж-Витт [7]ВиттКембриджский университетЭ10ДЖИКС1200 1999 
Кембридж-Йе [8]ВыКембриджский университетЭ20С1600 2005 
Детские новости [9]ТомокиёКМУЭ62Дж.К.7500 2000частично спонтанный
КЛИПЫ-IMAG [10]загарКЛИПЫ-IMAGФ15резюме 2006 
CLSU [11] НРСЭ 22 страны5000 2007телефон, спонтанный
КМУ [12] КМУЭ64Г4520,9ч нет в наличии
Кросс Таунс [13]ШаденУ. БохумEFGI Чешско-немецкий161ЭФГИС72000133ч2006названия городов
Дюк-Арслан [14]АрсланУниверситет ДьюкаЭ9315 стран2200 1995частично телефонная речь
ЭРЖ [15]МинемацуУ. ТокиоЭ200Дж.68000 2002рейтинг квалификации
Фишер [16]НРСЭмного200чтелефонная речь
Фитт [17]ФиттЭдинбургский университетФИН Гре10Э700 1995названия городов
Френки [18] У. ЭрлангенЭ19Г2148   
Испаноязычный [19]Бирн Э22С 20ч1998частично спонтанный
HLTC [20] HKUSTЭ44С 2010доступно по запросу
IBM-Fischer [21] ИБМЭ40СФГИ2000 2002цифры
iCALL [22] [23]ЧэньЯ 2 Р, А*ЗВЕЗДАС30524 страны90841142ч2015фонетическая и тональная транскрипции (на пиньине), оценки владения языком
ОСТРОВ [24]ЭтвеллЕС/ЕЛДАЭ46ГИ400018ч2000 
Юпитер [25]ЗуэМассачусетский технологический институтЭнеизвестныйнеизвестный5146 1999телефонная речь
K-SEC [26]РиSiTECЭнеизвестныйК  2004
НРС WSJ1 [27] НРС 10 8001994 
LeaP [28]КишечникУниверситет МюнстераНАПРИМЕР12741 разных73.941 слов12ч2003 
ТУМАН [29] ЭЛРАЭФГ75Дат2200 1996 
НАТО HIWIRE [30] НАТОЭ81Ф Гре ИС8100 2007чистая речь
НАТО M-ATC [31]ГолубьНАТОЭ622ФГИС983317ч2007сильный фоновый шум
НАТО N4 [32] НАТОЭ115неизвестный 7,5 ч.2006сильный фоновый шум
Ономастика [33]  D Дат EFG Гре INPS Швеция (121000) 1995только лексикон
ПФ-СТАР [34] У. ЭрлангенЭ57Г46273,4 ч.2005детская речь
Солнечная звезда [35] ЕвросоюзЭ100ГСИПД40000 1992парламентская речь
TC-STAR [36]ХеувелЭЛДАЭСнеизвестныйстраны ЕС 13ч2006несколько наборов данных
ТЭД [37]ЛамельЭЛДАЭ40(188)много 10ч(47ч)1994евроречь 93
ТЛТС [38] DARPAА Э 2004 
Токио-Кикуко [39] У. ТокиоДж.14010 стран35000 2004рейтинг квалификации
Глагольный движитель [40] Мюнхенский университетЭ44Г 1,5 часа1994очень спонтанно
ВОДИС [41] ЕвросоюзФГ178ФГ2500 1998о автомобильной навигации
WP арабский [42]РоккаНРСА35Э8002002 
WP Русский [43]РоккаНРСР26Э25002003 
WP Испанский [44]МорганНРСС Э  2006 
WSJ говорил [45]  Э10неизвестный800 1993 


Легенда

В таблице неродных баз данных используются некоторые сокращения названий языков. Они перечислены в Таблице 1. Таблица 2 дает следующую информацию о каждом корпусе: Название корпуса, учреждение, где корпус может быть получен, или, по крайней мере, должна быть доступна дополнительная информация, язык, на котором фактически говорили носители языка, количество носителей языка, родной язык носителей языка, общее количество неродных высказываний, содержащихся в корпусе, продолжительность в часах неродной части, дата первой публичной ссылки на этот корпус, некоторый свободный текст, освещающий особые аспекты этой базы данных, и ссылка на другую публикацию. Ссылка в последнем поле в большинстве случаев относится к статье, которая специально посвящена описанию этого корпуса первоначальными собирателями. В некоторых случаях такую ​​статью идентифицировать не удалось. В этих случаях ссылается на статью, которая использует этот корпус.

Некоторые записи оставлены пустыми, а другие помечены как неизвестные. Разница здесь в том, что пустые записи относятся к атрибутам, значение которых просто неизвестно. Однако неизвестные записи указывают на то, что в самой базе данных нет информации об этом атрибуте. Например, в базе данных погоды Юпитера [46] не указано никакой информации о происхождении говорящих. Поэтому эти данные будут менее полезны для проверки обнаружения акцента или решения подобных проблем.

Где это возможно, имя является стандартным именем корпуса, однако для некоторых меньших корпусов не было установленного имени, и поэтому пришлось создать идентификатор. В таких случаях используется комбинация учреждения и сборщика базы данных.

В случае, если базы данных содержат родную и неродную речь, перечисляются только атрибуты неродной части корпуса. Большинство корпусов представляют собой коллекции прочитанной речи. Если же корпус состоит частично или полностью из спонтанных высказываний, это указывается в столбце Specials.

Ссылки

  1. ^ М. Рааб, Р. Грун и Э. Ноэт, Базы данных неродной речи , в Трудах ASRU, Киото, Япония, 2007.
  2. ^ Проект AMI, «Корпус собраний AMI» [1].
  3. ^ Р. Грун, Т. Синкарек и С. Накамура, «База данных по неродному английскому языку с несколькими акцентами», в ASJ, 2004.
  4. Мюнхенский университет, «Баварский архив странных корпусов речевых сигналов», [2].
  5. ^ Джурафски и др., «Проект ресторана Беркли», Proc. ICSLP 1994.
  6. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , докторская диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
  7. ^ С. Витт, Использование распознавания речи в компьютерном обучении языку , докторская диссертация, Инженерный факультет Кембриджского университета, Великобритания, 1999.
  8. ^ Х. Йе и С. Янг, Улучшение показателей распознавания речи у начинающих в устном разговорном взаимодействии для изучения языка , в Proc. Interspeech, Лиссабон, Португалия, 2005.
  9. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , докторская диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
  10. ^ TP Tan и L. Besacier, Французский неродной корпус для автоматического распознавания речи , в LREC, Генуя, Италия, 2006.
  11. ^ Т. Ландер, CSLU: Английский с иностранным акцентом, выпуск 1.2 , Технический представитель, LDC, Филадельфия, Пенсильвания, 2007.
  12. ^ З. Ван, Т. Шульц и А. Вайбель, Сравнение методов адаптации акустической модели к неродной речи , в Proc. ICASSP , 2003.
  13. ^ С. Шаден, Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten , Ph.D. диссертация, Университет Дуйсбург-Эссен, 2006 г.
  14. ^ Л. М. Арслан и Дж. Х. Хансен, Частотные характеристики иностранной акцентированной речи , в Трудах ICASSP , Мюнхен, Германия, 1997, стр. 1123-1126.
  15. ^ Н. Минемацу и др., Разработка базы данных английской речи, читаемой японцами, для поддержки исследования CALL , в ICA, Киото, Япония, 2004, стр. 577-560.
  16. ^ Кристофер Сиери, Дэвид Миллер, Кевин Уокер, Корпус Фишера: ресурс для следующих поколений преобразования речи в текст , Proc. LREC 2004
  17. ^ С. Фитт, Произношение незнакомых местных и неместных названий городов , в Proc. of Eurospeech, 1995, стр. 2227-2230.
  18. ^ G. Stemmer, E. Noeth и H. Niemann, Акустическое моделирование иностранных слов в системе распознавания немецкой речи , в Proc. Eurospeech, P. Dalsgaard, B. Lindberg и H. Benner, Eds., 2001, т. 4, стр. 2745-2748.
  19. ^ W. Byrne, E. Knodt, S. Khudanpur и J. Bernstein, Готово ли автоматическое распознавание речи для неродной речи? Попытка сбора данных и начальные эксперименты по моделированию разговорного испаноязычного английского языка , в STiLL, Мархолмен, Швеция, 1998, стр. 37-40.
  20. ^ Y. Li, P. Fung, P. Xu и Y. Liu, Асимметричное акустическое моделирование для распознавания речи на смешанных языках , в ICASSP, Прага, Чехия, 2011, стр. 37-40.
  21. ^ В. Фишер, Э. Янке и С. Кунцманн, Недавний прогресс в декодировании неродной речи с помощью многоязычных акустических моделей , в Proc. of Eurospeech, 2003, стр. 3105-3108.
  22. ^ Нэнси Ф. Чен, Ронг Тонг, Даррен Ви, Пэйсюань Ли, Бин Ма, Хайчжоу Ли, Корпус iCALL: Мандаринский китайский язык, на котором говорят не носители языка европейского происхождения , в Proc. of Interspeech, 2015.
  23. ^ Нэнси Ф. Чен, Виваек Шивакумар, Махеш Харикумар, Бин Ма, Хайчжоу Ли. Масштабная характеристика ошибок произношения мандаринского диалекта, допускаемых носителями европейских языков , в Proc. of Interspeech, 2013.
  24. ^ W. Menzel, E. Atwell, P. Bonaventura, D. Herron, P. Howarth, R. Morton и C. Souter, Корпус ISLE неродного разговорного английского языка , в LREC, Афины, Греция, 2000, стр. 957-963.
  25. ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи , диссертация магистра, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
  26. ^ SC. Rhee и SH. Lee и SK. Kang и YJ. Lee, Проектирование и создание корпуса корейско-разговорного английского языка (K-SEC) , Proc. ICSLP 2004
  27. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , докторская диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
  28. ^ Гут, У., Неродная речь. Анализ фонологических и фонетических свойств английского и немецкого языков на основе корпусного анализа , Франкфурт-на-Майне: Peter Lang, 2009.
  29. ^ TNO Human Factors Research Institute, Mist многоязыковая совместимость в базе данных речевых технологий , Технический отчет, ELRA, Париж, Франция, 2007, Ссылка на каталог ELRA S0238.
  30. ^ JC Segura et al., База данных HIWIRE, шумный и неродной англоязычный речевой корпус для общения в кабине экипажа , 2007, [3].
  31. ^ С. Пиджен, В. Шен и Д. ван Леувен, Разработка и характеристика неродной базы данных связи военного воздушного движения , в ICSLP, Антверпен, Бельгия, 2007.
  32. ^ Л. Бенарусс и др., Корпус родной и неродной речи НАТО (n4) , в Трудах семинара MIST (ESCA-NATO), Льюсден, сентябрь 1999 г.
  33. ^ Onomastica Consortium, Межъязыковой лексикон произношения ONOMASTICA , в Proc. Eurospeech, Мадрид, Испания, 1995, стр. 829-832.
  34. ^ C. Hacker, T. Cincarek, A. Maier, A. Hessler и E. Noeth, Усиление просодических и произносительных характеристик для обнаружения неправильного произношения у детей, не являющихся носителями языка , в Proc. of ICASSP, Гонолулу, Гавайи, 2007, стр. 197-200.
  35. ^ К. Тейшейра, И. Транкозо и А. Серралейру, Распознавание неродного акцента , в Proc. Eurospeech, Родос, Греция, 1997, стр. 2375–2378.
  36. ^ Х. Хеувел, К. Шукри, К. Голлан, А. Морено и Д. Мостефа, TC-STAR: Новые языковые ресурсы для целей ASR и SLT , в LREC, Генуя, 2006, стр. 2570-2573.
  37. ^ Л. Ф. Ламель , Ф. Шиль, А. Фурсен, Дж. Мариани и Х. Тиллманн, Транслингвальная английская база данных TED , в ICSLP, Иокогама, Япония, сентябрь 1994 г.
  38. ^ Н. Моут, Л. Джонсон, А. Сети, Дж. Сильва и С. Нараянан, Тактическое обнаружение языка и моделирование речевых ошибок учащихся: случай тактического обучения арабскому языку для носителей американского варианта английского языка , в Proc. of InSTIL, июнь 2004 г.
  39. ^ К. Нишина, Разработка базы данных японской речи, прочитанной неносителями языка, для построения системы CALL , в ICA, Киото, Япония, 2004, стр. 561-564.
  40. ^ Мюнхенский университет, проект Verbmobil , [4].
  41. ^ И. Транкозо, К. Виана, И. Маскаренас и К. Тейшейра, О выводе правил для национального произношения в навигационных запросах , в Proc. Eurospeech, 1999.
  42. ^ А. ЛаРокка и Р. Шуайри, Корпус арабской речи Вест-Пойнта , Технический представитель, LDC, Филадельфия, Пенсильвания, 2002.
  43. ^ А. ЛаРокка и К. Томей, Корпус русской речи Вест -Пойнта, Технический представитель, LDC, Филадельфия, Пенсильвания, 2003.
  44. ^ Дж. Морган, «Героическая испанская речь в Вест-Пойнте» , Технический представитель, LDC, Филадельфия, Пенсильвания, 2006.
  45. ^ И. Амдал, Ф. Коркмазский и А.С. Сурендран, Совместное моделирование произношения неносителей языка с использованием методов, основанных на данных , в ICSLP, Пекин, Китай, 2000, стр. 622-625.
  46. ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи , диссертация магистра, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
Взято с "https://en.wikipedia.org/w/index.php?title=База_данных_неродной_речи&oldid=1086393186"