Стив Янг (инженер-программист)

Британский исследователь (родился в 1951 г.)

Стив Янг
Рожденный
Стивен Джон Янг

1951 (72–73 года)
Альма-матерКембриджский университет
Известный
Научная карьера
Поля
Учреждения
ТезисСинтез речи от концепции с приложениями к речевому выводу систем  (1978)
научный руководительФрэнк Фоллсайд
Веб-сайтmi.eng.cam.ac.uk/~sjy

Стивен Джон Янг (родился в 1951 году) — британский исследователь, [1] профессор информационной инженерии в Кембриджском университете и предприниматель. Он является одним из пионеров автоматизированного распознавания речи [2] и статистических систем речевого диалога. [3] [4] Он занимал должность старшего проректора Кембриджского университета с 2009 по 2015 год, отвечая за планирование и ресурсы. С 2015 по 2019 год он занимал совместную должность профессора в Кембридже и Apple , где он был старшим членом команды разработчиков Siri . [5]

Ранняя жизнь и образование

Янг родился в Ливерпуле 23 января 1951 года. Он учился в Кембриджском университете , получив степень бакалавра в области электротехники в 1973 году и степень доктора философии в области распознавания речи в 1978 году под руководством профессора Фрэнка Фоллсайда на инженерном факультете. Он читал лекции в Манчестере и Кембридже, прежде чем был избран на кафедру информационной инженерии в Кембриджском университете в 1994 году. [6]

Научная и академическая карьера

Он наиболее известен как ведущий автор инструментария HTK, [2] программного пакета для использования скрытых марковских моделей для моделирования временных рядов, в основном используемого для распознавания речи. Его первая версия была первоначально разработана Янгом в Лаборатории машинного интеллекта инженерного факультета Кембриджского университета (CUED) в 1989 году. В связи с растущей популярностью инструментария во всем мире, Microsoft решила снова сделать основной инструментарий HTK доступным и лицензировала программное обеспечение обратно CUED после приобретения Entropic, стартапа, соучредителем которого Стив был в 1993 году для распространения и поддержки инструментария HTK. Книга HTK, [7] которая является учебным пособием по инструментарию HTK, получила более 7000 ссылок. [8]

В конце девяностых годов исследовательские интересы Янга сместились в сторону проектирования статистических систем речевого диалога. Его наиболее заметным вкладом в эту область является структура управления диалогом на основе частично наблюдаемого процесса принятия решений Маркова (POMDP), [3] [9] [10], которая включает модель диалога со скрытым информационным состоянием (HIS), [11] первую практическую модель управления диалогом, основанную на структуре POMDP. Его исследования сосредоточены на разработке систем речевого диалога, которые устойчивы к шуму, создаваемому шумными распознавателями речи, а также адаптируются и масштабируются в режиме онлайн при взаимодействии с реальными пользователями. Одним из примечательных примеров этого подхода является применение обучения с подкреплением на основе гауссовского процесса для быстрой оптимизации политики. [12] [13] В последние годы исследовательская группа Янга успешно применила методы глубокого обучения к различным подмодулям статистических систем диалога, [14] [15] [16] [17] получив несколько наград за лучшую работу на престижных конференциях по речи и НЛП.

Предпринимательство

Помимо своего академического и научного вклада, Янг также является успешным предпринимателем и сыграл ведущую роль в трех приобретениях компаний:

  • Entropic, компания по разработке программного обеспечения для распознавания речи, которая разработала приложения для голосового включения веба через мобильных операторов. Компания была приобретена Microsoft в 1999 году. [18]
  • Phonetic Arts, компания по синтезу речи, которая предоставила технологию для генерации естественной выразительной речи. Технология, разработанная компанией, позволила компьютерным играм произносить различные предложения разными голосами. Phonetic arts была приобретена Google в 2010 году. [18]
  • VocalIQ, компания, занимающаяся технологиями диалога, которая создала первый в мире интерфейс программирования приложений для диалоговых систем. Технология компании предоставила платформу для голосовых интерфейсов, что позволило компаниям включать голосовые функции на мобильных устройствах и в собственных приложениях. VocalIQ была приобретена Apple в 2015 году. [18]

Награды и почести

Янг является членом Королевской инженерной академии [19] , Института инженерии и технологий (IET), Института инженеров по электротехнике и электронике (IEEE), Королевского общества речевых коммуникаций и Международной ассоциации речевой коммуникации (ISCA). [5]

В 2004 году он получил премию IEEE Signal Processing Society за технические достижения, а в 2010 году — медаль ISCA за научные достижения. В 2013 году он также получил премию European Signal Processing Society за индивидуальные технические достижения, а в 2015 году — премию IEEE James L Flanagan Speech and Audio Processing Award. [5]

В 2020 году он был избран членом Королевского общества (FRS) [20].

В 2022 году в честь Дня рождения Янг был назначен Командором Ордена Британской империи (CBE) за заслуги в области разработки программного обеспечения. [21]

Ссылки

  1. ^ "Стив Янг – Цитаты Google Scholar". Google Scholar . Получено 2 мая 2017 г. .
  2. ^ ab "HTK Speech Recognition Toolkit". Кембриджский университет.
  3. ^ ab Уильямс, Джейсон; Янг, Стив (2007). «Частично наблюдаемые марковские процессы принятия решений для систем речевого диалога» (PDF) . Компьютерная речь и язык . 21 (2): 393–422. doi :10.1016/j.csl.2006.06.008. S2CID  13903063.
  4. ^ Янг, Стив и др. «Модель состояния скрытой информации: практическая структура для управления речевым диалогом на основе POMDP» (PDF) . Компьютерная речь и язык .
  5. ^ abc "Профессор Стив Янг, профессор информационной инженерии". Кембриджский университет.
  6. ^ «Стивен Янг, стипендиат Эммануэля».
  7. ^ Янг, Стив. «Книга HTK» (PDF) . Инженерный факультет Кембриджского университета .
  8. ^ "Google Scholar" . Получено 23 декабря 2020 г.
  9. ^ Блейз Томпсон и Стив Янг (2010). «Байесовское обновление состояния диалога: структура POMDP для систем речевого диалога» (PDF) . Компьютерная речь и язык.
  10. ^ Янг, Стив (2013). «Системы статистического речевого диалога на основе POMDP: обзор» (PDF) . Proc IEEE.
  11. ^ Стив Янг и др. (2010). «Модель состояния скрытой информации: практическая структура для управления речевым диалогом на основе POMDP» (PDF) . Компьютерная речь и язык.
  12. ^ Милица Гасик и Стив Янг (2014). «Гауссовские процессы для оптимизации менеджера диалогов на основе POMDP» (Документ). IEEE Trans. Обработка звука, речи и языка.
  13. ^ Пей-Хао Су и др. (2016). «Онлайн-обучение с активным вознаграждением для оптимизации политики в системах устного диалога» (PDF) . Proc ACL. arXiv : 1605.07669 .
  14. ^ Лина Рохас-Барахона и др. (2016). «Использование представлений предложений и контекста в глубоких нейронных моделях для понимания устной речи». Proc Coling. стр. 258–267.
  15. ^ Никола Мркшич и др. (2017). «Нейронный трекер убеждений: отслеживание состояния диалога на основе данных» (PDF) . Proc ACL.
  16. ^ Цун-Сянь Вэнь и др. (2015). «Семантически обусловленная генерация естественного языка на основе LSTM для систем разговорного диалога» (PDF) . Proc EMNLP. arXiv : 1508.01745 .
  17. ^ Цун-Сянь Вэнь и др. (2017). «Сетевая сквозная обучаемая диалоговая система, ориентированная на задачи». arXiv : 1604.04562 [cs.CL].
  18. ^ abc "Стив Янг: профиль руководителя и биография". Bloomberg LP
  19. ^ "Стивен Янг". Королевская инженерная академия . Получено 23 декабря 2020 г.
  20. ^ "Стивен Янг". Королевское общество . Получено 20 сентября 2020 г.
  21. ^ "№ 63714". The London Gazette (Приложение). 1 июня 2022 г. стр. B11.


Взято с "https://en.wikipedia.org/w/index.php?title=Стив_Янг_(инженер_программного_обеспечения)&oldid=1248956753"