Модель Фудзисаки представляет собой суперпозиционную модель для представления контура речи F 0 .
Согласно модели, контур F 0 формируется в результате суперпозиции выходов двух линейных фильтров второго порядка с базовым значением частоты. Линейные фильтры второго порядка предназначены для генерации фразовых и акцентных компонентов речи. Базовая частота — это минимальное значение частоты говорящего. Другими словами, контур F 0 получается путем сложения базовой частоты, фразовых компонентов и акцентных компонентов. Модель была предложена Хироей Фудзисаки.
где
Где,
: уровень смещения, на котором все компоненты фразы и акцента накладываются друг на друга, образуя контур,
: количество фразовых команд,
: количество команд ударения,
: величина i-й фразовой команды,
: амплитуда j-й акцентной команды,
: момент появления i-й фразовой команды,
: начало j-й ударной команды,
: конец j-й ударной команды,
: собственная угловая частота механизма управления фразами для i-й фразовой команды,
: собственная угловая частота механизма управления акцентом для j-й команды акцента, и
: максимальный уровень акцентного компонента для j-й акцентной команды.
Ссылки
Введение в синтез текста в речь [1]
Кейкичи Хиросе; Хироя Фудзисаки; Микио Ямагучи (1984). «Синтез по правилу контуров основной частоты голоса разговорного японского языка на основе лингвистической информации». IEEE .
^ Дютуа, Тьерри (2001). Введение в синтез текста в речь . Kluwer Academic Publishers. ISBN1-4020-0369-2.