Обработка сигналов — это подраздел электротехники , который фокусируется на анализе, изменении и синтезе сигналов, таких как звук , изображения и научные измерения. [1] Например, с фильтром g обратный фильтр h — это такой фильтр, что последовательность применения g, а затем h к сигналу приводит к исходному сигналу. Программные или электронные обратные фильтры часто используются для компенсации эффекта нежелательной фильтрации сигналов окружающей средой.
Во всех предлагаемых моделях для производства человеческой речи важной переменной является форма волны воздушного потока, или объемная скорость, в голосовой щели . Форма волны объемной скорости голосовой щели обеспечивает связь между движениями голосовых складок и акустическими результатами таких движений, в том смысле, что голосовая щель действует приблизительно как источник объемной скорости. То есть, сопротивление голосовой щели обычно намного выше, чем у голосового тракта, и поэтому голосовой поток воздуха контролируется в основном (но не полностью) голосовой зоной и подсвязочным давлением, а не акустикой голосового тракта. Этот взгляд на производство вокализованной речи часто называют моделью источника-фильтра .
Методика получения оценки формы волны скорости объема голосовой щели во время вокализованной речи заключается в «обратной фильтрации» либо излучаемой акустической волны, измеренной микрофоном с хорошим низкочастотным откликом, либо объемной скорости во рту, измеренной пневмотахографом во рту, имеющим линейный отклик, небольшое искажение речи и время отклика менее 1/2 мс. Пневмотахограф, обладающий этими свойствами, был впервые описан Ротенбергом [2] и назван им маской с кольцевым вентилированием или маской CV.
На практике обратная фильтрация обычно ограничивается неназализованными или слегка назализованными гласными, а записанная форма волны пропускается через «обратный фильтр», имеющий передаточную характеристику, которая является обратной передаточной характеристикой конфигурации надгортанного речевого тракта в этот момент. Передаточная характеристика надгортанного речевого тракта определяется с учетом того, что вход в речевой тракт считается объемной скоростью в голосовой щели. Для неназализованных гласных, предполагая, что источник объемной скорости с высоким импедансом в голосовой щели, передаточная функция речевого тракта ниже примерно 3000 Гц содержит несколько пар комплексно-сопряженных полюсов , чаще называемых резонансами или формантами . Таким образом, обратный фильтр будет иметь пару комплексно-сопряженных нулей , чаще называемых антирезонансом , для каждой форманты речевого тракта в интересующем диапазоне частот.
Если входной сигнал поступает с микрофона , а не с маски CV или ее эквивалента, обратный фильтр также должен иметь полюс на нулевой частоте (операция интегрирования) для учета характеристики излучения, которая связывает объемную скорость с акустическим давлением. Обратная фильтрация выхода маски CV сохраняет уровень нулевого потока, [2] тогда как обратная фильтрация сигнала микрофона этого не делает.
Обратная фильтрация зависит от модели источника-фильтра и фильтра речевого тракта, который представляет собой линейную систему , однако источник и фильтр не обязательно должны быть независимыми.