Подпространство сигнала

Метод фильтрации

В обработке сигналов методы подпространства сигнала являются эмпирическими линейными методами для уменьшения размерности и шумоподавления . Эти подходы привлекли значительный интерес и исследования в последнее время в контексте улучшения речи, моделирования речи и исследования классификации речи. Подпространство сигнала также используется в радиопеленгации с использованием MUSIC (алгоритма) . ^[1]

По сути, методы представляют собой применение подхода анализа главных компонент (PCA) к ансамблям наблюдаемых временных рядов, полученных путем выборки , например, выборки аудиосигнала . Такие выборки можно рассматривать как векторы в многомерном векторном пространстве над действительными числами . PCA используется для идентификации набора ортогональных базисных векторов (базисных сигналов), которые захватывают как можно больше энергии в ансамбле наблюдаемых выборок. Векторные пространства, охватываемые базисными векторами, идентифицированными в результате анализа, затем являются подпространством сигнала . Основное предположение заключается в том, что информация в речевых сигналах почти полностью содержится в небольшом линейном подпространстве общего пространства возможных векторов выборки, тогда как аддитивный шум обычно распределяется по большему пространству изотропно (например, когда это белый шум ).

Проецируя образец на подпространство сигнала, то есть сохраняя только тот компонент образца, который находится в подпространстве сигнала, определяемом линейными комбинациями первых нескольких наиболее энергичных базисных векторов, и отбрасывая остальную часть образца, которая находится в оставшейся части пространства, ортогонального этому подпространству, можно получить определенную степень фильтрации шума.

Подавление шума в подпространстве сигнала можно сравнить с методами фильтра Винера . Есть два основных отличия:

Базисные сигналы, используемые в фильтрации Винера, обычно представляют собой гармонические синусоиды , на которые сигнал может быть разложен с помощью преобразования Фурье . Напротив, базисные сигналы, используемые для построения подпространства сигнала, определяются эмпирически и могут быть, например, чирпами или особыми характерными формами переходных процессов после определенных событий запуска, а не чистыми синусоидами.
Фильтр Винера плавно переходит от линейных компонентов, в которых доминирует сигнал, к линейным компонентам, в которых доминирует шум. Шумовые компоненты отфильтровываются, но не совсем полностью; сигнальные компоненты сохраняются, но не совсем полностью; и есть переходная зона, которая частично принимается. Напротив, подход подпространства сигнала представляет собой резкое отсечение: ортогональный компонент либо лежит в подпространстве сигнала, и в этом случае он принимается на 100%, либо ортогонален ему, и в этом случае он на 100% отклоняется. Это уменьшение размерности, абстрагирующее сигнал в гораздо более короткий вектор, может быть особенно желательной особенностью метода.

В простейшем случае методы подпространства сигнала предполагают наличие белого шума, однако также сообщалось о расширении подхода к удалению цветного шума и оценке улучшения речи на основе подпространства для надежного распознавания речи .

Ссылки

^ Крим, Хамид; Виберг, Матс (1996). «Два десятилетия исследований обработки сигналов массива». Журнал IEEE Signal Processing Magazine . doi :10.1109/79.526899.

Крис Хермус; Патрик Вамбак и Хьюго Ван Хамме (2007). «Обзор улучшения речи в подпространстве сигнала и его применение для шумоустойчивого распознавания речи». Журнал EURASIP о достижениях в обработке сигналов . 2007 : 1. doi : 10.1155/2007/45821 .

[1] Крим, Хамид; Виберг, Матс (1996). «Два десятилетия исследований обработки сигналов массива». Журнал IEEE Signal Processing Magazine . doi :10.1109/79.526899.