В обработке сигналов методы подпространства сигнала являются эмпирическими линейными методами для уменьшения размерности и шумоподавления . Эти подходы привлекли значительный интерес и исследования в последнее время в контексте улучшения речи, моделирования речи и исследования классификации речи. Подпространство сигнала также используется в радиопеленгации с использованием MUSIC (алгоритма) . [1]
По сути, методы представляют собой применение подхода анализа главных компонент (PCA) к ансамблям наблюдаемых временных рядов, полученных путем выборки , например, выборки аудиосигнала . Такие выборки можно рассматривать как векторы в многомерном векторном пространстве над действительными числами . PCA используется для идентификации набора ортогональных базисных векторов (базисных сигналов), которые захватывают как можно больше энергии в ансамбле наблюдаемых выборок. Векторные пространства, охватываемые базисными векторами, идентифицированными в результате анализа, затем являются подпространством сигнала . Основное предположение заключается в том, что информация в речевых сигналах почти полностью содержится в небольшом линейном подпространстве общего пространства возможных векторов выборки, тогда как аддитивный шум обычно распределяется по большему пространству изотропно (например, когда это белый шум ).
Проецируя образец на подпространство сигнала, то есть сохраняя только тот компонент образца, который находится в подпространстве сигнала, определяемом линейными комбинациями первых нескольких наиболее энергичных базисных векторов, и отбрасывая остальную часть образца, которая находится в оставшейся части пространства, ортогонального этому подпространству, можно получить определенную степень фильтрации шума.
Подавление шума в подпространстве сигнала можно сравнить с методами фильтра Винера . Есть два основных отличия:
В простейшем случае методы подпространства сигнала предполагают наличие белого шума, однако также сообщалось о расширении подхода к удалению цветного шума и оценке улучшения речи на основе подпространства для надежного распознавания речи .