В Фурье - анализе кепстр ( / ˈk ɛ p s t r ʌ m , ˈs ɛ p -, - s t r ə m / ; множественное число кепстра , прилагательное кепстральный ) является результатом вычисления обратного преобразования Фурье (ОПФ) логарифма оценочного спектра сигнала . Метод является инструментом для исследования периодических структур в частотных спектрах. Мощностной кепстр имеет применение в анализе человеческой речи .
Термин cepstrum был получен путем перестановки первых четырех букв в слове spectrum . Операции с cepstra обозначаются как quefrency analysis (или quefrency alanysis [1] ), liftering или cepstral analysis . Его можно произносить двумя приведенными способами, причем второй вариант имеет преимущество, поскольку его не путают с kepstrum .
Концепция кепстра была введена в 1963 году BP Bogert, MJ Healy и JW Tukey . [1] Он служит инструментом для исследования периодических структур в частотных спектрах. [2] Такие эффекты связаны с заметными эхами или отражениями в сигнале или с возникновением гармонических частот ( частичных , обертонов ). Математически он имеет дело с проблемой деконволюции сигналов в частотном пространстве. [3]
Ссылки на статью Богерта в библиографии часто редактируются неправильно. [ необходима цитата ] Термины "quefrency", "alanysis", "cepstrum" и "saphe" были изобретены авторами путем перестановки букв в словах frequency, analysis, spectrum и phase. Изобретенные термины определяются по аналогии со старыми терминами.
Кепстр является результатом следующей последовательности математических операций:
Кепстр используется во многих вариантах. Наиболее важными являются:
В формулах для пояснения кепстра используются следующие сокращения:
Аббревиатура | Объяснение |
---|---|
Сигнал, являющийся функцией времени | |
Кепстр | |
Преобразование Фурье : аббревиатура может обозначать непрерывное преобразование Фурье , дискретное преобразование Фурье (ДПФ) или даже z-преобразование , поскольку z-преобразование является обобщением ДПФ. [3] | |
Обратное преобразование Фурье | |
Логарифм x . Выбор основания b зависит от пользователя. В некоторых статьях основание не указывается, в других предпочитают основание 10 или e . Выбор основания не влияет на основные правила вычислений, но иногда основание e приводит к упрощениям (см. «комплексный кепстр»). | |
Абсолютное значение , или величина комплексной величины , которая вычисляется из действительной и мнимой части с использованием теоремы Пифагора . | |
Абсолютный квадрат | |
Фазовый угол комплексной величины |
«Кепстр» изначально определялся как энергетический кепстр по следующему соотношению: [1] [3]
Мощностной кепстр имеет основные приложения в анализе звуковых и вибрационных сигналов. Он является дополнительным инструментом к спектральному анализу. [2]
Иногда его также определяют как: [2]
Из-за этой формулы кепстр иногда называют спектром спектра . Можно показать, что обе формулы согласуются друг с другом, поскольку спектральное распределение частот остается тем же самым, единственное отличие — масштабный коэффициент [2] , который можно применить впоследствии. В некоторых статьях предпочитают вторую формулу. [2] [4]
Возможны и другие обозначения, поскольку логарифм спектра мощности равен логарифму спектра, если применить масштабный коэффициент 2: [5]
и поэтому:
что обеспечивает связь с реальным кепстром (см. ниже).
Далее следует отметить, что окончательная операция возведения в квадрат в формуле для спектра мощности иногда называется ненужной [3] и поэтому иногда опускается. [4] [2]
Реальный кепстр напрямую связан с силовым кепстром:
Он выводится из комплексного кепстра (определенного ниже) путем отбрасывания фазовой информации (содержащейся в мнимой части комплексного логарифма ). [4] Он фокусируется на периодических эффектах в амплитудах спектра: [6]
Комплексный кепстр был определен Оппенгеймом при разработке им теории гомоморфных систем. [7] [8] Формула также приводится в другой литературе. [2]
Поскольку является комплексным, логарифмический член может быть также записан как произведение величины и фазы, а затем как сумма. Дальнейшее упрощение очевидно, если log является натуральным логарифмом с основанием e :
Следовательно: Комплексный кепстр можно также записать как: [9]
Комплексный кепстр сохраняет информацию о фазе. Таким образом, всегда возможно вернуться из области квантования во временную область с помощью обратной операции: [2] [3]
где b — основание используемого логарифма.
Основное применение — модификация сигнала в области частот (лифтеринг) как аналог фильтрации в области спектральных частот. [2] [3] Примером может служить подавление эффектов эха путем подавления определенных частот. [2]
Фазовый кепстр (после фазового спектра ) связан с комплексным кепстром следующим образом:
Независимая переменная кепстрального графика называется квефренцией . [10] Квефренция является мерой времени, хотя и не в смысле сигнала во временной области . Например, если частота дискретизации аудиосигнала составляет 44100 Гц, а в кепстре есть большой пик, квефренция которого составляет 100 отсчетов, пик указывает на наличие основной частоты, которая составляет 44100/100 = 441 Гц. Этот пик возникает в кепстре, потому что гармоники в спектре являются периодическими, а период соответствует основной частоте, поскольку гармоники являются целыми кратными основной частоты. [11]
Кепстр , что означает «временной отклик степенного ряда уравнения Колмогорова», похож на кепстр и имеет к нему такое же отношение, как ожидаемое значение к статистическому среднему, т. е. кепстр — это эмпирически измеренная величина, в то время как кепстр — это теоретическая величина. Он использовался до кепстра. [12] [13]
Автокепстр определяется как кепстр автокорреляции . Автокепстр точнее кепстра при анализе данных с эхо-сигналами.
Продолжая тему анаграмм, фильтр, работающий на кепстре, можно назвать подъемником . Подъемник нижних частот похож на фильтр нижних частот в частотной области . Его можно реализовать путем умножения на окно в частотной области и последующего преобразования обратно в частотную область, что приведет к измененному сигналу, т. е. с уменьшенным эхом сигнала.
Кепстр можно рассматривать как информацию о скорости изменения в различных спектральных диапазонах. Первоначально он был изобретен для характеристики сейсмических эхо, возникающих в результате землетрясений и взрывов бомб . Он также использовался для определения основной частоты человеческой речи и анализа отраженных сигналов радаров . Определение высоты тона с помощью кепстра особенно эффективно, поскольку эффекты голосового возбуждения (высота тона) и голосового тракта (форманты) являются аддитивными в логарифме спектра мощности и, таким образом, четко разделены. [14]
Кепстр — это представление, используемое в гомоморфной обработке сигналов , для преобразования сигналов, объединенных сверткой (например, источника и фильтра), в суммы их кепстров для линейного разделения. В частности, кепстр мощности часто используется в качестве вектора признаков для представления человеческого голоса и музыкальных сигналов. Для этих приложений спектр обычно сначала преобразуется с использованием шкалы мел . Результат называется мел-частотным кепстром или MFC (его коэффициенты называются мел-частотными кепстральными коэффициентами, или MFCC). Он используется для идентификации голоса, определения высоты тона и многого другого. Кепстр полезен в этих приложениях, поскольку низкочастотное периодическое возбуждение от голосовых связок и формантная фильтрация речевого тракта , которые свертываются во временной области и умножаются в частотной области , являются аддитивными и находятся в разных областях в области квэфрентности.
Обратите внимание, что чистая синусоида не может использоваться для проверки кепстра на определение высоты тона из квефренции, поскольку чистая синусоида не содержит никаких гармоник и не приводит к пикам квефренции. Вместо этого следует использовать тестовый сигнал, содержащий гармоники (например, сумму как минимум двух синусов, где второй синус является некоторой гармоникой (кратной) первого синуса, или, лучше, сигнал с квадратной или треугольной формой волны, поскольку такие сигналы обеспечивают много обертонов в спектре.).
Важным свойством кепстральной области является то, что свертку двух сигналов можно выразить как сложение их комплексных кепстров:
Концепция кепстра нашла многочисленные применения: [2] [3]
Недавно деконволюция на основе кепстра была использована для сигналов поверхностной электромиографии, чтобы удалить эффект стохастической импульсной последовательности, которая порождает сигнал sEMG , из спектра мощности самого сигнала sEMG. Таким образом, сохранялась только информация о форме и амплитуде потенциала действия двигательной единицы (MUAP), которая затем использовалась для оценки параметров модели временной области самого MUAP. [15]
Кратковременный кепстральный анализ был предложен Шредером и Ноллом в 1960-х годах для применения в определении высоты тона человеческой речи. [16] [17] [14]
{{cite book}}
: |work=
проигнорировано ( помощь )