В обработке сигналов многомерная эмпирическая модовая декомпозиция ( многомерная EMD ) является расширением одномерного (1-D) алгоритма EMD на сигнал, охватывающий несколько измерений. Процесс эмпирической модовой декомпозиции Гильберта–Хуанга (EMD) разлагает сигнал на внутренние модовые функции, объединенные со спектральным анализом Гильберта , известным как преобразование Гильберта–Хуанга (HHT). Многомерная EMD расширяет алгоритм 1-D EMD на многомерные сигналы. Это разложение может применяться для обработки изображений , обработки аудиосигналов и различных других многомерных сигналов.
Многомерная эмпирическая модовая декомпозиция является популярным методом из-за его применения во многих областях, таких как текстурный анализ, финансовые приложения, обработка изображений , океаническая инженерия , сейсмические исследования и т. д. Для анализа характеристик многомерных сигналов использовалось несколько методов эмпирической модовой декомпозиции.
Метод эмпирической модовой декомпозиции (EMD) позволяет извлекать глобальную структуру и работать с фракталоподобными сигналами.
Метод EMD был разработан для того, чтобы данные можно было исследовать в адаптивном пространстве времени-частоты-амплитуды для нелинейных и нестационарных сигналов.
Метод EMD разлагает входной сигнал на несколько внутренних модовых функций (IMF) и остаток. Данное уравнение будет иметь следующий вид:
где — многокомпонентный сигнал. — функция собственной моды, а представляет собой остаток, соответствующий собственным модам.
Среднее по ансамблю — это подход к повышению точности измерений. Данные собираются с помощью отдельных наблюдений, каждое из которых содержит различный шум по ансамблю вселенных. Чтобы обобщить эту идею ансамбля, шум вводится в единый набор данных, , как если бы отдельные наблюдения действительно проводились как аналог физического эксперимента, который может быть повторен много раз. Добавленный белый шум рассматривается как возможный случайный шум, который может встретиться в процессе измерения. При таких условиях искусственное «наблюдение» будет .
В случае только одного наблюдения один из ансамблей множественных наблюдений имитируется путем добавления различных копий белого шума, , к этому единственному наблюдению, как указано в уравнении. Хотя добавление шума может привести к меньшему отношению сигнал/шум, добавленный белый шум обеспечит равномерное распределение эталонной шкалы для облегчения EMD; следовательно, низкое отношение сигнал/шум не повлияет на метод разложения, но фактически улучшит его, избегая смешивания мод. Основываясь на этом аргументе, делается дополнительный шаг, утверждая, что добавление белого шума может помочь извлечь истинные сигналы из данных, метод, который называется разложением эмпирических мод ансамбля (EEMD).
EEMD состоит из следующих этапов:
На этих этапах EEMD использует два свойства белого шума:
Метод «псевдо-BEMD» не ограничивается одним пространственным измерением; скорее, он может быть применен к данным с любым количеством пространственно-временных измерений. Поскольку пространственная структура по существу определяется временными масштабами изменчивости физической величины в каждом месте, а разложение полностью основано на характеристиках отдельных временных рядов в каждом пространственном месте, нет никаких предположений о пространственно-когерентных структурах этой физической величины. Когда возникает когерентная пространственная структура, она лучше отражает физические процессы, которые управляют эволюцией физической величины в масштабе времени каждого компонента. Поэтому мы ожидаем, что этот метод будет иметь значительные приложения в анализе пространственно-временных данных.
Для разработки псевдо-BEMD алгоритма ключевым шагом является перевод алгоритма 1D EMD в двумерную эмпирическую модовую декомпозицию (BEMD) и дальнейшее расширение алгоритма до трех или более измерений, что аналогично BEMD путем расширения процедуры на последовательные измерения. Для трехмерного куба данных элементов псевдо-BEMD даст подробные трехмерные компоненты, где , и являются числом IMF, разложенных из каждого измерения, имеющего , , и элементы соответственно.
Математически представим двумерный сигнал в виде матрицы с конечным числом элементов.
Сначала мы выполняем EMD в одном направлении X ( i , j ), например, построчно, чтобы разложить данные каждой строки на m компонентов, затем собрать компоненты того же уровня m из результата разложения каждой строки, чтобы создать двумерный разложенный сигнал на этом уровне m. Таким образом, получается m наборов двумерных пространственных данных
где RX (1, i, j), RX (2, i, j) и RX (m, i, j) — это m наборов сигнала, как указано (здесь мы также используем R для обозначения разложения строк). Связь между этими m двумерными разложенными сигналами и исходным сигналом задается как . [3]
Первая строка матрицы RX (m, i, j) — это m-й компонент EMD, разложенный из первой строки матрицы X (i, j). Вторая строка матрицы RX (m, i, j) — это m-й компонент EMD, разложенный из второй строки матрицы X (i, j), и т. д.
Предположим, что предыдущее разложение было по горизонтальному направлению, следующим шагом будет разложение каждого из ранее разложенных по строкам компонентов RX(m, i, j) в вертикальном направлении на n компонентов. Этот шаг сгенерирует n компонентов из каждого компонента RX.
Например, компонент
где C означает разложение столбцов. Наконец, двумерное разложение приведет к матрицам m× n, которые являются двумерными компонентами EMD исходных данных X(i,j). Матричное выражение для результата двумерного разложения:
где каждый элемент в матрице CRX является подматрицей i × j, представляющей компонент, разложенный на 2D EMD. Мы используем аргументы (или суффиксы) m и n для представления номера компонента разложения по строке и разложения по столбцу, соответственно, а не индексы, указывающие строку и столбец матрицы. Обратите внимание, что m и n указывают количество компонентов, полученных в результате разложения по строке (горизонтальному), а затем разложения по столбцу (вертикальному) соответственно.
Объединение компонентов одного и того же масштаба или сопоставимых масштабов с минимальной разницей даст двумерную функцию с наилучшей физической значимостью. Компоненты первой строки и первого столбца имеют приблизительно одинаковый или сопоставимый масштаб, хотя их масштабы постепенно увеличиваются вдоль строки или столбца. Поэтому объединение компонентов первой строки и первого столбца позволит получить первый полный двумерный компонент (C2D1). Последующий процесс заключается в применении той же техники комбинирования к остальным компонентам, вклад шумов распределяется по отдельным компонентам в соответствии с их масштабами. В результате возникают когерентные структуры компонентов. Таким образом, метод псевдо-BEMD может быть применен для выявления эволюции пространственных структур данных.
Следуя соглашению об одномерном EMD, последний компонент полных двумерных компонентов называется остатком.
Предложенная здесь схема декомпозиции может быть распространена на данные любых размерностей, например, на данные о твердом теле с различной плотностью или другими измеримыми свойствами.
дано как
В котором подписка n указывает на количество измерений. Процедура идентична изложенной выше: разложение начинается с первого измерения и продолжается до второго и третьего, пока все измерения не будут исчерпаны. Разложение по-прежнему осуществляется срезами. Этот новый подход основан на разделении исходных данных на одномерные срезы, а затем применении ансамблевого EMD к каждому одномерному срезу. Ключевая часть метода заключается в построении IMF в соответствии с принципом объединения сопоставимых компонентов минимального масштаба.
Например, матричное выражение для результата 3D-разложения — TCRX(m,n,q,i,j,k), где T обозначает глубину (или время) разложения. На основе принципа сопоставимой минимальной шкалы, применяемого в 2D-случае, число полных 3D-компонентов будет наименьшим значением m , n и q . Общее уравнение для вывода 3D-компонентов —
где ℓ обозначает уровень C3D, т.е.
Метод псевдо-BEMD имеет несколько преимуществ. Например, процедура просеивания псевдо-BEMD представляет собой комбинацию одномерного просеивания. Он использует подгонку одномерной кривой в процессе просеивания каждого измерения и не имеет трудностей, с которыми сталкиваются алгоритмы двумерного EMD, использующие подгонку поверхности, в которых есть проблема определения седловой точки как локального максимума или минимума. Просеивание — это процесс, который разделяет IMF и повторяет процесс до тех пор, пока не будет получен остаток. Первым шагом выполнения просеивания является определение верхней и нижней огибающих, охватывающих все данные, с помощью метода сплайнов. Схема просеивания для псевдо-BEMD похожа на одномерное просеивание, где локальное среднее стандартного EMD заменяется средним значением многомерных огибающих кривых.
Основным недостатком этого метода является то, что хотя мы могли бы расширить этот алгоритм на любые размерные данные, мы используем его только для двумерных приложений. Поскольку время вычисления данных большего размера будет пропорционально количеству IMF последующих измерений. Следовательно, это может превысить вычислительную мощность для системы обработки геофизических данных, когда количество EMD в алгоритме велико. Поэтому ниже мы упомянули более быстрые и лучшие методы для устранения этого недостатка.
Быстрый и эффективный анализ данных очень важен для больших последовательностей, поэтому MDEEMD фокусируется на двух важных вещах
Анализ главных компонент / эмпирический ортогональный функциональный анализ (PCA/EOF) широко используется в анализе данных и сжатии изображений, его главная цель - сократить набор данных, содержащий большое количество переменных, до набора данных, содержащего меньше переменных, но который все еще представляет большую долю изменчивости, содержащейся в исходном наборе данных. В климатических исследованиях анализ EOF часто используется для изучения возможных пространственных режимов (т. е. моделей) изменчивости и того, как они меняются со временем. В статистике анализ EOF известен как анализ главных компонент (PCA).
Обычно EOF находятся путем вычисления собственных значений и собственных векторов пространственно взвешенной матрицы ковариации аномалий поля. Чаще всего пространственные веса представляют собой cos(широта) или, что лучше для анализа EOF, sqrt(cos(широта)). Полученные собственные значения дают меру процентной дисперсии, объясняемой каждой модой. К сожалению, собственные значения не обязательно различимы из-за проблем с выборкой. Норт и др. (Mon. Wea. Rev., 1982, уравнения 24–26) предлагают «правило большого пальца» для определения того, отличается ли конкретное собственное значение (мода) от своего ближайшего соседа.
Атмосферные и океанографические процессы обычно «красные», что означает, что большая часть дисперсии (мощности) содержится в первых нескольких модах. Временные ряды каждой моды (они же главные компоненты) определяются путем проецирования полученных собственных векторов на пространственно взвешенные аномалии. Это приведет к амплитуде каждой моды за период записи.
По конструкции шаблоны EOF и главные компоненты независимы. Два фактора препятствуют физической интерпретации EOF: (i) ограничение ортогональности и (ii) полученные шаблоны могут зависеть от домена. Физические системы не обязательно ортогональны, и если шаблоны зависят от используемого региона, они могут не существовать, если домен изменяется.
Предположим, у нас есть пространственно-временные данные , где — пространственные местоположения (изначально не обязательно одномерные, но их необходимо преобразовать в одно пространственное измерение) от 1 до и временные местоположения от 1 до .
Используя PCA/EOF, можно выразить в [4]
где - это th главный компонент и th шаблон эмпирической ортогональной функции (EOF), а K - это меньшее из M и N. PC и EOF часто получаются путем решения проблемы собственных значений/собственных векторов либо временной ковариационной матрицы, либо пространственной ковариационной матрицы, в зависимости от того, какая размерность меньше. Дисперсия, объясняемая одной парой PCA/EOF, - это ее соответствующее собственное значение, деленное на сумму всех собственных значений ковариационной матрицы.
Если данные, подвергнутые анализу PCA/EOF, представляют собой белый шум, все собственные значения теоретически равны, и нет предпочтительного направления вектора для главного компонента в пространстве PCA/EOF. Чтобы сохранить большую часть информации данных, необходимо сохранить почти все PC и EOF, что делает размер выражения PCA/EOF даже больше, чем у оригинала, но если исходные данные содержат только одну пространственную структуру и колеблются со временем, то исходные данные могут быть выражены как произведение одного PC и одного EOF, подразумевая, что исходные данные большого размера могут быть выражены данными малого размера без потери информации, т. е. высокосжимаемыми.
Изменчивость меньшей области имеет тенденцию быть более пространственно-временно когерентной, чем у большей области, содержащей эту меньшую область, и, следовательно, ожидается, что для учета порогового уровня дисперсии потребуется меньше компонентов PC/EOF, следовательно, один из способов повышения эффективности представления данных с точки зрения компонента PC/EOF — это разделить глобальную пространственную область на набор подобластей. Если мы разделим исходную глобальную пространственную область на n подобластей, содержащих N1, N2, . . . , Nn пространственных сеток соответственно, со всеми Ni, где i=1, . . . , n, большими, чем M, где M обозначает количество временных местоположений, мы ожидаем, что количество сохраненных пар PC/EOF для всех подобластей K1, K2, . . . , Kn все меньше K, общее количество значений данных в представлении PCA/EOF исходных данных глобальной пространственной области по данному уравнению равно K×(N+M). Для нового подхода с использованием пространственного разделения общее количество значений в представлении PCA/EOF равно
где
Таким образом, степень сжатия пространственной области следующая:
Преимущество этого алгоритма заключается в том, что оптимизированное деление и оптимизированный выбор пар PC/EOF для каждой области приведут к более высокой скорости сжатия и значительному снижению объема вычислений по сравнению с псевдо-BEMD, расширенным до более высоких размерностей.
Для временного сигнала длиной M сложность кубического сплайнового просеивания через его локальные экстремумы составляет порядка M, как и сложность EEMD, поскольку он только повторяет операцию подгонки сплайна с числом, которое не зависит от M. Однако, поскольку число просеивания (часто выбирается равным 10) и число ансамбля (часто несколько сотен) умножаются на операции просеивания сплайна, следовательно, EEMD требует больше времени по сравнению со многими другими методами анализа временных рядов, такими как преобразования Фурье и вейвлет-преобразования. MEEMD использует EEMD-разложение временного ряда на каждой сетке деления исходного временного сигнала, операция EEMD повторяется по числу общих точек сетки домена. Идея быстрого MEEMD очень проста. Поскольку сжатие на основе PCA/EOF выражает исходные данные в виде пар PC и EOF посредством разложения PC, а не временных рядов каждой сетки, и используя соответствующую пространственную структуру, изображаемую соответствующими EOF, вычислительная нагрузка может быть значительно снижена.
Быстрый MEEMD включает в себя следующие этапы:
В этом сжатом вычислении мы использовали приближенные свойства диадического банка фильтров EMD/EEMD.
Обратите внимание, что детальное знание внутренних модовых функций искаженного шумом сигнала может помочь в оценке значимости этого режима. Обычно предполагается, что первый IMF захватывает большую часть шума, и, следовательно, из этого IMF мы можем оценить уровень шума и оценить искаженный шумом сигнал, приблизительно устраняя эффекты шума. Этот метод известен как шумоподавление и детрендирование. Еще одним преимуществом использования MEEMD является то, что смешивание мод значительно уменьшается из-за функции EEMD.
Стратегия шумоподавления и детрендирования может использоваться для обработки изображений для улучшения изображения, и аналогичным образом ее можно применять к аудиосигналам для удаления искаженных данных в речи. MDEEMD может использоваться для разложения изображений и аудиосигналов на IMF и на основе знания IMF выполнять необходимые операции. Разложение изображения очень выгодно для приложений на основе радаров, разложение изображения может обнаруживать наземные мины и т. д.
В MEEMD, хотя потенциально существует достаточный параллелизм в ансамблевых измерениях и/или нерабочих измерениях, при реализации высокопроизводительной MEEMD по-прежнему возникает ряд проблем. [5]
В MEEMD, когда высокая степень параллелизма задается размерностью ансамбля и/или нерабочими размерностями, преимущества использования параллельного алгоритма на уровне потоков являются тройными. [5]
EEMD, входящие в состав MEEMD, назначаются независимым потокам для параллельного выполнения, полагаясь на среду выполнения OpenMP для решения любых проблем с дисбалансом нагрузки. Доступ к памяти Stride для высокоразмерных данных устраняется путем транспонирования этих данных в более низкие измерения, что приводит к лучшему использованию строк кэша. Частичные результаты каждого EEMD делаются потоко-приватными для корректной работы. Требования к памяти зависят от количества потоков OpenMP и управляются средой выполнения OpenMP.
В реализации GPU CUDA каждый EMD отображается в поток. Макет памяти, особенно высокоразмерных данных, перестраивается для соответствия требованиям объединения памяти и вписывается в 128-байтовые строки кэша. Сначала данные загружаются по самому низкому измерению, а затем потребляются по более высокому измерению. Этот шаг выполняется, когда добавляется гауссовский шум для формирования ансамблевых данных. В новом макете памяти ансамблевое измерение добавляется к самому низкому измерению для уменьшения возможного расхождения ветвей. Влияние неизбежного расхождения ветвей от нерегулярности данных, вызванного шумом, минимизируется с помощью метода регуляризации с использованием встроенной памяти. Более того, кэш-память используется для амортизации неизбежных необъединенных обращений к памяти. [5]
Быстрая и адаптивная двумерная эмпирическая модовая декомпозиция (FABEMD) является улучшенной версией традиционной BEMD. [6] FABEMD может использоваться во многих областях, включая анализ медицинских изображений, анализ текстур и т. д. Фильтр порядковой статистики может помочь в решении проблем эффективности и ограничения размера в BEMD.
Метод реализации FABEMD, основанный на алгоритме BEMD, действительно похож на BEMD, но подход FABEMD просто изменяет шаг интерполяции на метод прямой оценки огибающей и ограничивает количество итераций для каждого BIMF до одной. В результате для аппроксимации верхней и нижней огибающей будут использоваться две порядковые статистики, включая MAX и MIN. Размер фильтра будет зависеть от карт максимумов и минимумов, полученных из входных данных. Шаги алгоритма FABEMD перечислены ниже.
В традиционном подходе BEMD мы можем найти j-й ITS-BIMF любого источника ввода методом соседнего окна. Для подхода FABEMD мы выбираем другой подход к реализации.
Из входных данных мы можем получить двумерную матрицу, представляющую
где — местоположение элемента в матрице A, и мы можем определить размер окна как . Таким образом, мы можем получить максимальное и минимальное значение из матрицы следующим образом:
где
Сначала мы определяем и как максимальное и минимальное расстояние в массиве, которое вычисляется от каждой локальной точки максимума или минимума до ближайшего ненулевого элемента. Кроме того, и будут отсортированы в массиве по убыванию в соответствии с удобным выбором. В противном случае мы будем рассматривать только квадратное окно. Таким образом, общая ширина окна будет следующей:
Для получения верхней и нижней огибающих необходимо определить два параметра и , а уравнение будет иметь следующий вид:
где определяется как квадратная область размера окна, а - ширина окна сглаживающего фильтра, которая равна . Таким образом, фильтр MAX и MIN сформирует новую двумерную матрицу для огибающей поверхности, которая не изменит исходные двумерные входные данные. [8]
Этот шаг заключается в том, чтобы убедиться, что оценка огибающей в FABEMD почти близка к результату BEMD с помощью интерполяции. Чтобы сделать сравнение, нам нужно сформировать соответствующие матрицы для верхней огибающей, нижней огибающей и средней огибающей, используя интерполяцию поверхности тонкого сплайна к максимальным и минимальным картам.
Этот метод (FABEMD) позволяет использовать меньше вычислений для быстрого получения результата, и он позволяет нам гарантировать более точную оценку BIMF. Более того, FABEMD более адаптивен для обработки больших входных данных, чем традиционный BEMD. В противном случае FABEMD является эффективным методом, в котором нам не нужно учитывать граничные эффекты и проблемы перелета-недолета.
В этом методе мы столкнемся с одной конкретной проблемой. Иногда во входных данных будет только один элемент локального максимума или минимума, поэтому это приведет к тому, что массив расстояний будет пустым.
Подход к многомерной эмпирической модовой декомпозиции на основе частных дифференциальных уравнений (MEMD на основе PDE) — это способ улучшить и преодолеть трудности оценки средней огибающей сигнала из традиционного EMD. MEMD на основе PDE фокусируется на модификации исходного алгоритма для MEMD. Таким образом, результат предоставит аналитическую формулировку, которая может облегчить теоретический анализ и наблюдение за производительностью. Для выполнения многомерного EMD нам необходимо расширить процесс просеивания на основе 1-D PDE [9] до 2-D пространства, как показано в шагах ниже.
Здесь в качестве примера мы возьмем двумерную модель ЭМД на основе PDE.
Рассматривается супердиффузионная матричная функция
где представляют собой функцию останова q-го порядка в направлении i.
Тогда, исходя из уравнений Навье–Стокса , уравнение диффузии будет иметь вид:
где — параметр натяжения, и мы предположили, что .
Для того чтобы соотнести это с уравнениями в частных производных, данное уравнение будет иметь вид
где — дифференциальный оператор 2q-го порядка по u, присущий поверхности S, а начальное условие для уравнения будет для любого y на поверхности S.
Чтобы получить теоретический и аналитический результат из предыдущего уравнения, нам необходимо сделать предположение.
Предположение:
Предполагается, что численные схемы разрешения представляют собой уравнения в частных производных 4-го порядка без натяжения, а уравнение для уравнения в частных производных 4-го порядка будет иметь вид
Прежде всего, мы явим схему, аппроксимировав процесс просеивания на основе PDE.
где — вектор, состоящий из значений каждого пикселя, — матрица, являющаяся разностным приближением оператора, — малый временной шаг.
Во-вторых, мы можем использовать схему аддитивного операторного расщепления (AOS) [10] для улучшения свойства устойчивости, поскольку малый временной шаг будет нестабилен, когда речь идет о большом временном шаге.
Наконец, мы можем использовать схему переменного направления неявного (ADI). При использовании схем типа ADI предлагается смешивать производный член, чтобы преодолеть проблему, заключающуюся в том, что схемы типа ADI могут использоваться только в уравнении диффузии второго порядка. Численно решенное уравнение будет иметь вид:
где — матрица, которая является центральным разностным приближением к оператору
Основанный непосредственно на уравнениях Навье–Стокса , этот подход обеспечивает хороший способ получения и разработки теоретических и численных результатов. В частности, BEMD на основе PDE может хорошо работать для полей разложения изображения. Этот подход может быть применен для извлечения переходного сигнала и избежания характеристики неопределенности в некоторых сигналах.
Существуют некоторые проблемы в реализации BEMD и расширения границ в процессе итеративного просеивания, включая затраты времени, форму и непрерывность краев, сравнение результатов разложения и т. д. Для устранения этих проблем был создан метод обработки границ в двумерной эмпирической декомпозиции (BPBEMD) . Далее будут описаны основные моменты алгоритма нового метода.
Несколько основных шагов алгоритма BPBEMD:
Предполагая, что размер исходных входных данных и результирующих данных равен и , соответственно, мы также можем определить, что исходная матрица входных данных находится в середине результирующей матрицы данных.
Разделите исходную матрицу входных данных и результирующую матрицу данных на блоки размером.
Найдите блок, который наиболее похож на соседний блок в исходной матрице входных данных, и поместите его в соответствующую результирующую матрицу данных.
Сформируйте матрицу расстояний, элементы которой взвешены по разным расстояниям между каждым блоком от этих границ.
Реализуем итеративное расширение, когда результирующая матрица данных сталкивается с огромным граничным расширением; мы можем увидеть, что блок в исходной матрице входных данных соответствует блоку в результирующей матрице данных.
Этот метод может обрабатывать большее количество элементов, чем традиционный метод BEMD. Кроме того, он может сократить время, необходимое для процесса. В зависимости от использования непараметрического синтеза текстур на основе выборки, BPBEMD может получить лучший результат после разложения и извлечения.
Поскольку большинство входных изображений нестационарны и не имеют проблем с границами, метод BPBEMD все еще не имеет достаточных доказательств того, что он адаптивен ко всем видам входных данных. Кроме того, этот метод узко ограничен для использования при анализе текстур и обработке изображений.
В первой части эти методы MEEMD могут быть использованы на наборах геофизических данных, таких как климатические, магнитные, сейсмические данные об изменчивости, которые используют преимущества быстрого алгоритма MEEMD. MEEMD часто используется для нелинейной фильтрации геофизических данных из-за его быстрых алгоритмов и его способности обрабатывать большие объемы наборов данных с использованием сжатия без потери ключевой информации. IMF также может быть использован в качестве усиления сигнала георадара для нелинейной обработки данных; он очень эффективен для обнаружения геологических границ из анализа аномалий поля. [12]
Во второй части основанные на PDE MEMD и FAMEMD могут быть реализованы для обработки звука, обработки изображений и анализа текстур. Благодаря нескольким своим свойствам, включая стабильность, меньшую трудоемкость и т. д., основанный на PDE метод MEMD хорошо подходит для адаптивной декомпозиции, шумоподавления данных и анализа текстур. Кроме того, FAMEMD является отличным методом для сокращения времени вычислений и получения точной оценки в процессе. Наконец, метод BPBEMD имеет хорошую производительность для обработки изображений и анализа текстур благодаря своему свойству решать проблемы расширения границ в последних методах.