Функциональный анализ главных компонент

Статистический метод исследования доминирующих мод изменения функциональных данных

Функциональный главный компонентный анализ ( FPCA ) — это статистический метод исследования доминирующих режимов изменения функциональных данных . При использовании этого метода случайная функция представляется в собственном базисе, который является ортонормированным базисом гильбертова пространства L2 , состоящим из собственных функций оператора автоковариации . FPCA представляет функциональные данные наиболее экономным способом, в том смысле, что при использовании фиксированного числа базисных функций базис собственных функций объясняет больше вариаций, чем любое другое базисное расширение. FPCA может применяться для представления случайных функций [1] или в функциональной регрессии [2] и классификации.

Формулировка

Для квадратично-интегрируемого стохастического процесса X ( t ), t ∈ 𝒯, пусть

μ ( т ) = Э ( Х ( т ) ) {\displaystyle \mu (t)={\text{E}}(X(t))}

и

Г ( с , т ) = Ков ( Х ( с ) , Х ( т ) ) = к = 1 λ к φ к ( с ) φ к ( т ) , {\displaystyle G(s,t)={\text{Cov}}(X(s),X(t))=\sum _{k=1}^{\infty }\lambda _{k}\varphi _{k}(s)\varphi _{k}(t),}

где — собственные значения , а , , ... — ортонормированные собственные функции линейного оператора Гильберта–Шмидта λ 1 λ 2 . . . 0 {\displaystyle \lambda _{1}\geq \lambda _{2}\geq ...\geq 0} φ 1 {\displaystyle \varphi _{1}} φ 2 {\displaystyle \varphi _{2}}

Г : Л 2 ( Т ) Л 2 ( Т ) , Г ( ф ) = Т Г ( с , т ) ф ( с ) г с . {\displaystyle G:L^{2}({\mathcal {T}})\rightarrow L^{2}({\mathcal {T}}),\,G(f)=\int _{\mathcal {T}}G(s,t)f(s)ds.}

По теореме Карунена–Лоэва можно выразить центрированный процесс в собственном базисе,

Х ( т ) μ ( т ) = к = 1 ξ к φ к ( т ) , {\displaystyle X(t)-\mu (t)=\sum _{k=1}^{\infty }\xi _{k}\varphi _{k}(t),}

где

ξ к = Т ( Х ( т ) μ ( т ) ) φ к ( т ) г т {\displaystyle \xi _{k}=\int _{\mathcal {T}}(X(t)-\mu (t))\varphi _{k}(t)dt}

— главный компонент, связанный с k -й собственной функцией , со свойствами φ к {\displaystyle \varphi _{k}}

Э ( ξ к ) = 0 , Вар ( ξ к ) = λ к  и  Э ( ξ к ξ л ) = 0  для  к л . {\displaystyle {\text{E}}(\xi _{k})=0,{\text{Var}}(\xi _{k})=\lambda _{k}{\text{ и }}{\text{E}}(\xi _{k}\xi _{l})=0{\text{ для }}k\neq l.}

Центрированный процесс тогда эквивалентен ξ 1 , ξ 2 , .... Обычно предполагается, что X может быть представлено только первыми несколькими собственными функциями (после вычитания средней функции), т.е.

Х ( т ) Х м ( т ) = μ ( т ) + к = 1 м ξ к φ к ( т ) , {\displaystyle X(t)\approx X_{m}(t)=\mu (t)+\sum _{k=1}^{m}\xi _{k}\varphi _{k}(t),}

где

Э ( Т ( Х ( т ) Х м ( т ) ) 2 г т ) = дж > м λ дж 0  как  м . {\displaystyle \mathrm {E} \left(\int _{\mathcal {T}}\left(X(t)-X_{m}(t)\right)^{2}dt\right)=\sum _{j>m}\lambda _{j}\rightarrow 0{\text{ as }}m\rightarrow \infty .}

Интерпретация собственных функций

Первая собственная функция отображает доминирующий режим изменения X. φ 1 {\displaystyle \varphi _{1}}

φ 1 = а г г м а х φ = 1 { Вар ( Т ( Х ( т ) μ ( т ) ) φ ( т ) г т ) } , {\displaystyle \varphi _{1}={\underset {\Vert \mathbf {\varphi } \Vert =1}{\operatorname {arg\,max} }}\left\{\operatorname {Var} (\int _{\mathcal {T}}(X(t)-\mu (t))\varphi (t)dt)\right\},}

где

φ = ( Т φ ( т ) 2 г т ) 1 2 . {\displaystyle \Vert \mathbf {\varphi } \Vert =\left(\int _ {\mathcal {T}}\varphi (t)^{2}dt\right)^{\frac {1}{2} }.}

k собственная функция является доминирующей модой изменения, ортогональной к , , ... , , φ к {\displaystyle \varphi _{k}} φ 1 {\displaystyle \varphi _{1}} φ 2 {\displaystyle \varphi _{2}} φ к 1 {\displaystyle \varphi _{k-1}}

φ к = а г г м а х φ = 1 , φ , φ дж = 0  для  дж = 1 , , к 1 { Вар ( Т ( Х ( т ) μ ( т ) ) φ ( т ) г т ) } , {\displaystyle \varphi _{k}={\underset {\Vert \mathbf {\varphi} \Vert =1,\langle \varphi,\varphi _{j}\rangle =0{\text{ for }}j =1,\dots ,k-1}{\operatorname {arg\,max} }}\left\{\operatorname {Var} (\int _ {\mathcal {T}}(X(t)-\mu (t))\varphi (t)dt)\right\},}

где

φ , φ дж = Т φ ( т ) φ дж ( т ) г т ,  для  дж = 1 , , к 1. {\ displaystyle \ langle \ varphi, \ varphi _ {j} \ rangle = \ int _ {\ mathcal {T}} \ varphi (t) \ varphi _ {j} (t) dt, {\ text { for }} j=1,\точки,k-1.}

Оценка

Пусть Y ij = X i ( t ij ) + ε ij будут наблюдениями, сделанными в местах (обычно во временных точках) t ij , где X i является i -й реализацией гладкого стохастического процесса, который генерирует данные, а ε ij являются одинаково и независимо распределенной нормальной случайной величиной со средним значением 0 и дисперсией σ 2 , j = 1, 2, ..., m i . Чтобы получить оценку средней функции μ ( t ij ), если доступна плотная выборка на регулярной сетке, можно взять среднее значение в каждом месте t ij :

μ ^ ( т я дж ) = 1 н я = 1 н И я дж . {\displaystyle {\hat {\mu }}(t_{ij})={\frac {1}{n}}\sum _{i=1}^{n}Y_{ij}.}

Если наблюдения редки, необходимо сгладить данные, объединенные из всех наблюдений, чтобы получить среднюю оценку [3], используя такие методы сглаживания, как локальное линейное сглаживание или сглаживание сплайнами .

Затем оценка ковариационной функции получается путем усреднения (в плотном случае) или сглаживания (в разреженном случае) исходных ковариаций. Г ^ ( с , т ) {\displaystyle {\hat {G}}(с,т)}

Г я ( т я дж , т я л ) = ( И я дж μ ^ ( т я дж ) ) ( И я л μ ^ ( т я л ) ) , дж л , я = 1 , , н . {\displaystyle G_{i}(t_{ij},t_{il})=(Y_{ij}-{\hat {\mu }}(t_{ij}))(Y_{il}-{\hat {\mu }}(t_{il})),j\neq l,i=1,\dots ,n.}

Обратите внимание, что диагональные элементы G i следует удалить, поскольку они содержат ошибку измерения. [4]

На практике дискретизируется до равномерно распределенной плотной сетки, а оценка собственных значений λ k и собственных векторов v k выполняется с помощью числовой линейной алгебры. [5] Оценки собственных функций затем могут быть получены путем интерполяции собственных векторов G ^ ( s , t ) {\displaystyle {\hat {G}}(s,t)} φ ^ k {\displaystyle {\hat {\varphi }}_{k}} v k ^ . {\displaystyle {\hat {v_{k}}}.}

Подогнанная ковариация должна быть положительно определенной и симметричной и тогда получается как

G ~ ( s , t ) = λ k > 0 λ ^ k φ ^ k ( s ) φ ^ k ( t ) . {\displaystyle {\tilde {G}}(s,t)=\sum _{\lambda _{k}>0}{\hat {\lambda }}_{k}{\hat {\varphi }}_{k}(s){\hat {\varphi }}_{k}(t).}

Пусть будет сглаженной версией диагональных элементов G i ( t ij , t ij ) исходных ковариационных матриц. Тогда есть оценка ( G ( t , t ) + σ 2 ). Оценка σ 2 получается из V ^ ( t ) {\displaystyle {\hat {V}}(t)} V ^ ( t ) {\displaystyle {\hat {V}}(t)}

σ ^ 2 = 2 | T | T ( V ^ ( t ) G ~ ( t , t ) ) d t , {\displaystyle {\hat {\sigma }}^{2}={\frac {2}{|{\mathcal {T}}|}}\int _{\mathcal {T}}({\hat {V}}(t)-{\tilde {G}}(t,t))dt,} если иначе σ ^ 2 > 0 ; {\displaystyle {\hat {\sigma }}^{2}>0;} σ ^ 2 = 0. {\displaystyle {\hat {\sigma }}^{2}=0.}

Если наблюдения X ij , j =1, 2, ..., m i плотны в 𝒯, то k -й ФФК ξ k можно оценить с помощью численного интегрирования , реализуя

ξ ^ k = X μ ^ , φ ^ k . {\displaystyle {\hat {\xi }}_{k}=\langle X-{\hat {\mu }},{\hat {\varphi }}_{k}\rangle .}

Однако, если наблюдения редки, этот метод не будет работать. Вместо этого можно использовать лучшие линейные несмещенные предикторы , [3] что даст

ξ ^ k = λ ^ k φ ^ k T Σ ^ Y i 1 ( Y i μ ^ ) , {\displaystyle {\hat {\xi }}_{k}={\hat {\lambda }}_{k}{\hat {\varphi }}_{k}^{T}{\hat {\Sigma }}_{Y_{i}}^{-1}(Y_{i}-{\hat {\mu }}),}

где

Σ ^ Y i = G ~ + σ ^ 2 I m i {\displaystyle {\hat {\Sigma }}_{Y_{i}}={\tilde {G}}+{\hat {\sigma }}^{2}\mathbf {I} _{m_{i}}} ,

и оценивается в точках сетки, сгенерированных t ij , j = 1, 2, ..., m i . Алгоритм PACE имеет доступный пакет Matlab [6] и пакет R [7] G ~ {\displaystyle {\tilde {G}}}

Были исследованы свойства асимптотической сходимости этих оценок. [3] [8] [9]

Приложения

FPCA может применяться для отображения режимов функциональной вариации , [1] [10] в диаграммах рассеяния FPC друг против друга или откликов против FPC, для моделирования разреженных продольных данных , [3] или для функциональной регрессии и классификации (например, функциональной линейной регрессии). [2] Диаграммы осыпи и другие методы могут использоваться для определения количества включенных компонентов. Функциональный анализ главных компонент имеет различные приложения в анализе временных рядов. В настоящее время этот метод адаптируется из традиционных многомерных методов для анализа наборов финансовых данных, таких как индексы фондового рынка, и создания графиков подразумеваемой волатильности. [11] Хорошим примером преимуществ функционального подхода является сглаженный FPCA (SPCA), разработанный Сильверманом [1996] и изученный Пеццулли и Сильверманом [1993], который позволяет напрямую комбинировать FPCA вместе с общим подходом сглаживания, который делает возможным использование информации, хранящейся в некоторых линейных дифференциальных операторах. Важное применение FPCA, уже известное из многомерного PCA, мотивировано разложением Карунена-Лоэва случайной функции на набор функциональных параметров – факторных функций и соответствующих факторных нагрузок (скалярных случайных величин). Это применение гораздо важнее, чем в стандартном многомерном PCA, поскольку распределение случайной функции в общем случае слишком сложно для непосредственного анализа, а разложение Карунена-Лоэва сводит анализ к интерпретации факторных функций и распределения скалярных случайных величин. Благодаря снижению размерности, а также точности представления данных, существуют широкие возможности для дальнейшего развития методов функциональных главных компонент в финансовой сфере.

Применение PCA в автомобильной технике. [12] [13] [14] [15]

Связь с анализом главных компонент

В следующей таблице показано сравнение различных элементов анализа главных компонент (PCA) и FPCA. Оба метода используются для снижения размерности . В реализациях FPCA использует шаг PCA.

Однако PCA и FPCA различаются в некоторых критических аспектах. Во-первых, порядок многомерных данных в PCA может быть переставлен , что не влияет на анализ, но порядок функциональных данных несет информацию о времени или пространстве и не может быть переупорядочен. Во-вторых, интервал между наблюдениями в FPCA имеет значение, тогда как в PCA нет проблемы интервала. В-третьих, обычный PCA не работает для многомерных данных без регуляризации , в то время как FPCA имеет встроенную регуляризацию из-за гладкости функциональных данных и усечения до конечного числа включенных компонентов.

ЭлементВ СПСВ FPCA
Данные X R p {\displaystyle X\in \mathbb {R} ^{p}} X L 2 ( T ) {\displaystyle X\in L^{2}({\mathcal {T}})}
Измерение p < {\displaystyle p<\infty } {\displaystyle \infty }
Иметь в виду μ = E ( X ) {\displaystyle \mu ={\text{E}}(X)} μ ( t ) = E ( X ( t ) ) {\displaystyle \mu (t)={\text{E}}(X(t))}
Ковариация Cov ( X ) = Σ p × p {\displaystyle {\text{Cov}}(X)=\Sigma _{p\times p}} Cov ( X ( s ) , X ( t ) ) = G ( s , t ) {\displaystyle {\text{Cov}}(X(s),X(t))=G(s,t)}
Собственные значения λ 1 , λ 2 , , λ p {\displaystyle \lambda _{1},\lambda _{2},\dots ,\lambda _{p}} λ 1 , λ 2 , {\displaystyle \lambda _{1},\lambda _{2},\dots }
Собственные векторы/собственные функции v 1 , v 2 , , v p {\displaystyle \mathbf {v} _{1},\mathbf {v} _{2},\dots ,\mathbf {v} _{p}} φ 1 ( t ) , φ 2 ( t ) , {\displaystyle \varphi _{1}(t),\varphi _{2}(t),\dots }
Внутренний продукт X , Y = k = 1 p X k Y k {\displaystyle \langle \mathbf {X} ,\mathbf {Y} \rangle =\sum _{k=1}^{p}X_{k}Y_{k}} X , Y = T X ( t ) Y ( t ) d t {\displaystyle \langle X,Y\rangle =\int _{\mathcal {T}}X(t)Y(t)dt}
Основные компоненты z k = X μ , v k , k = 1 , 2 , , p {\displaystyle z_{k}=\langle X-\mu ,\mathbf {v_{k}} \rangle ,k=1,2,\dots ,p} ξ k = X μ , φ k , k = 1 , 2 , {\displaystyle \xi _{k}=\langle X-\mu ,\varphi _{k}\rangle ,k=1,2,\dots }

Смотрите также

Примечания

  1. ^ ab Jones, MC; Rice, JA (1992). «Отображение важных особенностей больших наборов подобных кривых». The American Statistician . 46 (2): 140. doi :10.1080/00031305.1992.10475870.
  2. ^ ab Яо, Ф.; Мюллер, Х. Г.; Ванг, Дж. Л. (2005). «Функциональный линейный регрессионный анализ для продольных данных». Анналы статистики . 33 (6): 2873. arXiv : math/0603132 . doi : 10.1214/009053605000000660.
  3. ^ abcd Яо, Ф.; Мюллер, Х. Г.; Ванг, Дж. Л. (2005). «Функциональный анализ данных для разреженных продольных данных». Журнал Американской статистической ассоциации . 100 (470): 577. doi :10.1198/016214504000001745.
  4. ^ Станисвалис, Дж. Г .; Ли, Дж. Дж. (1998). «Непараметрический регрессионный анализ продольных данных». Журнал Американской статистической ассоциации . 93 (444): 1403. doi :10.1080/01621459.1998.10473801.
  5. ^ Райс, Джон; Сильверман, Б. (1991). «Непараметрическая оценка среднего значения и ковариационной структуры, когда данные представляют собой кривые». Журнал Королевского статистического общества. Серия B (методологическая) . 53 (1): 233– 243. doi :10.1111/j.2517-6161.1991.tb01821.x.
  6. ^ «PACE: Основной анализ с помощью условного ожидания».
  7. ^ "fdapace: Функциональный анализ данных и эмпирическая динамика". 2018-02-25.
  8. ^ Холл, П.; Мюллер, Х. Г.; Ванг, Дж. Л. (2006). «Свойства методов главных компонент для функционального и продольного анализа данных». Анналы статистики . 34 (3): 1493. arXiv : math/0608022 . doi : 10.1214/009053606000000272.
  9. ^ Ли, И.; Хсинг, Т. (2010). «Равномерные скорости сходимости для непараметрической регрессии и анализа главных компонент в функциональных/продольных данных». Анналы статистики . 38 (6): 3321. arXiv : 1211.2137 . doi : 10.1214/10-AOS813.
  10. ^ Мадригал, Педро; Краевский, Павел (2015). «Раскрытие коррелированной изменчивости в эпигеномных наборах данных с использованием преобразования Карунена-Лоэва». BioData Mining . 8 : 20. doi : 10.1186/s13040-015-0051-7 . PMC 4488123. PMID  26140054 . 
  11. ^ Функциональный анализ данных с приложениями в финансах Михала Бенко
  12. ^ Ли, Сангдон (2012). «Изменение режимов ускорения транспортного средства и разработка идеального ускорения транспортного средства». Труды Института инженеров-механиков, часть D: Журнал автомобильной инженерии . 226 (9): 1185– 1201. doi :10.1177/0954407012442775.
  13. ^ Ли, Сангдон (2010). «Характеристика и разработка идеального усилия педали, хода педали и времени отклика в тормозной системе для перевода голоса клиента в технические спецификации». Труды Института инженеров-механиков, часть D: Журнал автомобильной инженерии . 224 (11): 1433– 1450. doi :10.1243/09544070JAUTO1585.
  14. ^ Ли, Сангдон (2008). «Анализ главных компонентов прироста ускорения транспортного средства и перевод голоса клиента». Труды Института инженеров-механиков, часть D: Журнал автомобильной инженерии . 222 (2): 191– 203. doi :10.1243/09544070JAUTO351.
  15. ^ Ли, Сангдон (2006). «Многомерный статистический анализ шума холостого хода и позиционирования транспортного средства». Международный журнал по шуму и вибрации транспортных средств . 2 (2): 156–175 . doi :10.1504/IJVNV.2006.011052.

Ссылки

  • Джеймс О. Рэмси; Б. В. Сильверман (8 июня 2005 г.). Функциональный анализ данных. Springer. ISBN 978-0-387-40080-8.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Functional_principal_component_analysis&oldid=1240322707"