Коэффициент RV

В статистике коэффициент RV [1] представляет собой многомерное обобщение квадрата коэффициента корреляции Пирсона (поскольку коэффициент RV принимает значения от 0 до 1). [2] Он измеряет близость двух наборов точек, каждый из которых может быть представлен в матрице .

Основные подходы в статистическом многомерном анализе данных могут быть объединены в общую структуру, в которой коэффициент RV максимизируется при соблюдении соответствующих ограничений. В частности, эти статистические методологии включают: [1]

Одним из применений коэффициента RV является функциональная нейровизуализация , где он может измерять сходство между сериями сканирований мозга двух субъектов [3] или между различными сканами одного и того же субъекта. [4]

Определения

Определение коэффициента RV использует идеи [5] относительно определения скалярных величин, которые называются «дисперсией» и «ковариацией» векторнозначных случайных величин . Обратите внимание, что стандартное использование заключается в том, чтобы иметь матрицы для дисперсий и ковариаций векторных случайных величин. Учитывая эти инновационные определения, коэффициент RV тогда является просто коэффициентом корреляции, определенным обычным способом.

Предположим, что X и Y — матрицы центрированных случайных векторов (векторы-столбцы) с ковариационной матрицей, заданной как

Σ Х И = Э ( Х И ) , {\displaystyle \Sigma _{XY}=\operatorname {E} (XY^{\top })\,,}

тогда скалярно-значная ковариация (обозначаемая COVV) определяется как [5]

КОВВ ( Х , И ) = Тр ( Σ Х И Σ И Х ) . {\displaystyle \operatorname {COVV} (X,Y)=\operatorname {Tr} (\Sigma _{XY}\Sigma _{YX})\,.}

Скалярно-значная дисперсия определяется соответственно:

ВАВ ( Х ) = Тр ( Σ Х Х 2 ) . {\displaystyle \operatorname {VAV} (X)=\operatorname {Tr} (\Sigma _{XX}^{2})\,.}

При таких определениях дисперсия и ковариация обладают определенными аддитивными свойствами в отношении формирования новых векторных величин путем расширения существующего вектора элементами другого. [5]

Тогда коэффициент RV определяется по формуле [5]

Р В ( Х , И ) = КОВВ ( Х , И ) ВАВ ( Х ) ВАВ ( И ) . {\displaystyle \mathrm {RV} (X,Y)={\frac {\operatorname {COVV} (X,Y)}{\sqrt {\operatorname {VAV} (X)\operatorname {VAV} (Y)} }}\,.}

Недостаток коэффициента и скорректированная версия

Несмотря на то, что коэффициент по построению принимает значения от 0 до 1, он редко достигает значений, близких к 1, поскольку знаменатель часто слишком велик по отношению к максимально достижимому значению знаменателя. [6]

При известных диагональных блоках и размерностей и соответственно, предполагая, что без потери общности, было доказано [7] , что максимально достижимый числитель равен где (соотв. ) обозначает диагональную матрицу собственных значений (соотв. ), отсортированную по убыванию от верхнего левого угла до нижнего правого угла, а — матрица . Σ Х Х {\displaystyle \Сигма _{XX}} Σ И И {\displaystyle \Сигма _{YY}} п × п {\displaystyle p\times p} д × д {\displaystyle q\times q} п д {\displaystyle p\leq q} Тр ( Λ Х П Λ И ) , {\displaystyle \operatorname {Tr} (\Lambda _{X}\Pi \Lambda _{Y}),} Λ Х {\displaystyle \Лямбда _{X}} Λ И {\displaystyle \Лямбда _{Y}} Σ Х Х {\displaystyle \Сигма _{XX}} Σ И И {\displaystyle \Сигма _{YY}} П {\displaystyle \Пи} п × д {\displaystyle p\times q} ( я п   0 п × ( д п ) ) {\displaystyle (I_{p}\ 0_{p\times (qp)})}

В свете этого Мордант и Сегерс [7] предложили скорректированную версию коэффициента RV, в которой знаменатель представляет собой максимальное значение, достижимое числителем. Он гласит:

Дом на колесах ¯ ( Х , И ) = Тр ( Σ Х И Σ И Х ) Тр ( Λ Х П Λ И ) = Тр ( Σ Х И Σ И Х ) дж = 1 м я н ( п , д ) ( Λ Х ) дж , дж ( Λ И ) дж , дж . {\displaystyle {\bar {\operatorname {RV} }}(X,Y)={\frac {\operatorname {Tr} (\Sigma _{XY}\Sigma _{YX})}{\operatorname {Tr} (\Lambda _{X}\Pi \Lambda _{Y})}}={\frac {\operatorname {Tr} (\Sigma _{XY}\Sigma _{YX})}{\sum _{j=1}^{min(p,q)}(\Lambda _{X})_{j,j}(\Lambda _{Y})_{j,j}}}.}

Влияние этой корректировки отчетливо видно на практике. [7]

Смотрите также

Ссылки

  1. ^ ab Роберт, П.; Эскуфье, И. (1976). «Унифицирующий инструмент для линейных многомерных статистических методов: коэффициент RV ». Прикладная статистика . 25 (3): 257–265. doi :10.2307/2347233. JSTOR  2347233.
  2. ^ Abdi, Hervé (2007). Salkind, Neil J (ред.). Коэффициент RV и коэффициент конгруэнтности . Thousand Oaks. ISBN 978-1-4129-1611-0.
  3. ^ Ферат Кериф; Жан-Батист Полин; Себастьен Мерио; Хабиб Банали; Гийом Планден; Мэтью Бретт (2003). «Групповой анализ в функциональной нейровизуализации: выбор субъектов с использованием мер сходства» (PDF) . NeuroImage . 20 (4): 2197–2208. doi :10.1016/j.neuroimage.2003.08.018. PMID  14683722.
  4. ^ Herve Abdi; Joseph P. Dunlop; Lynne J. Williams (2009). «Как вычислить оценки надежности и отобразить доверительные и толерантные интервалы для классификаторов шаблонов с использованием Bootstrap и трехстороннего многомерного шкалирования (DISTATIS)». NeuroImage . 45 (1): 89–95. doi :10.1016/j.neuroimage.2008.11.008. PMID  19084072.
  5. ^ abcd Эскуфье, Ю. (1973). «Описание векторных переменных». Биометрия . 29 (4). Международное биометрическое общество: 751–760. дои : 10.2307/2529140. JSTOR  2529140.
  6. ^ Пучетти, Г. (2019). «Измерение линейной корреляции между случайными векторами». SSRN .
  7. ^ abc Mordant Gilles; Segers Johan (2022). «Измерение зависимости между случайными векторами с помощью оптимального транспорта». Журнал многомерного анализа . 189 .
Получено с "https://en.wikipedia.org/w/index.php?title=RV_coefficient&oldid=1059405688"