В статистике коэффициент RV [1]
представляет собой многомерное обобщение квадрата коэффициента корреляции Пирсона (поскольку коэффициент RV принимает значения от 0 до 1). [2]
Он измеряет близость двух наборов точек, каждый из которых может быть представлен в матрице .
Основные подходы в статистическом многомерном анализе данных могут быть объединены в общую структуру, в которой коэффициент RV максимизируется при соблюдении соответствующих ограничений. В частности, эти статистические методологии включают: [1]
Одним из применений коэффициента RV является функциональная нейровизуализация , где он может измерять сходство между сериями сканирований мозга двух субъектов [3]
или между различными сканами одного и того же субъекта. [4]
Определения
Определение коэффициента RV использует идеи [5]
относительно определения скалярных величин, которые называются «дисперсией» и «ковариацией» векторнозначных случайных величин . Обратите внимание, что стандартное использование заключается в том, чтобы иметь матрицы для дисперсий и ковариаций векторных случайных величин. Учитывая эти инновационные определения, коэффициент RV тогда является просто коэффициентом корреляции, определенным обычным способом.
Предположим, что X и Y — матрицы центрированных случайных векторов (векторы-столбцы) с ковариационной матрицей, заданной как
тогда скалярно-значная ковариация (обозначаемая COVV) определяется как [5]
Скалярно-значная дисперсия определяется соответственно:
При таких определениях дисперсия и ковариация обладают определенными аддитивными свойствами в отношении формирования новых векторных величин путем расширения существующего вектора элементами другого. [5]
Тогда коэффициент RV определяется по формуле [5]
Недостаток коэффициента и скорректированная версия
Несмотря на то, что коэффициент по построению принимает значения от 0 до 1, он редко достигает значений, близких к 1, поскольку знаменатель часто слишком велик по отношению к максимально достижимому значению знаменателя. [6]
При известных диагональных блоках и размерностей и соответственно, предполагая, что без потери общности, было доказано [7] , что максимально достижимый числитель равен
где (соотв. ) обозначает диагональную матрицу собственных значений (соотв. ), отсортированную по убыванию от верхнего левого угла до нижнего правого угла, а — матрица .
В свете этого Мордант и Сегерс [7] предложили скорректированную версию коэффициента RV, в которой знаменатель представляет собой максимальное значение, достижимое числителем. Он гласит:
Влияние этой корректировки отчетливо видно на практике. [7]
^ ab Роберт, П.; Эскуфье, И. (1976). «Унифицирующий инструмент для линейных многомерных статистических методов: коэффициент RV ». Прикладная статистика . 25 (3): 257–265. doi :10.2307/2347233. JSTOR 2347233.
^ Abdi, Hervé (2007). Salkind, Neil J (ред.). Коэффициент RV и коэффициент конгруэнтности . Thousand Oaks. ISBN978-1-4129-1611-0.
^ Ферат Кериф; Жан-Батист Полин; Себастьен Мерио; Хабиб Банали; Гийом Планден; Мэтью Бретт (2003). «Групповой анализ в функциональной нейровизуализации: выбор субъектов с использованием мер сходства» (PDF) . NeuroImage . 20 (4): 2197–2208. doi :10.1016/j.neuroimage.2003.08.018. PMID 14683722.
^ Herve Abdi; Joseph P. Dunlop; Lynne J. Williams (2009). «Как вычислить оценки надежности и отобразить доверительные и толерантные интервалы для классификаторов шаблонов с использованием Bootstrap и трехстороннего многомерного шкалирования (DISTATIS)». NeuroImage . 45 (1): 89–95. doi :10.1016/j.neuroimage.2008.11.008. PMID 19084072.
^ Пучетти, Г. (2019). «Измерение линейной корреляции между случайными векторами». SSRN .
^ abc Mordant Gilles; Segers Johan (2022). «Измерение зависимости между случайными векторами с помощью оптимального транспорта». Журнал многомерного анализа . 189 .