Квадрат отношений

В статистике квадрат отношений — это графическое представление для использования в факторном анализе таблицы индивидуумов x переменных . Это представление дополняет классические представления, предоставляемые анализом главных компонент (PCA) или анализом множественных соответствий (MCA), а именно представления индивидуумов, количественных переменных (корреляционный круг) и категорий качественных переменных (в центроиде индивидуумов, которые ими обладают). Это особенно важно в факторном анализе смешанных данных (FAMD) и в многофакторном анализе (MFA).

Определениеквадрат отношенийв рамке MCA

Первый интерес квадрата отношений заключается в представлении самих переменных, а не их категорий, что тем более ценно, что существует много переменных. Для этого мы вычисляем для каждой качественной переменной и каждого фактора ( , фактор ранга, является вектором координат индивидуумов вдоль оси ранга ; в PCA, называется главным компонентом ранга ), квадрат корреляционного отношения между и переменной , обычно обозначаемый : Таким образом, с каждой факторной плоскостью мы можем связать представление самих качественных переменных. Их координаты находятся между 0 и 1, переменные появляются в квадрате, имеющем вершины в точках (0,0), ( 0,1), (1,0) и (1,1). дж {\displaystyle j} Ф с {\displaystyle F_{s}} Ф с {\displaystyle F_{s}} с {\displaystyle с} с {\displaystyle с} Ф с {\displaystyle F_{s}} с {\displaystyle с} Ф с {\displaystyle F_{s}} дж {\displaystyle j} η 2 ( дж , Ф с ) {\displaystyle \eta ^{2}(j,F_{s})}

Пример в MCA

Шесть индивидуумов ( описываются тремя переменными, имеющими соответственно 3, 2 и 3 категории. Пример: индивидуум обладает категориями , и . я 1 , , я 6 ) {\displaystyle i_{1},\ldots ,i_{6})} ( д 1 , д 2 , д 3 ) {\displaystyle (q_{1},q_{2},q_{3})} я 1 {\displaystyle i_{1}} а {\displaystyle а} д 1 {\displaystyle q_{1}} г {\displaystyle д} д 2 {\displaystyle q_{2}} ф {\displaystyle f} д 3 {\displaystyle q_{3}}

Таблица 1. Минутный набор данных для MCA.
д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}}
я 1 {\displaystyle i_{1}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}}
я 2 {\displaystyle i_{2}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}}
я 3 {\displaystyle i_{3}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}}
я 4 {\displaystyle i_{4}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}}
я 5 {\displaystyle i_{5}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}} -час
я 6 {\displaystyle i_{6}} д 1 {\displaystyle q_{1}} д 2 {\displaystyle q_{2}} д 3 {\displaystyle q_{3}} -час

Применительно к этим данным функция MCA, включенная в пакет R FactoMineR, позволяет построить классический график, представленный на рисунке 1.

Рисунок 1. MCA таблицы 1 через FactoMineR. Представление индивидов (синий) и категорий (цвет в соответствии с переменной).
Рисунок 2. MCA таблицы 1 через FactoMineR. Квадрат отношения.

Квадрат отношения (рисунок 2) облегчает чтение классической факторной плоскости. Он показывает, что:

  • Первый фактор связан с тремя переменными, но особенно (которые имеют очень высокую координату вдоль первой оси), а затем . д 3 {\displaystyle q_{3}} д 2 {\displaystyle q_{2}}
  • Второй фактор связан только с и (а не с , который имеет координату по оси 2, равную 0), причем сильным и равным образом. д 1 {\displaystyle q_{1}} д 3 {\displaystyle q_{3}} д 2 {\displaystyle q_{2}}

Все это видно на классическом графике, но не так отчетливо. Роль квадрата отношений заключается в том, чтобы, во-первых, помочь в чтении обычного графика. Это ценно, когда переменных много и они обладают многочисленными координатами.

Расширения

Это представление может быть дополнено представлением количественных переменных, координатами которых являются квадраты коэффициентов корреляции (а не корреляционных отношений). Таким образом, второе преимущество квадрата отношения заключается в возможности одновременного представления количественных и качественных переменных. [1]

Квадрат отношения может быть построен из любого факторного анализа таблицы индивидуумов x переменных . В частности, он используется (или должен использоваться) систематически:

Расширение этого графика на группы переменных (как представить группу переменных одной точкой?) используется в многофакторном анализе (МФА).

История

Идея представления качественных переменных как таковых точкой (а не категориями) принадлежит Брижит Эскофье. [3] Графика, используемая сейчас, была введена Брижит Эскофье и Жеромом Пажесом в рамках многофакторного анализа [4].

Заключение

В MCA квадрат отношений обеспечивает синтетическое представление связей между смешанными переменными, что тем более ценно, что существует много переменных, имеющих много категорий. Это представление может быть полезным в любом факторном анализе, когда есть много смешанных переменных, активных и/или дополнительных.

Ссылки

  1. ^ Несколько примеров с двумя типами переменных приведены в Pagès Jérôme (2014). Многофакторный анализ на примере с использованием R. Chapman & Hall/CRC The R Series London 272 стр.
  2. ^ Хассон Ф., Лес С. и Пажес Дж. (2009). Исследовательский многомерный анализ на примере с использованием R. Chapman & Hall/CRC The R Series, Лондон. ISBN  978-2-7535-0938-2
  3. ^ Эскофье Бриджит (1979). Представление переменных в анализе кратных соответствий. Аппликационный статистический обзор . том. XXVII, № 4, стр. 37–47. http://archive.numdam.org/ARCHIVE/RSA/RSA_1979__27_4/RSA_1979__27_4_37_0/RSA_1979__27_4_37_0.pdf
  4. ^ Эскофье Б. и Пажес Дж. (1988, 1-е изд., 2008, 4-е изд.) Анализирует простые и кратные факторы; Объекты, методы и интерпретация . Дюно, Париж, 318 стр. ISBN 978-2-10-051932-3 
  • Программное обеспечение дополненной реальности FactoMineR, предназначенное для разведочного анализа данных.
Получено с "https://en.wikipedia.org/w/index.php?title=Relationship_square&oldid=1214110049"