В статистике квадрат отношений — это графическое представление для использования в факторном анализе таблицы индивидуумов x переменных . Это представление дополняет классические представления, предоставляемые анализом главных компонент (PCA) или анализом множественных соответствий (MCA), а именно представления индивидуумов, количественных переменных (корреляционный круг) и категорий качественных переменных (в центроиде индивидуумов, которые ими обладают). Это особенно важно в факторном анализе смешанных данных (FAMD) и в многофакторном анализе (MFA).
Первый интерес квадрата отношений заключается в представлении самих переменных, а не их категорий, что тем более ценно, что существует много переменных. Для этого мы вычисляем для каждой качественной переменной и каждого фактора ( , фактор ранга, является вектором координат индивидуумов вдоль оси ранга ; в PCA, называется главным компонентом ранга ), квадрат корреляционного отношения между и переменной , обычно обозначаемый :
Таким образом, с каждой факторной плоскостью мы можем связать представление самих качественных переменных. Их координаты находятся между 0 и 1, переменные появляются в квадрате, имеющем вершины в точках (0,0), ( 0,1), (1,0) и (1,1).
Шесть индивидуумов ( описываются тремя переменными, имеющими соответственно 3, 2 и 3 категории. Пример: индивидуум обладает категориями , и .
-а | -д | -ф | |
-б | -д | -ф | |
-с | -д | -г | |
-а | -е | -г | |
-б | -е | -час | |
-с | -е | -час |
Применительно к этим данным функция MCA, включенная в пакет R FactoMineR, позволяет построить классический график, представленный на рисунке 1.
Квадрат отношения (рисунок 2) облегчает чтение классической факторной плоскости. Он показывает, что:
Все это видно на классическом графике, но не так отчетливо. Роль квадрата отношений заключается в том, чтобы, во-первых, помочь в чтении обычного графика. Это ценно, когда переменных много и они обладают многочисленными координатами.
Это представление может быть дополнено представлением количественных переменных, координатами которых являются квадраты коэффициентов корреляции (а не корреляционных отношений). Таким образом, второе преимущество квадрата отношения заключается в возможности одновременного представления количественных и качественных переменных. [1]
Квадрат отношения может быть построен из любого факторного анализа таблицы индивидуумов x переменных . В частности, он используется (или должен использоваться) систематически:
Расширение этого графика на группы переменных (как представить группу переменных одной точкой?) используется в многофакторном анализе (МФА).
Идея представления качественных переменных как таковых точкой (а не категориями) принадлежит Брижит Эскофье. [3] Графика, используемая сейчас, была введена Брижит Эскофье и Жеромом Пажесом в рамках многофакторного анализа [4].
В MCA квадрат отношений обеспечивает синтетическое представление связей между смешанными переменными, что тем более ценно, что существует много переменных, имеющих много категорий. Это представление может быть полезным в любом факторном анализе, когда есть много смешанных переменных, активных и/или дополнительных.