Коэффициент сцепления

Мера связи между двумя бинарными переменными

В статистике Y Юла , также известный как коэффициент коллигации , является мерой ассоциации между двумя бинарными переменными. Мера была разработана Джорджем Удни Юлом в 1912 году, [1] [2] и ее не следует путать с коэффициентом Юла для измерения асимметрии на основе квартилей .

Формула

Для таблицы 2×2 для двоичных переменных U и V с частотами или пропорциями

В = 0В = 1
У = 0аб
У = 1сг

Y Юла определяется как

И = а г б с а г + б с . {\displaystyle Y={\frac {{\sqrt {ad}}-{\sqrt {bc}}}{{\sqrt {ad}}+{\sqrt {bc}}}}.}

Y Юла тесно связан с отношением шансов OR  =  ad /( bc ), как видно из следующей формулы:

И = О Р 1 О Р + 1 {\displaystyle Y={\frac {{\sqrt {ИЛИ}}-1}{{\sqrt {ИЛИ}}+1}}}

Y Юла варьируется от −1 до +1. −1 отражает полную отрицательную корреляцию , +1 отражает совершенную положительную связь, а 0 отражает отсутствие связи вообще. Они соответствуют значениям для более распространенной корреляции Пирсона .

Y Юла также связан с аналогичным Q Юла , который также может быть выражен через отношение шансов. Q и Y связаны соотношением:

В = 2 И 1 + И 2   , {\displaystyle Q={\frac {2Y}{1+Y^{2}}}\ ,}
И = 1 1 В 2 В   . {\displaystyle Y={\frac {1-{\sqrt {1-Q^{2}}}}{Q}}\ .}

Интерпретация

Y Юла дает долю идеальной ассоциации в per unum (умноженная на 100, она представляет эту долю в более привычном проценте). Действительно, формула преобразует исходную таблицу 2×2 в перекрестно-симметричную таблицу, где b = c = 1 и a = d = OR .

Для перекрестно-симметричной таблицы с частотами или пропорциями a = d и b = c очень легко увидеть, что ее можно разделить на две таблицы. В таких таблицах ассоциация может быть измерена совершенно очевидным образом путем деления ( ab ) на ( a + b ). В преобразованных таблицах b должно быть заменено на 1, а a на OR . Преобразованная таблица имеет ту же степень ассоциации (то же самое OR), что и исходная не перекрестно-симметричная таблица. Следовательно, ассоциация в асимметричных таблицах может быть измерена с помощью Y Юла , интерпретируя ее точно так же, как и в симметричных таблицах. Конечно, Y Юла и ( a  −  b )/( a  +  b ) дают тот же результат в перекрестно-симметричных таблицах, представляя ассоциацию в виде дроби в обоих случаях.

Y Юла измеряет ассоциацию существенным, интуитивно понятным способом, и поэтому это мера предпочтения для измерения ассоциации. [ необходима цитата ]

Примеры

Следующая крестообразно симметричная таблица

В = 0В = 1
У = 04010
У = 11040

можно разделить на две таблицы:

В = 0В = 1
У = 01010
У = 11010

и

В = 0В = 1
У = 0300
У = 1030

Очевидно, что степень ассоциации равна 0,6 на единицу (60%).

Следующую асимметричную таблицу можно преобразовать в таблицу с равной степенью ассоциации (коэффициенты шансов обеих таблиц равны).

В = 0В = 1
У = 031
У = 139

Ниже приведена преобразованная таблица:

В = 0В = 1
У = 031
У = 113

Коэффициенты шансов обеих таблиц равны 9. Y  = (3 − 1)/(3 + 1) = 0,5 (50%)

Ссылки

  1. ^ Юл, Г. Удни (1912). «О методах измерения связи между двумя атрибутами». Журнал Королевского статистического общества . 75 (6): 579– 652. doi :10.2307/2340126. JSTOR  2340126.
  2. ^ Мишель Г. Соэте. Новая теория измерения ассоциации между двумя бинарными переменными в медицинских науках: ассоциация может быть выражена в виде дроби (per unum, percentage, pro mille....) идеальной ассоциации (2013), электронная статья, BoekBoek.be
Получено с "https://en.wikipedia.org/w/index.php?title=Коэффициент_столкования&oldid=1137286160"