Анализ пути (статистика)

Статистический термин

В статистике путевой анализ используется для описания направленных зависимостей между набором переменных. Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа , факторного анализа , канонического корреляционного анализа , дискриминантного анализа , а также более общие семейства моделей в многомерном дисперсионном анализе и ковариационном анализе ( MANOVA , ANOVA , ANCOVA ).

Помимо того, что его можно рассматривать как форму множественной регрессии, фокусирующейся на причинности, путевой анализ можно рассматривать как особый случай моделирования структурных уравнений (SEM) — в котором для каждой из переменных в каузальной модели используются только отдельные индикаторы. То есть путевой анализ — это SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения путевого анализа, включают каузальное моделирование и анализ ковариационных структур.

Джуда Перл считает, что анализ пути является прямым предком методов причинно-следственной связи . [1]

История

Анализ путей был разработан около 1918 года генетиком Сьюэллом Райтом , который более подробно писал о нем в 1920-х годах. [2] [3] С тех пор он применялся к широкому спектру областей сложного моделирования, включая биологию , [4] психологию , социологию и эконометрику . [5]

Моделирование пути

Обычно модели путей состоят из независимых и зависимых переменных, графически изображенных в виде блоков или прямоугольников. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных лежат на внешних краях модели и имеют только односторонние стрелки, выходящие из них. Ни одна односторонняя стрелка не указывает на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или являются как независимыми, так и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну одностороннюю стрелку, указывающую на них.

В модели ниже две экзогенные переменные (Ex 1 и Ex 2 ) моделируются как коррелирующие , как показано двунаправленной стрелкой. Обе эти переменные оказывают прямое и косвенное (через En 1 ) влияние на En 2 (две зависимые или «эндогенные» переменные/факторы). В большинстве моделей реального мира на эндогенные переменные могут также влиять переменные и факторы, вытекающие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты показаны в модели с помощью «e» или терминов ошибки.

Используя те же переменные, можно представить себе альтернативные модели. Например, можно предположить, что Ex 1 оказывает только косвенное влияние на En 2 , удалив стрелку от Ex 1 к En 2 ; и вероятность или «подгонку» этих двух моделей можно сравнить статистически.

Правила трассировки пути

Для того чтобы правильно рассчитать взаимосвязь между любыми двумя блоками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути [6] для расчета корреляции между двумя переменными. Корреляция равна сумме вкладов всех путей, через которые связаны две переменные. Сила каждого из этих вносящих вклад путей рассчитывается как произведение коэффициентов путей вдоль этого пути.

Правила трассировки пути следующие:

  1. Вы можете проследить назад вверх по стрелке, а затем вперед по следующей, или вперед от одной переменной к другой, но никогда вперед и затем назад. Другой способ думать об этом правиле заключается в том, что вы никогда не можете перейти из одного наконечника стрелки в другой наконечник стрелы: орел-решка или решка-орел, а не орел-орел.
  2. В данной цепочке путей каждую переменную можно пройти только один раз.
  3. В каждую цепочку путей можно включить не более одной двунаправленной стрелки.

Опять же, ожидаемая корреляция, обусловленная каждой цепочкой, прослеженной между двумя переменными, является произведением стандартизированных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих участвующих цепочек путей.

Примечание : Правила Райта предполагают модель без петель обратной связи: ориентированный граф модели не должен содержать циклов , т.е. это ориентированный ациклический граф , который был подробно изучен в рамках причинного анализа Джуди Перл .

Трассировка пути в нестандартных моделях

Если моделируемые переменные не были стандартизированы, дополнительное правило позволяет рассчитывать ожидаемые ковариации, если не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.

Самый простой случай получается, когда все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам выше, вычисляйте ожидаемые ковариации по:

  1. Вычислите произведение коэффициентов в каждом маршруте между интересующими вас переменными, прослеживая путь в обратном направлении, меняя направление на двунаправленную стрелку, а затем прослеживая путь вперед.
  2. Суммирование по всем различным маршрутам, где пути считаются различными, если они содержат разные коэффициенты или встречают эти коэффициенты в разном порядке.

Если остаточные дисперсии явно не включены или, как более общее решение, при любом изменении направления, встречающемся на маршруте (за исключением двусторонних стрелок), включите дисперсию переменной в точке изменения. То есть, при отслеживании пути от зависимой переменной к независимой переменной, включите дисперсию независимой переменной, за исключением случаев, когда это нарушит правило 1 выше (прохождение через соседние наконечники стрелок: т. е. когда независимая переменная также соединяется с двусторонней стрелкой, соединяющей ее с другой независимой переменной). При выводе дисперсий (что необходимо в случае, когда они явно не моделируются), путь от зависимой переменной к независимой переменной и обратно учитывается только один раз.

Смотрите также

Ссылки

  1. ^ Pearl, Judea (май 2018). Книга «Почему» . Нью-Йорк: Basic Books. стр. 6. ISBN 978-0-465-09760-9.
  2. ^ Райт, С. (1921). «Корреляция и причинно-следственная связь». J. Agricultural Research . 20 : 557–585 .
  3. ^ Райт, Сьюэлл (1934). «Метод коэффициентов пути». Анналы математической статистики . 5 (3): 161– 215. ISSN  0003-4851.
  4. ^ Ли, CC (1956). «Концепция коэффициента пути и ее влияние на популяционную генетику». Биометрия . 12 (2): 190– 210. doi :10.2307/3001760. ISSN  0006-341X.
  5. ^ Додж, И. (2003) Оксфордский словарь статистических терминов. OUP. ISBN 0-19-920613-9 
  6. ^ Райт, С. (1934). «Метод коэффициентов пути». Annals of Mathematical Statistics . 5 (3): 161– 215. doi : 10.1214/aoms/1177732676 .
  • Ωnyx — бесплатная программная среда для моделирования структурных уравнений
  • OpenMx — расширенное моделирование структурных уравнений
  • LISREL: модель, методы и программное обеспечение для моделирования структурных уравнений
Взято с "https://en.wikipedia.org/w/index.php?title=Path_analysis_(statistics)&oldid=1270290144"