В статистике путевой анализ используется для описания направленных зависимостей между набором переменных. Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа , факторного анализа , канонического корреляционного анализа , дискриминантного анализа , а также более общие семейства моделей в многомерном дисперсионном анализе и ковариационном анализе ( MANOVA , ANOVA , ANCOVA ).
Помимо того, что его можно рассматривать как форму множественной регрессии, фокусирующейся на причинности, путевой анализ можно рассматривать как особый случай моделирования структурных уравнений (SEM) — в котором для каждой из переменных в каузальной модели используются только отдельные индикаторы. То есть путевой анализ — это SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения путевого анализа, включают каузальное моделирование и анализ ковариационных структур.
Джуда Перл считает, что анализ пути является прямым предком методов причинно-следственной связи . [1]
Анализ путей был разработан около 1918 года генетиком Сьюэллом Райтом , который более подробно писал о нем в 1920-х годах. [2] [3] С тех пор он применялся к широкому спектру областей сложного моделирования, включая биологию , [4] психологию , социологию и эконометрику . [5]
Обычно модели путей состоят из независимых и зависимых переменных, графически изображенных в виде блоков или прямоугольников. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных лежат на внешних краях модели и имеют только односторонние стрелки, выходящие из них. Ни одна односторонняя стрелка не указывает на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или являются как независимыми, так и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну одностороннюю стрелку, указывающую на них.
В модели ниже две экзогенные переменные (Ex 1 и Ex 2 ) моделируются как коррелирующие , как показано двунаправленной стрелкой. Обе эти переменные оказывают прямое и косвенное (через En 1 ) влияние на En 2 (две зависимые или «эндогенные» переменные/факторы). В большинстве моделей реального мира на эндогенные переменные могут также влиять переменные и факторы, вытекающие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты показаны в модели с помощью «e» или терминов ошибки.
Используя те же переменные, можно представить себе альтернативные модели. Например, можно предположить, что Ex 1 оказывает только косвенное влияние на En 2 , удалив стрелку от Ex 1 к En 2 ; и вероятность или «подгонку» этих двух моделей можно сравнить статистически.
Для того чтобы правильно рассчитать взаимосвязь между любыми двумя блоками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути [6] для расчета корреляции между двумя переменными. Корреляция равна сумме вкладов всех путей, через которые связаны две переменные. Сила каждого из этих вносящих вклад путей рассчитывается как произведение коэффициентов путей вдоль этого пути.
Правила трассировки пути следующие:
Опять же, ожидаемая корреляция, обусловленная каждой цепочкой, прослеженной между двумя переменными, является произведением стандартизированных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих участвующих цепочек путей.
Примечание : Правила Райта предполагают модель без петель обратной связи: ориентированный граф модели не должен содержать циклов , т.е. это ориентированный ациклический граф , который был подробно изучен в рамках причинного анализа Джуди Перл .
Если моделируемые переменные не были стандартизированы, дополнительное правило позволяет рассчитывать ожидаемые ковариации, если не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.
Самый простой случай получается, когда все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам выше, вычисляйте ожидаемые ковариации по:
Если остаточные дисперсии явно не включены или, как более общее решение, при любом изменении направления, встречающемся на маршруте (за исключением двусторонних стрелок), включите дисперсию переменной в точке изменения. То есть, при отслеживании пути от зависимой переменной к независимой переменной, включите дисперсию независимой переменной, за исключением случаев, когда это нарушит правило 1 выше (прохождение через соседние наконечники стрелок: т. е. когда независимая переменная также соединяется с двусторонней стрелкой, соединяющей ее с другой независимой переменной). При выводе дисперсий (что необходимо в случае, когда они явно не моделируются), путь от зависимой переменной к независимой переменной и обратно учитывается только один раз.