В статистике матрица проекции [1] , иногда также называемая матрицей влияния [2] или матрицей шляпы , отображает вектор значений отклика (значений зависимой переменной) в вектор подобранных значений (или предсказанных значений). Она описывает влияние каждого значения отклика на каждое подобранное значение. [3] [4] Диагональные элементы матрицы проекции являются рычагами , которые описывают влияние каждого значения отклика на подобранное значение для того же наблюдения.
Определение
Если вектор значений отклика обозначить как , а вектор подобранных значений как ,
Как обычно произносится «й-хэт», проекционную матрицу также называют матрицей шляпы, поскольку она «надевает шляпу » .
Заявка на остатки
Формулу для вектора остатков можно также компактно выразить с помощью проекционной матрицы:
где — единичная матрица . Матрица иногда называется остаточной матрицей-мейкером или матрицей-аннигилятором .
Из рисунка видно, что ближайшая точка от вектора к пространству столбцов , это , и это та, где мы можем провести линию, ортогональную пространству столбцов . Вектор, ортогональный пространству столбцов матрицы, находится в нулевом пространстве транспонированной матрицы, поэтому
.
Оттуда перестраивается, так что
.
Следовательно, поскольку находится в пространстве столбцов , матрица проекции, которая отображается на , равна .
Линейная модель
Предположим, что мы хотим оценить линейную модель с использованием линейных наименьших квадратов. Модель может быть записана как
Когда веса для каждого наблюдения идентичны и ошибки некоррелированы, оценочные параметры равны
поэтому подобранные значения
Таким образом, матрица проекции (и матрица шляпы) определяется как
Взвешенные и обобщенные наименьшие квадраты
Вышесказанное можно обобщить на случаи, когда веса не идентичны и/или ошибки коррелируют. Предположим, что ковариационная матрица ошибок равна Σ . Тогда, поскольку
.
матрица шляпы, таким образом,
и снова можно увидеть, что , хотя теперь это уже не симметрично.
Характеристики
Матрица проекции обладает рядом полезных алгебраических свойств. [5] [6] На языке линейной алгебры матрица проекции представляет собой ортогональную проекцию на пространство столбцов матрицы проектирования . [4] (Обратите внимание, что это псевдообратная матрица X. ) Некоторые факты о матрице проекции в этой настройке суммируются следующим образом: [4]
и
симметричен, так же как и .
является идемпотентным: , и также является .
Если — матрица n × r с , то
Собственные значения состоят из r единиц и n − r нулей, тогда как собственные значения состоят из n − r единиц и r нулей. [7]
инвариантен относительно : следовательно .
является уникальным для определенных подпространств.
Для линейных моделей след матрицы проекции равен рангу , который представляет собой число независимых параметров линейной модели. [8] Для других моделей, таких как LOESS, которые по-прежнему линейны в наблюдениях , матрицу проекции можно использовать для определения эффективных степеней свободы модели.
Практические приложения проекционной матрицы в регрессионном анализе включают рычаг и расстояние Кука , которые связаны с выявлением влиятельных наблюдений , т. е. наблюдений, которые оказывают большое влияние на результаты регрессии.
Блочная формула
Предположим, что матрицу проектирования можно разложить по столбцам как . Определим оператор проекции или шляпу как . Аналогично, определим остаточный оператор как . Тогда матрицу проекции можно разложить следующим образом: [9]
где, например, и . Существует ряд приложений такого разложения. В классическом приложении — это столбец всех единиц, что позволяет анализировать эффекты добавления свободного члена к регрессии. Другое применение — в модели с фиксированными эффектами , где — большая разреженная матрица фиктивных переменных для фиксированных членов эффекта. Можно использовать это разбиение для вычисления матрицы шляпы без явного формирования матрицы , которая может быть слишком большой для размещения в памяти компьютера.
История
Матрица шляпы была введена Джоном Уайлдером в 1972 году. В статье Хоглина, Д.К. и Уэлша, Р.Э. (1978) приводятся свойства матрицы, а также множество примеров ее применения.
^ Базилевский, Александр (2005). Прикладная матричная алгебра в статистических науках. Довер. С. 160–176 . ISBN0-486-44538-0.
^ "Усвоение данных: диагностика влияния наблюдения на систему усвоения данных" (PDF) . Архивировано из оригинала (PDF) 2014-09-03.
^ ab Hoaglin, David C.; Welsch, Roy E. (февраль 1978 г.). «Матрица шляпы в регрессии и ANOVA» (PDF) . The American Statistician . 32 (1): 17– 22. doi :10.2307/2683469. hdl : 1721.1/1920 . JSTOR 2683469.