Центрирующая матрица

Вид матрицы

В математике и многомерной статистике центрирующая матрица [1] представляет собой симметричную и идемпотентную матрицу , которая при умножении на вектор имеет тот же эффект, что и вычитание среднего значения компонентов вектора из каждого компонента этого вектора.

Определение

Центрирующая матрица размера n определяется как матрица размером n на n .

C n = I n 1 n J n {\displaystyle C_{n}=I_{n}-{\tfrac {1}{n}}J_{n}}

где — единичная матрица размера n , а — матрица размером n на n, состоящая из всех единиц . I n {\displaystyle I_{n}\,} J n {\displaystyle J_{n}}

Например

C 1 = [ 0 ] {\displaystyle C_{1}={\begin{bmatrix}0\end{bmatrix}}} ,
C 2 = [ 1 0 0 1 ] 1 2 [ 1 1 1 1 ] = [ 1 2 1 2 1 2 1 2 ] {\displaystyle C_{2}=\left[{\begin{array}{rrr}1&0\\0&1\end{array}}\right]-{\frac {1}{2}}\left[{\begin{array}{rrr}1&1\\1&1\end{array}}\right]=\left[{\begin{array}{rrr}{\frac {1}{2}}&-{\frac {1}{2}}\\-{\frac {1}{2}}&{\frac {1}{2}}\end{array}}\right]} ,
C 3 = [ 1 0 0 0 1 0 0 0 1 ] 1 3 [ 1 1 1 1 1 1 1 1 1 ] = [ 2 3 1 3 1 3 1 3 2 3 1 3 1 3 1 3 2 3 ] {\displaystyle C_{3}=\left[{\begin{array}{rrr}1&0&0\\0&1&0\\0&0&1\end{array}}\right]-{\frac {1}{3}}\left[{\begin{array}{rrr}1&1&1\\1&1&1\\1&1&1\end{array}}\right]=\left[{\begin{array}{rrr}{\frac {2}{3}}&-{\frac {1}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&{\frac {2}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&-{\frac {1}{3}}&{\frac {2}{3}}\end{array}}\right]}

Характеристики

Для вектора-столбца размера n свойство центрирования можно выразить как v {\displaystyle \mathbf {v} \,} C n {\displaystyle C_{n}\,}

C n v = v ( 1 n J n , 1 T v ) J n , 1 {\displaystyle C_{n}\,\mathbf {v} =\mathbf {v} -({\tfrac {1}{n}}J_{n,1}^{\textrm {T}}\mathbf {v} )J_{n,1}}

где — вектор-столбец из единиц , а — среднее значение компонентов . J n , 1 {\displaystyle J_{n,1}} 1 n J n , 1 T v {\displaystyle {\tfrac {1}{n}}J_{n,1}^{\textrm {T}}\mathbf {v} } v {\displaystyle \mathbf {v} \,}

C n {\displaystyle C_{n}\,} является симметричным положительно полуопределенным .

C n {\displaystyle C_{n}\,} является идемпотентным , так что , для . После удаления среднего оно равно нулю, и его повторное удаление не имеет никакого эффекта. C n k = C n {\displaystyle C_{n}^{k}=C_{n}} k = 1 , 2 , {\displaystyle k=1,2,\ldots }

C n {\displaystyle C_{n}\,} является единственным . Эффект применения преобразования не может быть отменен. C n v {\displaystyle C_{n}\,\mathbf {v} }

C n {\displaystyle C_{n}\,} имеет собственное значение 1 кратности n  − 1 и собственное значение 0 кратности 1.

C n {\displaystyle C_{n}\,} имеет нулевое пространство размерности 1 вдоль вектора . J n , 1 {\displaystyle J_{n,1}}

C n {\displaystyle C_{n}\,} является ортогональной проекционной матрицей . То есть, является проекцией на ( n  − 1)-мерное подпространство , которое ортогонально нулевому пространству . (Это подпространство всех n -векторов, сумма компонентов которых равна нулю.) C n v {\displaystyle C_{n}\mathbf {v} } v {\displaystyle \mathbf {v} \,} J n , 1 {\displaystyle J_{n,1}}

След есть . C n {\displaystyle C_{n}} n ( n 1 ) / n = n 1 {\displaystyle n(n-1)/n=n-1}

Приложение

Хотя умножение на центрирующую матрицу не является вычислительно эффективным способом удаления среднего значения из вектора, это удобный аналитический инструмент. Его можно использовать не только для удаления среднего значения одного вектора, но и нескольких векторов, хранящихся в строках или столбцах матрицы m - на- n . X {\displaystyle X}

Умножение слева на вычитает соответствующее среднее значение из каждого из n столбцов, так что каждый столбец произведения имеет нулевое среднее значение. Аналогично, умножение справа вычитает соответствующее среднее значение из каждой из m строк, и каждая строка произведения имеет нулевое среднее значение. Умножение с обеих сторон создает дважды центрированную матрицу , средние значения строк и столбцов которой равны нулю. C m {\displaystyle C_{m}} C m X {\displaystyle C_{m}\,X} C n {\displaystyle C_{n}} X C n {\displaystyle X\,C_{n}} C m X C n {\displaystyle C_{m}\,X\,C_{n}}

Центрирующая матрица обеспечивает, в частности, лаконичный способ выражения матрицы рассеяния , выборки данных , где — выборочное среднее . Центрирующая матрица позволяет нам выразить матрицу рассеяния более компактно как S = ( X μ J n , 1 T ) ( X μ J n , 1 T ) T {\displaystyle S=(X-\mu J_{n,1}^{\mathrm {T} })(X-\mu J_{n,1}^{\mathrm {T} })^{\mathrm {T} }} X {\displaystyle X\,} μ = 1 n X J n , 1 {\displaystyle \mu ={\tfrac {1}{n}}XJ_{n,1}}

S = X C n ( X C n ) T = X C n C n X T = X C n X T . {\displaystyle S=X\,C_{n}(X\,C_{n})^{\mathrm {T} }=X\,C_{n}\,C_{n}\,X\,^{\mathrm {T} }=X\,C_{n}\,X\,^{\mathrm {T} }.}

C n {\displaystyle C_{n}} ковариационная матрица полиномиального распределения в частном случае, когда параметры этого распределения равны , и . k = n {\displaystyle k=n} p 1 = p 2 = = p n = 1 n {\displaystyle p_{1}=p_{2}=\cdots =p_{n}={\frac {1}{n}}}

Ссылки

  1. ^ Джон И. Марден, Анализ и моделирование ранговых данных , Chapman & Hall, 1995, ISBN  0-412-99521-2 , стр. 59.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Centering_matrix&oldid=1242793579"