Диагонализуемая матрица

Матрицы, подобные диагональным матрицам

В линейной алгебре квадратная матрица  называется диагонализируемой или недефектной , если она подобна диагональной матрице . То есть, если существует обратимая матрица  и диагональная матрица такие, что . Это эквивалентно . (Такие , не являются уникальными.) Это свойство существует для любой линейной карты: для конечномерного векторного пространства линейное отображение называется  диагонализируемым , если существует упорядоченный базис из ,  состоящий из собственных векторов . Эти определения эквивалентны: если  имеет матричное представление , как указано выше, то векторы-столбцы из  образуют базис, состоящий из собственных векторов , а диагональные элементы из  являются соответствующими собственными значениями ; относительно этого базиса собственных векторов представляется  как . А {\displaystyle А} П {\displaystyle P} Д {\displaystyle D} П 1 А П = Д {\displaystyle P^{-1}AP=D} А = П Д П 1 {\displaystyle A=PDP^{-1}} П {\displaystyle P} Д {\displaystyle D} В {\displaystyle V} Т : В В {\displaystyle T:V\to V} В {\displaystyle V} Т {\displaystyle Т} Т {\displaystyle Т} А = П Д П 1 {\displaystyle A=PDP^{-1}} П {\displaystyle P} Т {\displaystyle Т} Д {\displaystyle D} Т {\displaystyle Т} Т {\displaystyle Т} Д {\displaystyle D}

Диагонализация — это процесс нахождения выше  и и упрощает многие последующие вычисления. Можно возвести диагональную матрицу  в степень, просто возведя диагональные элементы в эту степень. Определитель диагональной матрицы — это просто произведение всех диагональных элементов. Такие вычисления легко обобщаются до . П {\displaystyle P} Д {\displaystyle D} Д {\displaystyle D} А = П Д П 1 {\displaystyle A=PDP^{-1}}

Геометрическое преобразование, представленное диагонализуемой матрицей, является неоднородным расширением (или анизотропным масштабированием ). То есть, оно может масштабировать пространство на разную величину в разных направлениях. Направление каждого собственного вектора масштабируется на коэффициент, заданный соответствующим собственным значением.

Квадратная матрица, которая не диагонализируется, называется дефектной . Может случиться, что матрица с действительными элементами будет дефектной над действительными числами, то есть это невозможно для любой обратимой и диагональной с действительными элементами, но это возможно с комплексными элементами, так что она диагонализируется над комплексными числами. Например, это случай общей матрицы вращения . А {\displaystyle А} А = П Д П 1 {\displaystyle A=PDP^{-1}} П {\displaystyle P} Д {\displaystyle D} А {\displaystyle А}

Многие результаты для диагонализуемых матриц справедливы только над алгебраически замкнутым полем (таким как комплексные числа). В этом случае диагонализуемые матрицы плотны в пространстве всех матриц, что означает, что любая дефектная матрица может быть деформирована в диагонализуемую матрицу малым возмущением ; а разложение Жордана–Шевалле утверждает, что любая матрица является однозначной суммой диагонализуемой матрицы и нильпотентной матрицы . Над алгебраически замкнутым полем диагонализуемые матрицы эквивалентны полупростым матрицам .

Определение

Квадратная матрица с элементами в поле называется диагонализируемой или бездефектной , если существует обратимая матрица (т.е. элемент общей линейной группы GL n ( F )), такая, что является диагональной матрицей. н × н {\displaystyle n\times n} А {\displaystyle А} Ф {\displaystyle F} н × н {\displaystyle n\times n} П {\displaystyle P} П 1 А П {\displaystyle P^{-1}AP}

Характеристика

Фундаментальный факт о диагонализируемых картах и ​​матрицах выражается следующим образом:

  • Матрица над полем диагонализуема тогда и только тогда, когда сумма размерностей ее собственных подпространств равна , что имеет место тогда и только тогда, когда существует базис из , состоящий из собственных векторов . Если такой базис найден, можно сформировать матрицу, имеющую эти базисные векторы в качестве столбцов, и это будет диагональная матрица, диагональные элементы которой являются собственными значениями . Матрица известна как модальная матрица для . н × н {\displaystyle n\times n} А {\displaystyle А} Ф {\displaystyle F} н {\displaystyle n} Ф н {\displaystyle F^{н}} А {\displaystyle А} П {\displaystyle P} П 1 А П {\displaystyle P^{-1}AP} А {\displaystyle А} П {\displaystyle P} А {\displaystyle А}
  • Линейная карта диагонализуема тогда и только тогда, когда сумма размерностей ее собственных подпространств равна , что имеет место тогда и только тогда, когда существует базис из , состоящий из собственных векторов . Относительно такого базиса будет представлена ​​диагональной матрицей. Диагональные элементы этой матрицы являются собственными значениями . Т : В В {\displaystyle T:V\to V} тусклый ( В ) {\displaystyle \dim(V)} В {\displaystyle V} Т {\displaystyle Т} Т {\displaystyle Т} Т {\displaystyle Т}

Часто бывает полезным следующее достаточное (но не необходимое) условие.

  • Матрица диагонализуема над полем , если она имеет различные собственные значения в , т.е. если ее характеристический многочлен имеет различные корни в ; однако обратное может быть ложным. Рассмотрим , которая имеет собственные значения 1, 2, 2 (не все различны) и диагонализируема с диагональной формой ( подобно ) и изменением базисной матрицы : Обратное неверно, когда имеет собственное пространство размерности выше 1. В этом примере собственное пространство , связанное с собственным значением 2, имеет размерность 2. н × н {\displaystyle n\times n} А {\displaystyle А} Ф {\displaystyle F} н {\displaystyle n} Ф {\displaystyle F} н {\displaystyle n} Ф {\displaystyle F} [ 1 3 1 3 5 1 3 3 1 ] , {\displaystyle {\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix}},} А {\displaystyle А} [ 1 0 0 0 2 0 0 0 2 ] {\displaystyle {\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix}}} П {\displaystyle P} [ 1 1 1 1 1 0 1 0 3 ] . {\displaystyle {\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.} А {\displaystyle А} А {\displaystyle А}
  • Линейное отображение с диагонализируемо, если оно имеет различные собственные значения, т.е. если его характеристический многочлен имеет различные корни в . Т : В В {\displaystyle T:V\to V} н = тусклый ( В ) {\displaystyle n=\dim(V)} н {\displaystyle n} н {\displaystyle n} Ф {\displaystyle F}

Пусть будет матрицей над . Если диагонализуема, то таковой является любая ее степень. Обратно, если обратима, алгебраически замкнута и диагонализуема для некоторой матрицы , которая не является целым кратным характеристики , то диагонализуема. Доказательство: Если диагонализуема, то аннулируется некоторым многочленом , который не имеет кратных корней (так как ) и делится на минимальный многочлен . А {\displaystyle А} Ф {\displaystyle F} А {\displaystyle А} А {\displaystyle А} Ф {\displaystyle F} А н {\displaystyle А^{н}} н {\displaystyle n} Ф {\displaystyle F} А {\displaystyle А} А н {\displaystyle А^{н}} А {\displaystyle А} ( х н λ 1 ) ( х н λ к ) {\displaystyle \left(x^{n}-\lambda _{1}\right)\cdots \left(x^{n}-\lambda _{k}\right)} λ j 0 {\displaystyle \lambda _{j}\neq 0} A {\displaystyle A}

Над комплексными числами почти каждая матрица диагонализуема. Точнее: множество комплексных матриц, которые не диагонализируемы над , рассматриваемое как подмножество , имеет нулевую меру Лебега . Можно также сказать, что диагонализуемые матрицы образуют плотное подмножество относительно топологии Зарисского : недиагонализуемые матрицы лежат внутри исчезающего множества дискриминанта характеристического многочлена, которое является гиперповерхностью . Из этого следует также плотность в обычной ( сильной ) топологии, заданной нормой . То же самое не верно над . C {\displaystyle \mathbb {C} } n × n {\displaystyle n\times n} C {\displaystyle \mathbb {C} } C n × n {\displaystyle \mathbb {C} ^{n\times n}} R {\displaystyle \mathbb {R} }

Разложение Жордана –Шевалле выражает оператор как сумму его полупростой (т.е. диагонализируемой) части и его нильпотентной части. Следовательно, матрица диагонализируема тогда и только тогда, когда ее нильпотентная часть равна нулю. Другими словами, матрица диагонализируема, если каждый блок в ее жордановой форме не имеет нильпотентной части; т.е. каждый «блок» является матрицей один за другим.

Диагонализация

Рассмотрим два следующих произвольных базиса и . Предположим, что существует линейное преобразование, представленное матрицей , которая записана относительно базиса E. Предположим также, что существует следующее собственное уравнение: E = { e i | i [ n ] } {\displaystyle E=\{{{\boldsymbol {e}}_{i}|\forall i\in [n]}\}} F = { α i | i [ n ] } {\displaystyle F=\{{{\boldsymbol {\alpha }}_{i}|\forall i\in [n]}\}} A E {\displaystyle A_{E}}

A E α E , i = λ i α E , i {\displaystyle A_{E}{\boldsymbol {\alpha }}_{E,i}=\lambda _{i}{\boldsymbol {\alpha }}_{E,i}}

Собственные альфа-векторы также записываются относительно базиса E. Поскольку множество F является как множеством собственных векторов для матрицы A, так и охватывает некоторое произвольное векторное пространство, то мы говорим, что существует матрица, которая является диагональной матрицей, аналогичной . Другими словами, является диагонализируемой матрицей, если матрица записана в базисе F. Мы выполняем вычисление смены базиса с помощью матрицы перехода , которая меняет базис с E на F следующим образом: D F {\displaystyle D_{F}} A E {\displaystyle A_{E}} A E {\displaystyle A_{E}} S {\displaystyle S}

D F = S E F   A E   S E 1 F {\displaystyle D_{F}=S_{E}^{F}\ A_{E}\ S_{E}^{-1F}} ,

где — матрица перехода от E-базиса к F-базису. Обратную матрицу можно приравнять к новой матрице перехода , которая меняет базис с F на E, и поэтому мы имеем следующее соотношение: S E F {\displaystyle S_{E}^{F}} P {\displaystyle P}

S E 1 F = P F E {\displaystyle S_{E}^{-1F}=P_{F}^{E}}

Обе матрицы и перехода обратимы. Таким образом, мы можем манипулировать матрицами следующим образом: Матрица будет обозначена как , что по-прежнему находится в E-базисе. Аналогично, диагональная матрица находится в F-базисе. S {\displaystyle S} P {\displaystyle P} D = S   A E   S 1 D = P 1   A E   P {\displaystyle {\begin{aligned}D=S\ A_{E}\ S^{-1}\\D=P^{-1}\ A_{E}\ P\end{aligned}}} A E {\displaystyle A_{E}} A {\displaystyle A}

Диагонализацию симметричной матрицы можно интерпретировать как поворот осей для выравнивания их с собственными векторами.

Если матрицу можно диагонализировать, то есть A {\displaystyle A}

P 1 A P = [ λ 1 0 0 0 λ 2 0 0 0 λ n ] = D , {\displaystyle P^{-1}AP={\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}}=D,}

затем:

A P = P [ λ 1 0 0 0 λ 2 0 0 0 λ n ] . {\displaystyle AP=P{\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}}.}

Матрица перехода S имеет векторы базиса E в виде столбцов, записанных в базисе F. Обратно, обратная матрица перехода P имеет векторы базиса F, записанные в базисе E, так что мы можем представить P в виде блочной матрицы следующим образом: α i {\displaystyle {\boldsymbol {\alpha }}_{i}}

P = [ α E , 1 α E , 2 α E , n ] , {\displaystyle P={\begin{bmatrix}{\boldsymbol {\alpha }}_{E,1}&{\boldsymbol {\alpha }}_{E,2}&\cdots &{\boldsymbol {\alpha }}_{E,n}\end{bmatrix}},}

в результате мы можем записать: A [ α E , 1 α E , 2 α E , n ] = [ α E , 1 α E , 2 α E , n ] D . {\displaystyle {\begin{aligned}A{\begin{bmatrix}{\boldsymbol {\alpha }}_{E,1}&{\boldsymbol {\alpha }}_{E,2}&\cdots &{\boldsymbol {\alpha }}_{E,n}\end{bmatrix}}={\begin{bmatrix}{\boldsymbol {\alpha }}_{E,1}&{\boldsymbol {\alpha }}_{E,2}&\cdots &{\boldsymbol {\alpha }}_{E,n}\end{bmatrix}}D.\end{aligned}}}

В блочно-матричной форме мы можем рассматривать матрицу A как матрицу размерности 1x1, в то время как P — это матрица размерности 1xn. Матрица D может быть записана в полной форме со всеми диагональными элементами как матрица размерности nxn:

A [ α E , 1 α E , 2 α E , n ] = [ α E , 1 α E , 2 α E , n ] [ λ 1 0 0 0 λ 2 0 0 0 λ n ] . {\displaystyle A{\begin{bmatrix}{\boldsymbol {\alpha }}_{E,1}&{\boldsymbol {\alpha }}_{E,2}&\cdots &{\boldsymbol {\alpha }}_{E,n}\end{bmatrix}}={\begin{bmatrix}{\boldsymbol {\alpha }}_{E,1}&{\boldsymbol {\alpha }}_{E,2}&\cdots &{\boldsymbol {\alpha }}_{E,n}\end{bmatrix}}{\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}}.}

Выполняя указанное выше умножение матриц, мы получаем следующий результат: Взяв каждый компонент блочной матрицы по отдельности с обеих сторон, мы получаем следующее: A [ α 1 α 2 α n ] = [ λ 1 α 1 λ 2 α 2 λ n α n ] {\displaystyle {\begin{aligned}A{\begin{bmatrix}{\boldsymbol {\alpha }}_{1}&{\boldsymbol {\alpha }}_{2}&\cdots &{\boldsymbol {\alpha }}_{n}\end{bmatrix}}={\begin{bmatrix}\lambda _{1}{\boldsymbol {\alpha }}_{1}&\lambda _{2}{\boldsymbol {\alpha }}_{2}&\cdots &\lambda _{n}{\boldsymbol {\alpha }}_{n}\end{bmatrix}}\end{aligned}}}

A α i = λ i α i ( i = 1 , 2 , , n ) . {\displaystyle A{\boldsymbol {\alpha }}_{i}=\lambda _{i}{\boldsymbol {\alpha }}_{i}\qquad (i=1,2,\dots ,n).}

Итак, векторы-столбцы являются правыми собственными векторами , а соответствующая диагональная запись является соответствующим собственным значением . Обратимость также предполагает, что собственные векторы линейно независимы и образуют базис . Это необходимое и достаточное условие для диагонализуемости и канонического подхода к диагонализации. Векторы -строки являются левыми собственными векторами . P {\displaystyle P} A {\displaystyle A} P {\displaystyle P} F n {\displaystyle F^{n}} P 1 {\displaystyle P^{-1}} A {\displaystyle A}

Когда комплексная матрица является эрмитовой матрицей (или, в более общем случае, нормальной матрицей ), собственные векторы могут быть выбраны для формирования ортонормированного базиса , и могут быть выбраны для унитарной матрицы . Если, кроме того, является вещественной симметричной матрицей , то ее собственные векторы могут быть выбраны для формирования ортонормированного базиса , и могут быть выбраны для ортогональной матрицы . A C n × n {\displaystyle A\in \mathbb {C} ^{n\times n}} A {\displaystyle A} C n {\displaystyle \mathbb {C} ^{n}} P {\displaystyle P} A R n × n {\displaystyle A\in \mathbb {R} ^{n\times n}} R n {\displaystyle \mathbb {R} ^{n}} P {\displaystyle P}

Для большинства практических работ матрицы диагонализуют численно с помощью компьютерного программного обеспечения. Существует множество алгоритмов для достижения этого.

Одновременная диагонализация

Говорят, что набор матриц одновременно диагонализуем , если существует единственная обратимая матрица, такая что является диагональной матрицей для каждого в наборе. Следующая теорема характеризует одновременно диагонализируемые матрицы: Набор диагонализируемых матриц коммутирует тогда и только тогда, когда набор одновременно диагонализуем. [1] : стр. 64  P {\displaystyle P} P 1 A P {\displaystyle P^{-1}AP} A {\displaystyle A}

Множество всех диагонализируемых матриц (над ) с не является одновременно диагонализируемым. Например, матрицы n × n {\displaystyle n\times n} C {\displaystyle \mathbb {C} } n > 1 {\displaystyle n>1}

[ 1 0 0 0 ] and [ 1 1 0 0 ] {\displaystyle {\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{and}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}}

диагонализируемы, но не одновременно диагонализируемы, поскольку они не коммутируют.

Множество состоит из коммутирующих нормальных матриц тогда и только тогда, когда оно одновременно диагонализируется унитарной матрицей ; то есть существует унитарная матрица, такая что является диагональной для каждого из множества. U {\displaystyle U} U A U {\displaystyle U^{*}AU} A {\displaystyle A}

На языке теории Ли набор одновременно диагонализируемых матриц порождает торическую алгебру Ли .

Примеры

Диагонализуемые матрицы

  • Инволюции диагонализируемы над действительными числами (и, конечно, над любым полем характеристики, отличной от 2), с ±1 на диагонали.
  • Эндоморфизмы конечного порядка диагонализируемы над (или любым алгебраически замкнутым полем, где характеристика поля не делит порядок эндоморфизма) с корнями из единицы на диагонали. Это следует из того, что минимальный многочлен является сепарабельным , поскольку корни из единицы различны. C {\displaystyle \mathbb {C} }
  • Проекции диагонализируемы, с нулями и единицами на диагонали.
  • Действительные симметричные матрицы диагонализируемы ортогональными матрицами ; т. е., если задана действительная симметричная матрица , является диагональной для некоторой ортогональной матрицы . В более общем смысле, матрицы диагонализируемы унитарными матрицами тогда и только тогда, когда они нормальны . В случае действительной симметричной матрицы мы видим, что , поэтому очевидно выполняется. Примерами нормальных матриц являются действительные симметричные (или кососимметричные ) матрицы (например, ковариационные матрицы) и эрмитовы матрицы (или косоэрмитовы матрицы). См. спектральные теоремы для обобщений на бесконечномерные векторные пространства. A {\displaystyle A} Q T A Q {\displaystyle Q^{\mathrm {T} }AQ} Q {\displaystyle Q} A = A T {\displaystyle A=A^{\mathrm {T} }} A A T = A T A {\displaystyle AA^{\mathrm {T} }=A^{\mathrm {T} }A}

Матрицы, которые не диагонализируются

В общем случае матрица вращения не диагонализуема над вещественными числами, но все матрицы вращения диагонализируемы над комплексным полем. Даже если матрица не диагонализируема, всегда можно «сделать лучшее, что можно», и найти матрицу с теми же свойствами, состоящую из собственных значений на главной диагонали и либо единиц, либо нулей на наддиагонали – известную как жорданова нормальная форма .

Некоторые матрицы не диагонализируемы ни над каким полем, в частности, ненулевые нильпотентные матрицы . Это происходит в более общем случае, если алгебраическая и геометрическая кратности собственного значения не совпадают. Например, рассмотрим

C = [ 0 1 0 0 ] . {\displaystyle C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.}

Эта матрица не диагонализируема: не существует матрицы, которая является диагональной. Действительно, имеет одно собственное значение (а именно ноль), и это собственное значение имеет алгебраическую кратность 2 и геометрическую кратность 1. U {\displaystyle U} U 1 C U {\displaystyle U^{-1}CU} C {\displaystyle C}

Некоторые действительные матрицы не диагонализируемы над действительными числами. Рассмотрим, например, матрицу

B = [ 0 1 1 0 ] . {\displaystyle B=\left[{\begin{array}{rr}0&1\\\!-1&0\end{array}}\right].}

Матрица не имеет никаких действительных собственных значений, поэтому нет действительной матрицы , которая является диагональной матрицей. Однако мы можем диагонализировать, если допустим комплексные числа. Действительно, если мы возьмем B {\displaystyle B} Q {\displaystyle Q} Q 1 B Q {\displaystyle Q^{-1}BQ} B {\displaystyle B}

Q = [ 1 i i 1 ] , {\displaystyle Q={\begin{bmatrix}1&i\\i&1\end{bmatrix}},}

то диагональна. Легко найти, что это матрица вращения, которая вращается против часовой стрелки на угол Q 1 B Q {\displaystyle Q^{-1}BQ} B {\displaystyle B} θ = π 2 {\textstyle \theta =-{\frac {\pi }{2}}}

Обратите внимание, что приведенные выше примеры показывают, что сумма диагонализируемых матриц не обязательно должна быть диагонализируемой.

Как диагонализировать матрицу

Диагонализация матрицы — это тот же процесс, что и нахождение ее собственных значений и собственных векторов , в случае, если собственные векторы образуют базис. Например, рассмотрим матрицу

A = [ 0 1 2 0 1 0 1 1 3 ] . {\displaystyle A=\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right].}

Корни характеристического полинома являются собственными значениями . Решение линейной системы дает собственные векторы и , в то время как дает ; то есть, для . Эти векторы образуют базис , поэтому мы можем собрать их как векторы-столбцы матрицы изменения базиса, чтобы получить: Мы можем рассматривать это уравнение в терминах преобразований: переводит стандартный базис в собственный базис, , поэтому мы имеем: так что имеет стандартный базис в качестве собственных векторов, что является определяющим свойством . p ( λ ) = det ( λ I A ) {\displaystyle p(\lambda )=\det(\lambda I-A)} λ 1 = 1 , λ 2 = 1 , λ 3 = 2 {\displaystyle \lambda _{1}=1,\lambda _{2}=1,\lambda _{3}=2} ( I A ) v = 0 {\displaystyle \left(I-A\right)\mathbf {v} =\mathbf {0} } v 1 = ( 1 , 1 , 0 ) {\displaystyle \mathbf {v} _{1}=(1,1,0)} v 2 = ( 0 , 2 , 1 ) {\displaystyle \mathbf {v} _{2}=(0,2,1)} ( 2 I A ) v = 0 {\displaystyle \left(2I-A\right)\mathbf {v} =\mathbf {0} } v 3 = ( 1 , 0 , 1 ) {\displaystyle \mathbf {v} _{3}=(1,0,-1)} A v i = λ i v i {\displaystyle A\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}} i = 1 , 2 , 3 {\displaystyle i=1,2,3} V = R 3 {\displaystyle V=\mathbb {R} ^{3}} P {\displaystyle P} P 1 A P = [ 1 0 1 1 2 0 0 1 1 ] 1 [ 0 1 2 0 1 0 1 1 3 ] [ 1 0 1 1 2 0 0 1 1 ] = [ 1 0 0 0 1 0 0 0 2 ] = D . {\displaystyle P^{-1}AP=\left[{\begin{array}{rrr}1&0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right]\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]={\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}}=D.} P {\displaystyle P} P e i = v i {\displaystyle P\mathbf {e} _{i}=\mathbf {v} _{i}} P 1 A P e i = P 1 A v i = P 1 ( λ i v i ) = λ i e i , {\displaystyle P^{-1}AP\mathbf {e} _{i}=P^{-1}A\mathbf {v} _{i}=P^{-1}(\lambda _{i}\mathbf {v} _{i})=\lambda _{i}\mathbf {e} _{i},} P 1 A P {\displaystyle P^{-1}AP} D {\displaystyle D}

Обратите внимание, что в нет предпочтительного порядка собственных векторов ; изменение порядка собственных векторов в просто изменяет порядок собственных значений в диагонализованной форме . [2] P {\displaystyle P} P {\displaystyle P} A {\displaystyle A}

Применение к матричным функциям

Диагонализацию можно использовать для эффективного вычисления степеней матрицы : A = P D P 1 {\displaystyle A=PDP^{-1}}

A k = ( P D P 1 ) k = ( P D P 1 ) ( P D P 1 ) ( P D P 1 ) = P D ( P 1 P ) D ( P 1 P ) ( P 1 P ) D P 1 = P D k P 1 , {\displaystyle {\begin{aligned}A^{k}&=\left(PDP^{-1}\right)^{k}=\left(PDP^{-1}\right)\left(PDP^{-1}\right)\cdots \left(PDP^{-1}\right)\\&=PD\left(P^{-1}P\right)D\left(P^{-1}P\right)\cdots \left(P^{-1}P\right)DP^{-1}=PD^{k}P^{-1},\end{aligned}}}

и последнее легко вычислить, поскольку оно включает только степени диагональной матрицы. Например, для матрицы с собственными значениями в примере выше мы вычисляем: A {\displaystyle A} λ = 1 , 1 , 2 {\displaystyle \lambda =1,1,2}

A k = P D k P 1 = [ 1 0 1 1 2 0 0 1 1 ] [ 1 k 0 0 0 1 k 0 0 0 2 k ] [ 1 0 1 1 2 0 0 1 1 ] 1 = [ 2 2 k 1 + 2 k 2 2 k + 1 0 1 0 1 + 2 k 1 2 k 1 + 2 k + 1 ] . {\displaystyle {\begin{aligned}A^{k}=PD^{k}P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}1^{k}&0&0\\0&1^{k}&0\\0&0&2^{k}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2-2^{k}&-1+2^{k}&2-2^{k+1}\\0&1&0\\-1+2^{k}&1-2^{k}&-1+2^{k+1}\end{bmatrix}}.\end{aligned}}}

Этот подход можно обобщить на матричную экспоненциальную и другие матричные функции , которые можно определить как степенные ряды. Например, определяя , мы имеем: exp ( A ) = I + A + 1 2 ! A 2 + 1 3 ! A 3 + {\textstyle \exp(A)=I+A+{\frac {1}{2!}}A^{2}+{\frac {1}{3!}}A^{3}+\cdots }

exp ( A ) = P exp ( D ) P 1 = [ 1 0 1 1 2 0 0 1 1 ] [ e 1 0 0 0 e 1 0 0 0 e 2 ] [ 1 0 1 1 2 0 0 1 1 ] 1 = [ 2 e e 2 e + e 2 2 e 2 e 2 0 e 0 e + e 2 e e 2 e + 2 e 2 ] . {\displaystyle {\begin{aligned}\exp(A)=P\exp(D)P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}e^{1}&0&0\\0&e^{1}&0\\0&0&e^{2}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2e-e^{2}&-e+e^{2}&2e-2e^{2}\\0&e&0\\-e+e^{2}&e-e^{2}&-e+2e^{2}\end{bmatrix}}.\end{aligned}}}

Это особенно полезно при поиске выражений в замкнутой форме для членов линейных рекурсивных последовательностей , таких как числа Фибоначчи .

Частное применение

Например, рассмотрим следующую матрицу:

M = [ a b a 0 b ] . {\displaystyle M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.}

Расчет различных степеней выявляет удивительную закономерность: M {\displaystyle M}

M 2 = [ a 2 b 2 a 2 0 b 2 ] , M 3 = [ a 3 b 3 a 3 0 b 3 ] , M 4 = [ a 4 b 4 a 4 0 b 4 ] , {\displaystyle M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots }

Вышеуказанное явление можно объяснить диагонализацией . Для этого нам нужен базис, состоящий из собственных векторов . Один такой базис собственных векторов задается формулой M {\displaystyle M} R 2 {\displaystyle \mathbb {R} ^{2}} M {\displaystyle M}

u = [ 1 0 ] = e 1 , v = [ 1 1 ] = e 1 + e 2 , {\displaystyle \mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},}

где e i обозначает стандартный базис R n . Обратное изменение базиса задается формулой

e 1 = u , e 2 = v u . {\displaystyle \mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .}

Непосредственные расчеты показывают, что

M u = a u , M v = b v . {\displaystyle M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .}

Таким образом, a и b являются собственными значениями, соответствующими u и v соответственно. В силу линейности умножения матриц имеем, что

M n u = a n u , M n v = b n v . {\displaystyle M^{n}\mathbf {u} =a^{n}\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\mathbf {v} .}

Возвращаясь к стандартной основе, мы имеем

M n e 1 = M n u = a n e 1 , M n e 2 = M n ( v u ) = b n v a n u = ( b n a n ) e 1 + b n e 2 . {\displaystyle {\begin{aligned}M^{n}\mathbf {e} _{1}&=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},\\M^{n}\mathbf {e} _{2}&=M^{n}\left(\mathbf {v} -\mathbf {u} \right)=b^{n}\mathbf {v} -a^{n}\mathbf {u} =\left(b^{n}-a^{n}\right)\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.\end{aligned}}}

Предшествующие соотношения, выраженные в матричной форме, имеют вид

M n = [ a n b n a n 0 b n ] , {\displaystyle M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}},}

тем самым объясняя вышеуказанное явление.

Квантово-механическое приложение

В квантово-механических и квантово-химических вычислениях диагонализация матрицы является одним из наиболее часто применяемых численных процессов. Основная причина заключается в том, что независимое от времени уравнение Шредингера является уравнением собственных значений, хотя в большинстве физических ситуаций на бесконечномерном гильбертовом пространстве .

Очень распространенным приближением является усечение гильбертова пространства до конечной размерности, после чего уравнение Шредингера может быть сформулировано как задача на собственные значения действительной симметричной или комплексной эрмитовой матрицы. Формально это приближение основано на вариационном принципе , справедливом для гамильтонианов, ограниченных снизу.

Теория возмущений первого порядка также приводит к задаче на собственные значения матрицы для вырожденных состояний.

Смотрите также

Примечания

Ссылки

  1. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (2013). Матричный анализ, второе издание . Cambridge University Press. ISBN 9780521839402.
  2. ^ Антон, Х.; Роррес, К. (22 февраля 2000 г.). Elementary Linear Algebra (Applications Version) (8-е изд.). John Wiley & Sons. ISBN 978-0-471-17052-5.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Diagonalizable_matrix&oldid=1252700200"