разложение Шура

Факторизация матриц в математике

В математической дисциплине линейной алгебры разложение Шура или триангуляция Шура , названная в честь Иссая Шура , является матричным разложением . Оно позволяет записать произвольную комплексную квадратную матрицу как унитарно подобную верхней треугольной матрице , диагональные элементы которой являются собственными значениями исходной матрицы.

Заявление

Комплексное разложение Шура выглядит следующим образом: если Aквадратная матрица n × n с комплексными элементами, то A можно выразить как [1] ​​[2] [3] для некоторой унитарной матрицы Q (так что обратная Q −1 также является сопряженной транспонированной Q * матрицы Q ) и некоторой верхней треугольной матрицы U . Это называется формой Шура матрицы A . Поскольку U подобна A , она имеет тот же спектр , и поскольку она треугольная, ее собственные значения являются диагональными элементами матрицы U . А = В У В 1 {\displaystyle A=QUQ^{-1}}

Разложение Шура подразумевает, что существует вложенная последовательность A -инвариантных подпространств {0} = V 0V 1 ⊂ ⋯ ⊂ V n = C n , и что существует упорядоченный ортонормированный базис (для стандартной эрмитовой формы C n ) , такой что первые i базисных векторов охватывают V i для каждого i, встречающегося во вложенной последовательности. Выражаясь несколько иначе, первая часть говорит, что линейный оператор J на ​​комплексном конечномерном векторном пространстве стабилизирует полный флаг ( V 1 , ..., V n ) .

Существует также вещественное разложение Шура. Если Aквадратная матрица n × n с вещественными элементами, то A можно выразить как [4] , где Qортогональная матрица , а H — либо верхняя, либо нижняя квазитреугольная. Квазитреугольная матрица — это матрица, которая, будучи выражена как блочная матрица из блоков 2 × 2 и 1 × 1, является треугольной. Это более сильное свойство, чем свойство Хессенберга . Как и в комплексном случае, семейство коммутирующих вещественных матриц { A i } может быть одновременно приведено к квазитреугольной форме с помощью ортогональной матрицы. Существует ортогональная матрица Q такая, что для каждого A i в данном семействе является верхней квазитреугольной. А = В ЧАС В 1 {\displaystyle A=QHQ^{-1}} ЧАС я = В А я В 1 {\displaystyle H_{i}=QA_{i}Q^{-1}}

Доказательство

Конструктивное доказательство разложения Шура выглядит следующим образом: каждый оператор A в комплексном конечномерном векторном пространстве имеет собственное значение λ , соответствующее некоторому собственному пространству V λ . Пусть V λ — его ортогональное дополнение. Ясно, что относительно этого ортогонального разложения A имеет матричное представление (здесь можно выбрать любые ортонормированные базисы Z 1 и Z 2 , охватывающие V λ и V λ соответственно), где I λ — тождественный оператор на V λ . Вышеуказанная матрица была бы верхнетреугольной, за исключением блока A 22 . Но точно такую ​​же процедуру можно применить к подматрице A 22 , рассматриваемой как оператор на V λ , и ее подматрицам. Продолжайте таким образом, пока результирующая матрица не станет верхнетреугольной. Поскольку каждое сопряжение увеличивает размерность верхнетреугольного блока по крайней мере на единицу, этот процесс занимает не более n шагов. Таким образом, пространство C n будет исчерпано, и процедура даст желаемый результат. [5] [ З 1 З 2 ] А [ З 1 З 2 ] = [ λ я λ А 12 0 А 22 ] : В λ В λ В λ В λ {\displaystyle {\begin{bmatrix}Z_{1}&Z_{2}\end{bmatrix}}^{*}A{\begin{bmatrix}Z_{1}&Z_{2}\end{bmatrix}}={\begin{bmatrix}\lambda \,I_{\lambda }&A_{12}\\0&A_{22}\end{bmatrix}}:{\begin{matrix}V_{\lambda }\\\oplus \\V_{\lambda }^{\perp }\end{matrix}}\rightarrow {\begin{matrix}V_{\lambda }\\\oplus \\V_{\lambda }^{\perp }\end{matrix}}}

Вышеприведенный аргумент можно немного переформулировать следующим образом: пусть λ будет собственным значением A , соответствующим некоторому собственному подпространству V λ . A индуцирует оператор T на факторпространстве C n / V λ . Этот оператор является в точности подматрицей A 22 сверху. Как и прежде, T будет иметь собственное подпространство, скажем, W μC n по модулю V λ . Обратите внимание, что прообраз W μ под отображением фактора является инвариантным подпространством A , которое содержит V λ . Продолжайте таким образом, пока результирующее факторпространство не будет иметь размерность 0. Затем последовательные прообразы собственных подпространств, найденные на каждом шаге, образуют флаг, который A стабилизирует.

Примечания

Хотя каждая квадратная матрица имеет разложение Шура, в общем случае это разложение не является единственным. Например, собственное пространство V λ может иметь размерность > 1, и в этом случае любой ортонормированный базис для V λ приведет к желаемому результату.

Запишите треугольную матрицу U как U = D + N , где D диагональна, а N строго верхняя треугольная (и, таким образом, нильпотентная матрица ). Диагональная матрица D содержит собственные значения A в произвольном порядке (следовательно, ее норма Фробениуса, возведенная в квадрат, является суммой квадратов модулей собственных значений A , в то время как норма Фробениуса A , возведенная в квадрат, является суммой квадратов сингулярных значений A ). Нильпотентная часть N в общем случае также не является уникальной, но ее норма Фробениуса однозначно определяется A (просто потому, что норма Фробениуса A равна норме Фробениуса U = D + N ). [6]

Ясно, что если Aнормальная матрица , то U из ее разложения Шура должна быть диагональной матрицей , а векторы-столбцы Qсобственными векторами A. Следовательно , разложение Шура расширяет спектральное разложение . В частности, если A положительно определена , разложение Шура A , ее спектральное разложение и ее разложение по сингулярным значениям совпадают.

Коммутирующее семейство матриц { A i } может быть одновременно триангулировано, т. е. существует унитарная матрица Q такая, что для каждого A i в данном семействе QA i Q* является верхнетреугольным. Это можно легко вывести из приведенного выше доказательства. Возьмем элемент A из { A i } и снова рассмотрим собственное пространство V A . Тогда V A инвариантно относительно всех матриц из { A i }. Следовательно, все матрицы из { A i } должны иметь один общий собственный вектор в V A . Затем индукция доказывает утверждение. Как следствие, мы имеем, что каждое коммутирующее семейство нормальных матриц может быть одновременно диагонализовано .

В бесконечномерной ситуации не каждый ограниченный оператор в банаховом пространстве имеет инвариантное подпространство. Однако верхняя триангуляризация произвольной квадратной матрицы обобщается до компактных операторов . Каждый компактный оператор в комплексном банаховом пространстве имеет гнездо замкнутых инвариантных подпространств.

Вычисление

Разложение Шура заданной матрицы численно вычисляется алгоритмом QR или его вариантами. Другими словами, корни характеристического многочлена , соответствующего матрице, не обязательно вычисляются заранее для получения ее разложения Шура. Наоборот, алгоритм QR может быть использован для вычисления корней любого заданного характеристического многочлена путем нахождения разложения Шура его сопутствующей матрицы . Аналогично алгоритм QR используется для вычисления собственных значений любой заданной матрицы, которые являются диагональными элементами верхней треугольной матрицы разложения Шура. Хотя алгоритм QR формально является бесконечной последовательностью операций, сходимость к машинной точности практически достигается за счет операций. [7] См. раздел Nonsymmetric Eigenproblems в руководстве пользователя LAPACK . [8] О ( н 3 ) {\displaystyle {\mathcal {O}}(n^{3})}

Приложения

Приложения теории лжи включают в себя:

Обобщенное разложение Шура

Для квадратных матриц A и B обобщенное разложение Шура факторизует обе матрицы как и , где Q и Z являются унитарными , а S и T являются верхними треугольными . Обобщенное разложение Шура также иногда называют разложением QZ . [2] : 375  [9] А = В С З {\displaystyle A=QSZ^{*}} Б = В Т З {\displaystyle B=QTZ^{*}}

Обобщенные собственные значения , которые решают обобщенную задачу собственных значений (где x — неизвестный ненулевой вектор), можно вычислить как отношение диагональных элементов S к диагональным элементам T. То есть, используя нижние индексы для обозначения элементов матрицы, i- е обобщенное собственное значение удовлетворяет . λ {\displaystyle \лямбда} А х = λ Б х {\displaystyle A\mathbf {x} =\lambda B\mathbf {x} } λ я {\displaystyle \лямбда _{я}} λ я = С я я / Т я я {\displaystyle \lambda _{i}=S_{ii}/T_{ii}}

Ссылки

  1. ^ Хорн, РА и Джонсон, CR (1985). Матричный анализ . Издательство Кембриджского университета. ISBN 0-521-38632-2.(Раздел 2.3 и далее на стр. 79)
  2. ^ ab Голуб, GH и Ван Лоан, CF (1996). Матричные вычисления (3-е изд.). Издательство Университета Джонса Хопкинса. ISBN 0-8018-5414-8.(Раздел 7.7 на стр. 313)
  3. ^ Шотт, Джеймс Р. (2016). Матричный анализ для статистики (3-е изд.). Нью-Йорк: John Wiley & Sons. С.  175–178 . ISBN 978-1-119-09247-6.
  4. ^ Хорн, РА и Джонсон, CR (1985). Матричный анализ . Издательство Кембриджского университета. ISBN 0-521-38632-2.(Раздел 2.3 и далее на стр. 82)
  5. ^ Вагнер, Дэвид. "Доказательство теоремы Шура" (PDF) . Заметки по линейной алгебре .
  6. ^ Хайэм, Ник (11 мая 2022 г.). «Что такое разложение Шура?».
  7. ^ Трефетен, Ллойд Н.; Бау, Дэвид (1997). Численная линейная алгебра. Филадельфия: Общество промышленной и прикладной математики. С.  193–194 . ISBN 0-89871-361-7. OCLC  36084666.
  8. ^ Андерсон, Э; Бай, З; Бишоф, К; Блэкфорд, С; Деммель, Дж; Донгарра, Дж; Дю Кроз, Дж; Гринбаум, А; Хаммарлинг, С; Маккенни, А; Соренсен, Д. (1995). Руководство пользователя LAPACK. Филадельфия, Пенсильвания: Общество промышленной и прикладной математики. ISBN 0-89871-447-8.
  9. ^ Дэниел Кресснер: «Численные методы решения общих и структурированных задач на собственные значения», Глава 2, Springer, LNCSE-46 (2005).
Взято с "https://en.wikipedia.org/w/index.php?title=Schur_decomposition&oldid=1269572295"