Каноническая форма Вейра

Матричная каноническая форма
На изображении показан пример общей матрицы Вейра, состоящей из двух блоков, каждый из которых является базовой матрицей Вейра. Базовая матрица Вейра в верхнем левом углу имеет структуру (4,2,1), а другая имеет структуру (2,2,1,1).

В математике , в линейной алгебре , каноническая форма Вейра (или форма Вейра или матрица Вейра ) — это квадратная матрица , которая (в некотором смысле) индуцирует «хорошие» свойства с матрицами, с которыми она коммутирует. Она также имеет особенно простую структуру, и условия обладания формой Вейра довольно слабы, что делает ее подходящим инструментом для изучения классов коммутирующих матриц. Говорят, что квадратная матрица находится в канонической форме Вейра , если матрица имеет структуру, определяющую каноническую форму Вейра. Форма Вейра была открыта чешским математиком Эдуардом Вейром в 1885 году. [1] [2] [3] Форма Вейра не стала популярной среди математиков и была затмена тесно связанной, но отличной канонической формой, известной под названием жордановой канонической формой . [3] Форма Вейра была переоткрыта несколько раз с момента ее первоначального открытия в 1885 году. [4] Эта форма по-разному называлась модифицированной формой Жордана, переупорядоченной формой Жордана, второй формой Жордана и H-формой . [4] Текущая терминология приписывается Шапиро, который ввел ее в статье, опубликованной в American Mathematical Monthly в 1999 году. [4] [5]

Недавно было найдено несколько приложений для матрицы Вейра. Особый интерес представляет применение матрицы Вейра в изучении филогенетических инвариантов в биоматематике .

Определения

Базовая матрица Вейра

Определение

Базовая матрица Вейра с собственным значением — это матрица следующего вида: Существует целочисленное разбиение λ {\displaystyle \лямбда} н × н {\displaystyle n\times n} Вт {\displaystyle W}

н 1 + н 2 + + н г = н {\displaystyle n_{1}+n_{2}+\cdots +n_{r}=n} из с н {\displaystyle n} н 1 н 2 н г 1 {\displaystyle n_{1}\geq n_{2}\geq \cdots \geq n_{r}\geq 1}

таким образом, что при рассмотрении в виде блочной матрицы , где блок является матрицей, присутствуют следующие три особенности: Вт {\displaystyle W} г × г {\displaystyle r\times r} ( Вт я дж ) {\displaystyle (W_{ij})} ( я , дж ) {\displaystyle (я,j)} Вт я дж {\displaystyle W_{ij}} н я × н дж {\displaystyle n_{i}\times n_{j}}

  1. Главные диагональные блоки представляют собой скалярные матрицы для . Вт я я {\displaystyle W_{ii}} н я × н я {\displaystyle n_{i}\times n_{i}} λ я {\displaystyle \лямбда I} я = 1 , , г {\displaystyle i=1,\ldots ,r}
  2. Первые супердиагональные блоки представляют собой матрицы полных рангов столбцов в приведенной ступенчатой ​​форме (то есть единичная матрица, за которой следуют нулевые строки) для . Вт я , я + 1 {\displaystyle W_{i,i+1}} н я × н я + 1 {\displaystyle n_{i}\times n_{i+1}} я = 1 , , г 1 {\displaystyle i=1,\ldots ,r-1}
  3. Все остальные блоки W равны нулю (то есть, когда ). Вт я дж = 0 {\displaystyle W_{ij}=0} дж я , я + 1 {\displaystyle j\neq i,i+1}

В этом случае мы говорим, что имеет структуру Вейра . Вт {\displaystyle W} ( н 1 , н 2 , , н г ) {\displaystyle (n_{1},n_{2},\ldots ,n_{r})}

Пример

Ниже приведен пример базовой матрицы Вейра.

Вт = {\displaystyle W=} Базовая матрица Вейра со структурой (4,2,2,1) = [ Вт 11 Вт 12 Вт 22 Вт 23 Вт 33 Вт 34 Вт 44 ] {\displaystyle ={\begin{bmatrix}W_{11}&W_{12}&&\\&W_{22}&W_{23}&\\&&W_{33}&W_{34}\\&&&W_{44}\\\end {bmatrix}}}

В этой матрице и . Так же и структура Вейра . Также, н = 9 {\displaystyle n=9} н 1 = 4 , н 2 = 2 , н 3 = 2 , н 4 = 1 {\displaystyle n_{1}=4,n_{2}=2,n_{3}=2,n_{4}=1} Вт {\displaystyle W} ( 4 , 2 , 2 , 1 ) {\displaystyle (4,2,2,1)}

Вт 11 = [ λ 0 0 0 0 λ 0 0 0 0 λ 0 0 0 0 λ ] = λ я 4 , Вт 22 = [ λ 0 0 λ ] = λ я 2 , Вт 33 = [ λ 0 0 λ ] = λ я 2 , Вт 44 = [ λ ] = λ я 1 {\displaystyle W_{11}={\begin{bmatrix}\lambda &0&0&0\\0&\lambda &0&0\\0&0&\lambda &0\\0&0&\lambda \\\end{bmatrix}}=\lambda I_{4},\quad W_{22}={\begin{bmatrix}\lambda &0\\0&\lambda &\\\end{bmatrix}}=\lambda I_{2},\quad W_{33}={\begin{bmatrix}\lambda &0\\0&\lambda &\\\end{bmatrix}}=\lambda I_{2},\quad W_{44}={\begin{bmatrix}\lambda \\\end{bmatrix}}=\lambda I_{1}}

и

Вт 12 = [ 1 0 0 1 0 0 0 0 ] , Вт 23 = [ 1 0 0 1 ] , Вт 34 = [ 1 0 ] . {\displaystyle W_{12}={\begin{bmatrix}1&0\\0&1\\0&0\\0&0\\end{bmatrix}},\quad W_{23}={\begin{bmatrix}1&0\\0&1\\end{bmatrix}},\quad W_{34}={\begin{bmatrix}1\\0\\\end{bmatrix}}.}

Общая матрица Вейра

Определение

Пусть будет квадратной матрицей и пусть будут различными собственными значениями . Мы говорим, что находится в форме Вейра (или является матрицей Вейра), если имеет следующий вид: Вт {\displaystyle W} λ 1 , , λ к {\displaystyle \lambda _{1},\ldots ,\lambda _{k}} Вт {\displaystyle W} Вт {\displaystyle W} Вт {\displaystyle W}

Вт = [ Вт 1 Вт 2 Вт к ] {\displaystyle W={\begin{bmatrix}W_{1}&&&\\&W_{2}&&\\&&\ddots &\\&&&W_{k}\\\end{bmatrix}}}

где — базовая матрица Вейра с собственным значением для . Вт я {\displaystyle W_{i}} λ я {\displaystyle \лямбда _{я}} я = 1 , , к {\displaystyle i=1,\ldots ,k}

Пример

На следующем рисунке показан пример общей матрицы Вейра, состоящей из трех базовых блоков матрицы Вейра. Базовая матрица Вейра в верхнем левом углу имеет структуру (4,2,1) с собственным значением 4, средний блок имеет структуру (2,2,1,1) с собственным значением -3, а блок в нижнем правом углу имеет структуру (3, 2) с собственным значением 0.

Связь между формами Вейра и Джордана

Каноническая форма Вейра связана с формой Жордана простой перестановкой для каждого базового блока Вейра следующим образом: Первый индекс каждого подблока Вейра образует наибольшую цепь Жордана. После вычеркивания этих строк и столбцов первый индекс каждого нового подблока образует вторую по величине цепь Жордана и т. д. [6] Вт = П 1 Дж. П {\displaystyle W=P^{-1}JP} Дж. {\displaystyle J} П {\displaystyle P}

Форма Вейра является канонической.

То, что форма Вейра является канонической формой матрицы, является следствием следующего результата: [3] Каждая квадратная матрица над алгебраически замкнутым полем подобна матрице Вейра, которая уникальна с точностью до перестановки ее базовых блоков. Матрица называется формой Вейра (канонической) . А {\displaystyle А} Вт {\displaystyle W} Вт {\displaystyle W} А {\displaystyle А}

Вычисление канонической формы Вейра

Редукция к нильпотентному случаю

Пусть будет квадратной матрицей порядка над алгебраически замкнутым полем и пусть различные собственные значения будут . Теорема разложения Жордана–Шевалле утверждает, что подобна блочно -диагональной матрице вида А {\displaystyle А} н {\displaystyle n} А {\displaystyle А} λ 1 , λ 2 , , λ к {\displaystyle \lambda _{1},\lambda _{2},\ldots ,\lambda _{k}} А {\displaystyle А}

А = [ λ 1 я + Н 1 λ 2 я + Н 2 λ к я + Н к ] = [ λ 1 я λ 2 я λ к я ] + [ Н 1 Н 2 Н к ] = Д + Н {\displaystyle A={\begin{bmatrix}\lambda _{1}I+N_{1}&&&\\&\lambda _{2}I+N_{2}&&\\&&\ddots &\\&&&\lambda _{k}I+N_{k}\\\end{bmatrix}}={\begin{bmatrix}\lambda _{1}I&&&\\&\lambda _{2}I&&\\&&\ddots &\\&&&\lambda _{k}I\\\end{bmatrix}}+{\begin{bmatrix}N_{1}&&&\\&N_{2}&&\\&&\ddots &\\&&&N_{k}\\\end{bmatrix}}=D+N}

где — диагональная матрица , — нильпотентная матрица , и , что оправдывает сведение к подблокам . Таким образом, проблема приведения к форме Вейра сводится к проблеме приведения нильпотентных матриц к форме Вейра. Это приводит к обобщенной теореме о разложении собственного пространства . D {\displaystyle D} N {\displaystyle N} [ D , N ] = 0 {\displaystyle [D,N]=0} N {\displaystyle N} N i {\displaystyle N_{i}} A {\displaystyle A} N i {\displaystyle N_{i}}

Приведение нильпотентной матрицы к форме Вейра

Для нильпотентной квадратной матрицы порядка над алгебраически замкнутым полем следующий алгоритм создает обратимую матрицу и матрицу Вейра, такие что . A {\displaystyle A} n {\displaystyle n} F {\displaystyle F} C {\displaystyle C} W {\displaystyle W} W = C 1 A C {\displaystyle W=C^{-1}AC}

Шаг 1

Позволять A 1 = A {\displaystyle A_{1}=A}

Шаг 2

  1. Вычислить базис для нулевого пространства . A 1 {\displaystyle A_{1}}
  2. Расширим базис для нулевого пространства до базиса для -мерного векторного пространства . A 1 {\displaystyle A_{1}} n {\displaystyle n} F n {\displaystyle F^{n}}
  3. Сформируем матрицу, состоящую из этих базисных векторов. P 1 {\displaystyle P_{1}}
  4. Вычислить . — квадратная матрица размера − nullity . P 1 1 A 1 P 1 = [ 0 B 2 0 A 2 ] {\displaystyle P_{1}^{-1}A_{1}P_{1}={\begin{bmatrix}0&B_{2}\\0&A_{2}\end{bmatrix}}} A 2 {\displaystyle A_{2}} n {\displaystyle n} ( A 1 ) {\displaystyle (A_{1})}

Шаг 3

Если ненулевое значение, повторите шаг 2 . A 2 {\displaystyle A_{2}} A 2 {\displaystyle A_{2}}

  1. Вычислить базис для нулевого пространства . A 2 {\displaystyle A_{2}}
  2. Расширим базис для нулевого пространства до базиса для векторного пространства, имеющего размерность − нуль . A 2 {\displaystyle A_{2}} n {\displaystyle n} ( A 1 ) {\displaystyle (A_{1})}
  3. Сформируем матрицу, состоящую из этих базисных векторов. P 2 {\displaystyle P_{2}}
  4. Вычислить . — квадратная матрица размера − nullity − nullity . P 2 1 A 2 P 2 = [ 0 B 3 0 A 3 ] {\displaystyle P_{2}^{-1}A_{2}P_{2}={\begin{bmatrix}0&B_{3}\\0&A_{3}\end{bmatrix}}} A 2 {\displaystyle A_{2}} n {\displaystyle n} ( A 1 ) {\displaystyle (A_{1})} ( A 2 ) {\displaystyle (A_{2})}

Шаг 4

Продолжайте процессы шагов 1 и 2 для получения все меньших квадратных матриц и связанных с ними обратимых матриц, пока не получите первую нулевую матрицу . A 1 , A 2 , A 3 , {\displaystyle A_{1},A_{2},A_{3},\ldots } P 1 , P 2 , P 3 , {\displaystyle P_{1},P_{2},P_{3},\ldots } A r {\displaystyle A_{r}}

Шаг 5

Структура Вейра имеет вид, где = nullity . A {\displaystyle A} ( n 1 , n 2 , , n r ) {\displaystyle (n_{1},n_{2},\ldots ,n_{r})} n i {\displaystyle n_{i}} ( A i ) {\displaystyle (A_{i})}

Шаг 6

  1. Вычислите матрицу (здесь '' — это единичные матрицы соответствующего размера). P = P 1 [ I 0 0 P 2 ] [ I 0 0 P 3 ] [ I 0 0 P r ] {\displaystyle P=P_{1}{\begin{bmatrix}I&0\\0&P_{2}\end{bmatrix}}{\begin{bmatrix}I&0\\0&P_{3}\end{bmatrix}}\cdots {\begin{bmatrix}I&0\\0&P_{r}\end{bmatrix}}} I {\displaystyle I}
  2. Вычислить . — это матрица следующего вида: X = P 1 A P {\displaystyle X=P^{-1}AP} X {\displaystyle X}
X = [ 0 X 12 X 13 X 1 , r 1 X 1 r 0 X 23 X 2 , r 1 X 2 r 0 X r 1 , r 0 ] {\displaystyle X={\begin{bmatrix}0&X_{12}&X_{13}&\cdots &X_{1,r-1}&X_{1r}\\&0&X_{23}&\cdots &X_{2,r-1}&X_{2r}\\&&&\ddots &\\&&&\cdots &0&X_{r-1,r}\\&&&&&0\end{bmatrix}}} .

Шаг 7

Используйте элементарные операции над строками, чтобы найти обратимую матрицу подходящего размера, такую, чтобы произведение было матрицей вида . Y r 1 {\displaystyle Y_{r-1}} Y r 1 X r , r 1 {\displaystyle Y_{r-1}X_{r,r-1}} I r , r 1 = [ I O ] {\displaystyle I_{r,r-1}={\begin{bmatrix}I\\O\end{bmatrix}}}

Шаг 8

Установите diag и compute . В этой матрице -блок равен . Q 1 = {\displaystyle Q_{1}=} ( I , I , , Y r 1 1 , I ) {\displaystyle (I,I,\ldots ,Y_{r-1}^{-1},I)} Q 1 1 X Q 1 {\displaystyle Q_{1}^{-1}XQ_{1}} ( r , r 1 ) {\displaystyle (r,r-1)} I r , r 1 {\displaystyle I_{r,r-1}}

Шаг 9

Найдите матрицу, образованную как произведение элементарных матриц, такую, что — это матрица, в которой все блоки выше блока содержат только символы . R 1 {\displaystyle R_{1}} R 1 1 Q 1 1 X Q 1 R 1 {\displaystyle R_{1}^{-1}Q_{1}^{-1}XQ_{1}R_{1}} I r , r 1 {\displaystyle I_{r,r-1}} 0 {\displaystyle 0}

Шаг 10

Повторите шаги 8 и 9 для преобразования столбцов -блока в через сопряжение некоторой обратимой матрицей . Используйте этот блок, чтобы очистить блоки выше, через сопряжение произведением элементарных матриц. r 1 {\displaystyle r-1} ( r 1 , r 2 ) {\displaystyle (r-1,r-2)} I r 1 , r 2 {\displaystyle I_{r-1,r-2}} Q 2 {\displaystyle Q_{2}} R 2 {\displaystyle R_{2}}

Шаг 11

Повторите эти процессы для столбцов, используя сопряжения по . Результирующая матрица теперь имеет форму Вейра. r 2 , r 3 , , 3 , 2 {\displaystyle r-2,r-3,\ldots ,3,2} Q 3 , R 3 , , Q r 2 , R r 2 , Q r 1 {\displaystyle Q_{3},R_{3},\ldots ,Q_{r-2},R_{r-2},Q_{r-1}} W {\displaystyle W}

Шаг 12

Пусть . Тогда . C = P 1 diag ( I , P 2 ) diag ( I , P r 1 ) Q 1 R 1 Q 2 R r 2 Q r 1 {\displaystyle C=P_{1}{\text{diag}}(I,P_{2})\cdots {\text{diag}}(I,P_{r-1})Q_{1}R_{1}Q_{2}\cdots R_{r-2}Q_{r-1}} W = C 1 A C {\displaystyle W=C^{-1}AC}

Применение формы Вейра

Некоторые известные применения формы Вейра перечислены ниже: [3]

  1. Форму Вейра можно использовать для упрощения доказательства теоремы Герстенхабера, которая утверждает, что подалгебра, порожденная двумя коммутирующими матрицами, имеет размерность не более . n × n {\displaystyle n\times n} n {\displaystyle n}
  2. Говорят, что набор конечных матриц приблизительно одновременно диагонализируем, если их можно преобразовать в одновременно диагонализируемые матрицы. Форма Вейра используется для доказательства приблизительно одновременной диагонализируемости различных классов матриц. Свойство приблизительно одновременной диагонализируемости имеет приложения в изучении филогенетических инвариантов в биоматематике .
  3. Форму Вейра можно использовать для упрощения доказательств неприводимости многообразия всех k -кортежей коммутирующих комплексных матриц.

Ссылки

  1. ^ Эдуард Вейр (1885). «Перераспределение матриц в особых случаях и формирование всех особенных» (PDF) . Comptes Rendus de l'Académie des Sciences de Paris . 100 : 966–969 . Проверено 10 декабря 2013 г.
  2. ^ Эдуард Вейр (1890). «Теория билинейных форм». Монашефте по математике и физике . 1 : 163–236.
  3. ^ abcd Кевин С. Мира; Джон Кларк; Чарльз И. Винсонхалер (2011). Продвинутые темы линейной алгебры: решение матричных задач с помощью формы Вейра . Oxford University Press.
  4. ^ abc Кевин С. Мира; Джон Кларк; Чарльз И. Винсонхалер (2011). Advanced Topics in Linear Algebra: Weaving Matrix Problems through the Weyr Form . Oxford University Press. С. 44, 81–82.
  5. ^ Шапиро, Х. (1999). «Характеристика Вейра» (PDF) . The American Mathematical Monthly . 106 (10): 919–929. doi :10.2307/2589746. JSTOR  2589746. S2CID  56072601.
  6. ^ Сергейчук, «Канонические матрицы для линейных матричных задач», Arxiv:0709.2485 [math.RT], 2007
Retrieved from "https://en.wikipedia.org/w/index.php?title=Weyr_canonical_form&oldid=1211275465"