Матричное дифференциальное уравнение

Связь матрицы переменных между двумя точками времени

Матричное разностное уравнение — это разностное уравнение , в котором значение вектора (или иногда матрицы) переменных в один момент времени связано с его собственным значением в один или несколько предыдущих моментов времени с помощью матриц . [1] [2] Порядок уравнения — это максимальный временной промежуток между любыми двумя указанными значениями вектора переменных. Например,

х т = А х т 1 + Б х т 2 {\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}}

является примером матричного дифференциального уравнения второго порядка, в котором x — вектор переменных размером n × 1 , а A и B — матрицы размером n × n . Это уравнение однородно, поскольку в конце уравнения не добавляется векторный постоянный член. Это же уравнение можно записать как

х т + 2 = А х т + 1 + Б х т {\displaystyle \mathbf {x} _{t+2}=\mathbf {Ax} _{t+1}+\mathbf {Bx} _{t}}

или как

х н = А х н 1 + Б х н 2 {\displaystyle \mathbf {x} _{n}=\mathbf {Ax} _{n-1}+\mathbf {Bx} _{n-2}}

Наиболее часто встречающиеся матричные разностные уравнения имеют первый порядок.

Неоднородный случай первого порядка и стационарное состояние

Примером неоднородного матричного разностного уравнения первого порядка является

х т = А х т 1 + б {\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {b} }

с аддитивным постоянным вектором b . Устойчивое состояние этой системы — это значение x * вектора x, которое, если достигнуто, не будет отклоняться от него впоследствии. x * находится путем подстановки x t = x t −1 = x * в разностное уравнение и решения относительно x * для получения

х = [ я А ] 1 б {\displaystyle \mathbf {x} ^{*}=[\mathbf {I} -\mathbf {A} ]^{-1}\mathbf {b} }

где Iединичная матрица n × n , и где предполагается, что [I − A] обратимо . Тогда неоднородное уравнение можно переписать в однородной форме в терминах отклонений от стационарного состояния:

[ х т х ] = А [ х т 1 х ] {\displaystyle \left[\mathbf {x} _{t}-\mathbf {x} ^{*}\right]=\mathbf {A} \left[\mathbf {x} _{t-1}-\mathbf {x} ^{*}\right]}

Устойчивость случая первого порядка

Матричное разностное уравнение первого порядка [ x tx *] = A [ x t −1x *] устойчиво , то есть x t асимптотически сходится к стационарному состоянию x * , тогда и только тогда, когда все собственные значения матрицы перехода A (действительные или комплексные) имеют абсолютное значение , меньшее 1.

Решение случая первого порядка

Предположим, что уравнение приведено к однородной форме y t = Ay t −1 . Тогда мы можем итерировать и подставлять многократно из начального условия y 0 , которое является начальным значением вектора y и которое должно быть известно для нахождения решения:

у 1 = А у 0 у 2 = А у 1 = А 2 у 0 у 3 = А у 2 = А 3 у 0 {\displaystyle {\begin{aligned}\mathbf {y} _{1}&=\mathbf {Ay} _{0} \\\mathbf {y} _{2} &=\mathbf {Ay} _{1 }=\mathbf {A} ^{2}\mathbf {y} _{0}\\\mathbf {y} _{3}&=\mathbf {Ay} _{2}=\mathbf {A} ^{ 3}\mathbf {y} _{0}\end{aligned}}}

и так далее, так что по математической индукции решение в терминах t равно

у т = А т у 0 {\displaystyle \mathbf {y} _{t}=\mathbf {A} ^{t}\mathbf {y} _{0}}

Далее, если A диагонализируемо, мы можем переписать A в терминах его собственных значений и собственных векторов , получив решение в виде

у т = П Д т П 1 у 0 , {\displaystyle \mathbf {y} _{t}=\mathbf {PD} ^{t}\mathbf {P} ^{-1}\mathbf {y} _{0},}

где P — матрица n × n , столбцы которой являются собственными векторами A (предполагая, что все собственные значения различны), а Dдиагональная матрица n × n, диагональные элементы которой являются собственными значениями A. Это решение мотивирует приведенный выше результат устойчивости: A t сжимается до нулевой матрицы с течением времени тогда и только тогда, когда все собственные значения A меньше единицы по абсолютной величине.

Извлечение динамики одной скалярной переменной из матричной системы первого порядка

Начиная с n -мерной системы y t = Ay t −1 , мы можем извлечь динамику одной из переменных состояния, скажем, y 1 . Вышеприведенное уравнение решения для y t показывает, что решение для y 1, t находится в терминах n собственных значений A . Поэтому уравнение, описывающее эволюцию y 1 само по себе должно иметь решение, включающее те же собственные значения. Это описание интуитивно мотивирует уравнение эволюции y 1 , которое является

у 1 , т = а 1 у 1 , т 1 + а 2 у 1 , т 2 + + а н у 1 , т н {\displaystyle y_{1,t}=a_{1}y_{1,t-1}+a_{2}y_{1,t-2}+\dots +a_{n}y_{1,tn}}

где параметры a i берутся из характеристического уравнения матрицы A :

λ н а 1 λ н 1 а 2 λ н 2 а н λ 0 = 0. {\displaystyle \lambda ^{n}-a_{1}\lambda ^{n-1}-a_{2}\lambda ^{n-2}-\dots -a_{n}\lambda ^{0}=0.}

Таким образом, каждая отдельная скалярная переменная n -мерной линейной системы первого порядка развивается в соответствии с одномерным разностным уравнением n -й степени, которое имеет то же свойство устойчивости (устойчивое или неустойчивое), что и матричное разностное уравнение.

Решение и устойчивость случаев высшего порядка

Матричные дифференциальные уравнения более высокого порядка, то есть с временным лагом больше одного периода, можно решить, а их устойчивость проанализировать, преобразовав их в форму первого порядка с помощью блочной матрицы (матрицы матриц). Например, предположим, что у нас есть уравнение второго порядка

х т = А х т 1 + Б х т 2 {\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}}

с переменным вектором x, равным n × 1 , и A и B, равными n × n . Это можно сложить в виде

[ х т х т 1 ] = [ А Б я 0 ] [ х т 1 х т 2 ] {\displaystyle {\begin{bmatrix}\mathbf {x} _{t}\\\mathbf {x} _{t-1}\\\end{bmatrix}}={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {I} &\mathbf {0} \\\end{bmatrix}}{\begin{bmatrix}\mathbf {x} _{t-1}\\\mathbf {x} _{t-2}\end{bmatrix}}}

где Iединичная матрица n × n , а 0нулевая матрица n × n . Тогда, обозначая сложенный вектор 2 n × 1 текущих и однократно запаздывающих переменных как z t и блочную матрицу 2 n × 2 n как L , мы имеем, как и прежде, решение

з т = Л т з 0 {\displaystyle \mathbf {z} _{t}=\mathbf {L} ^{t}\mathbf {z} _{0}}

Как и прежде, это составное уравнение, а значит, и исходное уравнение второго порядка, устойчивы тогда и только тогда, когда все собственные значения матрицы L по абсолютной величине меньше единицы.

Нелинейные матричные разностные уравнения: уравнения Риккати

В линейно-квадратично-гауссовском управлении возникает нелинейное матричное уравнение для обратной эволюции матрицы текущих и будущих затрат , обозначаемое ниже как H. Это уравнение называется дискретным динамическим уравнением Риккати , и оно возникает, когда переменный вектор, развивающийся в соответствии с линейным матричным разностным уравнением, управляется путем манипулирования экзогенным вектором с целью оптимизации квадратичной функции затрат . Это уравнение Риккати принимает следующую или подобную форму:

ЧАС т 1 = К + А ЧАС т А А ЧАС т С [ С ЧАС т С + Р ] 1 С ЧАС т А {\displaystyle \mathbf {H} _{t-1}=\mathbf {K} +\mathbf {A} '\mathbf {H} _{t}\mathbf {A} -\mathbf {A} '\mathbf {H} _{t}\mathbf {C} \left[\mathbf {C} '\mathbf {H} _{t}\mathbf {C} +\mathbf {R} \right]^{-1}\mathbf {C} '\mathbf {H} _{t}\mathbf {A} }

где H , K , и A являются n × n , C является n × k , R является k × k , n является числом элементов в векторе для управления, а k является числом элементов в векторе управления. Матрицы параметров A и C являются из линейного уравнения, а матрицы параметров K и R являются из квадратичной функции стоимости. Подробности см. здесь .

В общем случае это уравнение не может быть решено аналитически для H t в терминах t ; скорее, последовательность значений для H t находится путем итерации уравнения Риккати. Однако было показано [3] , что это уравнение Риккати может быть решено аналитически, если R = 0 и n = k + 1 , путем сведения его к скалярному рациональному разностному уравнению ; более того, для любых k и n , если матрица перехода A невырождена, то уравнение Риккати может быть решено аналитически в терминах собственных значений матрицы, хотя их может потребоваться найти численно. [4]

В большинстве контекстов эволюция H назад во времени стабильна, что означает, что H сходится к определенной фиксированной матрице H * , которая может быть иррациональной, даже если все остальные матрицы рациональны. См. также Стохастическое управление § Дискретное время .

Соответствующее уравнение Риккати [5] имеет вид

Х т + 1 = [ Э + Б Х т ] [ С + А Х т ] 1 {\displaystyle \mathbf {X} _{t+1}=-\left[\mathbf {E} +\mathbf {B} \mathbf {X} _{t}\right]\left[\mathbf {C} +\mathbf {A} \mathbf {X} _{t}\right]^{-1}}

в котором матрицы X , A , B , C , E все n × n . Это уравнение можно решить явно. Предположим, что, безусловно, выполняется для t = 0 с N 0 = X 0 и с D 0 = I . Тогда использование этого в разностном уравнении дает Х т = Н т Д т 1 , {\displaystyle \mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1},}

Х т + 1 = [ Э + Б Н т Д т 1 ] Д т Д т 1 [ С + А Н т Д т 1 ] 1 = [ Э Д т + Б Н т ] [ [ С + А Н т Д т 1 ] Д т ] 1 = [ Э Д т + Б Н т ] [ С Д т + А Н т ] 1 = Н т + 1 Д т + 1 1 {\displaystyle {\begin{aligned}\mathbf {X} _{t+1}&=-\left[\mathbf {E} +\mathbf {BN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\mathbf {D} _{t}^{-1}\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\mathbf {CD} _{t}+\mathbf {AN} _{t}\right]^{-1}\\&=\mathbf {N} _{t+1}\mathbf {D} _{t+1}^{-1}\end{aligned}}}

поэтому по индукции форма справедлива для всех t . Тогда эволюцию N и D можно записать как X t = N t D t 1 {\displaystyle \mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1}}

[ N t + 1 D t + 1 ] = [ B E A C ] [ N t D t ] J [ N t D t ] {\displaystyle {\begin{bmatrix}\mathbf {N} _{t+1}\\\mathbf {D} _{t+1}\end{bmatrix}}={\begin{bmatrix}-\mathbf {B} &-\mathbf {E} \\\mathbf {A} &\mathbf {C} \end{bmatrix}}{\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}\equiv \mathbf {J} {\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}}

Таким образом, по индукции

[ N t D t ] = J t [ N 0 D 0 ] {\displaystyle {\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}=\mathbf {J} ^{t}{\begin{bmatrix}\mathbf {N} _{0}\\\mathbf {D} _{0}\end{bmatrix}}}

Смотрите также

Ссылки

  1. ^ Калл, Пол; Флэхайв, Мэри ; Робсон, Робби (2005). Разностные уравнения: от кроликов к хаосу . Springer. гл. 7. ISBN 0-387-23234-6.
  2. ^ Чианг, Альфа С. (1984). Фундаментальные методы математической экономики (3-е изд.). McGraw-Hill. стр. 608–612. ISBN 9780070107809.
  3. ^ Балверс, Рональд Дж.; Митчелл, Дуглас В. (2007). «Уменьшение размерности линейных квадратичных задач управления» (PDF) . Журнал экономической динамики и управления . 31 (1): 141–159. doi :10.1016/j.jedc.2005.09.013. S2CID  121354131.
  4. ^ Vaughan, DR (1970). «Нерекурсивное алгебраическое решение для дискретного уравнения Риккати». IEEE Transactions on Automatic Control . 15 (5): 597–599. doi :10.1109/TAC.1970.1099549.
  5. ^ Мартин, CF; Аммар, Г. (1991). «Геометрия матричного уравнения Риккати и связанный с ним метод собственных значений». В Биттани; Лауб; Виллемс (ред.). Уравнение Риккати . Спрингер-Верлаг. дои : 10.1007/978-3-642-58223-3_5. ISBN 978-3-642-63508-3.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Matrix_difference_equation&oldid=1190320007"