Основная лемма вариационного исчисления

Первоначальный результат использования тестовых функций для поиска экстремума

В математике , в частности в вариационном исчислении , вариация δf функции f может быть сосредоточена на сколь угодно малом интервале, но не в одной точке. Соответственно, необходимое условие экстремума ( функциональная производная равна нулю) появляется в слабой формулировке (вариационной форме), интегрированной с произвольной функцией δf . Основная лемма вариационного исчисления обычно используется для преобразования этой слабой формулировки в сильную формулировку ( дифференциальное уравнение ), свободную от интегрирования с произвольной функцией. Доказательство обычно использует возможность выбора δf, сосредоточенного на интервале, на котором f сохраняет знак (положительный или отрицательный). Используется несколько версий леммы. Базовые версии легко формулировать и доказывать. Более сильные версии используются при необходимости.

Базовая версия

Если непрерывная функция на открытом интервале удовлетворяет равенству ф {\displaystyle f} ( а , б ) {\displaystyle (а,б)}
а б ф ( х ) час ( х ) г х = 0 {\displaystyle \int _{a}^{b}f(x)h(x)\,\mathrm {d} x=0}
для всех гладких функций с компактным носителем на , то тождественно равен нулю. [1] [2] час {\displaystyle ч} ( а , б ) {\displaystyle (а,б)} ф {\displaystyle f}

Здесь «гладкий» может интерпретироваться как «бесконечно дифференцируемый», [1] но часто интерпретируется как «дважды непрерывно дифференцируемый» или «непрерывно дифференцируемый» или даже просто «непрерывный», [2] поскольку эти более слабые утверждения могут быть достаточно сильными для данной задачи. «Компактно носительный» означает «исчезает снаружи для некоторого , такого что «; [1] но часто достаточно более слабого утверждения, предполагая только, что (или и ряд его производных) обращается в нуль в конечных точках , ; [2] в этом случае используется замкнутый интервал . [ с , г ] {\displaystyle [c,d]} с {\displaystyle с} г {\displaystyle д} а < с < г < б {\displaystyle а<с<d<b} час {\displaystyle ч} час {\displaystyle ч} а {\displaystyle а} б {\displaystyle б} [ а , б ] {\displaystyle [а,б]}

Доказательство

Предположим, что для некоторого . Поскольку является непрерывным, оно отлично от нуля с тем же знаком для некоторого такого, что . Без потери общности предположим . Затем возьмем , который положителен на и равен нулю в других местах, например ф ( х ¯ ) 0 {\displaystyle f({\bar {x}})\neq 0} х ¯ ( а , б ) {\displaystyle {\bar {x}}\in (a,b)} ф {\displaystyle f} с , г {\displaystyle c,d} а < с < х ¯ < г < б {\displaystyle а<с<{\bar {x}}<d<b} ф ( х ¯ ) > 0 {\displaystyle f({\bar {x}})>0} час {\displaystyle ч} ( с , г ) {\displaystyle (c,d)}

час ( х ) = { эксп ( 1 ( х с ) ( г х ) ) , с < х < г 0 , о т час е г ж я с е {\displaystyle h(x)={\begin{cases}\exp \left(-{\frac {1}{(xc)(dx)}}\right),&c<x<d\\0,&\mathrm {иначе} \end{cases}}} .

Обратите внимание, что эта функция выпуклости удовлетворяет свойствам в утверждении, включая . Поскольку С {\displaystyle C^{\infty}}

а б ф ( х ) час ( х ) г х > 0 , {\displaystyle \int _{a}^{b}f(x)h(x)dx>0,}

мы приходим к противоречию. [3]

Версия для двух заданных функций

Если пара непрерывных функций f , g на интервале ( a , b ) удовлетворяет равенству
а б ( ф ( х ) час ( х ) + г ( х ) час ( х ) ) г х = 0 {\displaystyle \int _{a}^{b}(f(x)\,h(x)+g(x)\,h'(x))\,\mathrm {d} x=0}
для всех гладких функций h с компактным носителем на ( a , b ) g дифференцируема и g' = f  всюду. [4] [5]

Частный случай g = 0 — это всего лишь базовая версия.

Вот частный случай для f = 0 (часто достаточно).

Если непрерывная функция g на интервале ( a , b ) удовлетворяет равенству
а б г ( х ) час ( х ) г х = 0 {\displaystyle \int _{a}^{b}g(x)\,h'(x)\,\mathrm {d} x=0}
для всех гладких функций h на ( a , b ) таких, что , то g является константой . [6] час ( а ) = час ( б ) = 0 {\displaystyle h(a)=h(b)=0}

Если, кроме того, предполагается непрерывная дифференцируемость g , то интегрирование по частям сводит оба утверждения к базовой версии; этот случай приписывается Жозефу-Луи Лагранжу , тогда как доказательство дифференцируемости g принадлежит Полю дю Буа-Реймону .

Версии для прерывистых функций

Заданные функции ( f , g ) могут быть разрывными, при условии, что они локально интегрируемы (на заданном интервале). В этом случае подразумевается интегрирование по Лебегу , выводы выполняются почти всюду (таким образом, во всех точках непрерывности), а дифференцируемость g интерпретируется как локальная абсолютная непрерывность (а не непрерывная дифференцируемость). [7] [8] Иногда заданные функции предполагаются кусочно-непрерывными , в этом случае достаточно интегрирования по Риману , и выводы формулируются всюду, за исключением конечного множества точек разрыва. [5]

Высшие производные

Если кортеж непрерывных функций на интервале ( a , b ) удовлетворяет равенству ф 0 , ф 1 , , ф н {\displaystyle f_{0},f_{1},\точки ,f_{n}}
а б ( ф 0 ( х ) час ( х ) + ф 1 ( х ) час ( х ) + + ф н ( х ) час ( н ) ( х ) ) г х = 0 {\displaystyle \int _{a}^{b}(f_{0}(x)\,h(x)+f_{1}(x)\,h'(x)+\dots +f_{n}(x)\,h^{(n)}(x))\,\mathrm {d} x=0}
для всех гладких функций h с компактным носителем на ( a , b ) существуют непрерывно дифференцируемые функции на ( a , b ) такие, что u 0 , u 1 , , u n 1 {\displaystyle u_{0},u_{1},\dots ,u_{n-1}}
f 0 = u 0 , f 1 = u 0 + u 1 , f 2 = u 1 + u 2 f n 1 = u n 2 + u n 1 , f n = u n 1 {\displaystyle {\begin{aligned}f_{0}&=u'_{0},\\f_{1}&=u_{0}+u'_{1},\\f_{2}&=u_{1}+u'_{2}\\\vdots \\f_{n-1}&=u_{n-2}+u'_{n-1},\\f_{n}&=u_{n-1}\end{aligned}}}
везде. [9]

Это необходимое условие является также достаточным, поскольку подынтегральное выражение становится ( u 0 h ) + ( u 1 h ) + + ( u n 1 h ( n 1 ) ) . {\displaystyle (u_{0}h)'+(u_{1}h')'+\dots +(u_{n-1}h^{(n-1)})'.}

Случай n = 1 — это просто версия для двух заданных функций, поскольку и, таким образом, f = f 0 = u 0 {\displaystyle f=f_{0}=u'_{0}} f 1 = u 0 , {\displaystyle f_{1}=u_{0},} f 0 f 1 = 0. {\displaystyle f_{0}-f'_{1}=0.}

Напротив, случай n = 2 не приводит к соотношению , поскольку функция не обязана быть дифференцируемой дважды. Достаточное условие не является необходимым. Скорее, необходимое и достаточное условие можно записать как для n = 2, для n = 3 и т. д.; в общем случае скобки не могут быть раскрыты из-за недифференцируемости. f 0 f 1 + f 2 = 0 , {\displaystyle f_{0}-f'_{1}+f''_{2}=0,} f 2 = u 1 {\displaystyle f_{2}=u_{1}} f 0 f 1 + f 2 = 0 {\displaystyle f_{0}-f'_{1}+f''_{2}=0} f 0 ( f 1 f 2 ) = 0 {\displaystyle f_{0}-(f_{1}-f'_{2})'=0} f 0 ( f 1 ( f 2 f 3 ) ) = 0 {\displaystyle f_{0}-(f_{1}-(f_{2}-f'_{3})')'=0}

Векторнозначные функции

Обобщение на векторные функции осуществляется просто: результаты для скалярных функций применяются к каждой координате отдельно [10] или рассматривается векторный случай с самого начала [11] . ( a , b ) R d {\displaystyle (a,b)\to \mathbb {R} ^{d}}

Многомерные функции

Если непрерывная функция многих переменных f на открытом множестве удовлетворяет равенству Ω R d {\displaystyle \Omega \subset \mathbb {R} ^{d}}
Ω f ( x ) h ( x ) d x = 0 {\displaystyle \int _{\Omega }f(x)\,h(x)\,\mathrm {d} x=0}
для всех гладких функций h с компактным носителем на Ω f тождественно равна нулю.

Аналогично базовой версии можно рассмотреть непрерывную функцию f на замыкании Ω, предполагая, что h обращается в нуль на границе Ω (а не имеет компактного носителя). [12]

Вот версия для разрывных многомерных функций.

Пусть будет открытым множеством и удовлетворяет равенству Ω R d {\displaystyle \Omega \subset \mathbb {R} ^{d}} f L 2 ( Ω ) {\displaystyle f\in L^{2}(\Omega )}
Ω f ( x ) h ( x ) d x = 0 {\displaystyle \int _{\Omega }f(x)\,h(x)\,\mathrm {d} x=0}
для всех компактно носимых гладких функций h на Ω. Тогда f = 0 (в L2 , то есть почти всюду). [13]

Приложения

Эта лемма используется для доказательства того, что экстремумы функционала

J [ y ] = x 0 x 1 L ( t , y ( t ) , y ˙ ( t ) ) d t {\displaystyle J[y]=\int _{x_{0}}^{x_{1}}L(t,y(t),{\dot {y}}(t))\,\mathrm {d} t}

являются слабыми решениями (для соответствующего векторного пространства ) уравнения Эйлера–Лагранжа y : [ x 0 , x 1 ] V {\displaystyle y:[x_{0},x_{1}]\to V} V {\displaystyle V}

L ( t , y ( t ) , y ˙ ( t ) ) y = d d t L ( t , y ( t ) , y ˙ ( t ) ) y ˙ . {\displaystyle {\partial L(t,y(t),{\dot {y}}(t)) \over \partial y}={\mathrm {d} \over \mathrm {d} t}{\partial L(t,y(t),{\dot {y}}(t)) \over \partial {\dot {y}}}.}

Уравнение Эйлера–Лагранжа играет важную роль в классической механике и дифференциальной геометрии .

Примечания

  1. ^ abc Jost & Li-Jost 1998, Лемма 1.1.1 на стр.6
  2. ^ abc Гельфанд и Фомин 1963, Лемма 1 на стр.9 (и замечание)
  3. ^ Либерзон 2012, Лемма 2.1 на стр.30.
  4. ^ Гельфанд и Фомин 1963, Лемма 4 на стр.11
  5. ^ ab Hestenes 1966, лемма 15.1 на стр. 50.
  6. ^ Гельфанд и Фомин 1963, Лемма 2 на стр.10
  7. ^ Йост и Ли-Йост 1998, Лемма 1.2.1 на стр.13
  8. ^ Giaquinta & Hildebrandt 1996, раздел 2.3: Успокоители
  9. ^ Hestenes 1966, Лемма 13.1 на стр. 105.
  10. ^ Гельфанд и Фомин 1963, стр.35
  11. ^ Йост и Ли-Йост 1998
  12. Гельфанд и Фомин 1963, Лемма на стр. 22; доказательство применимо в обеих ситуациях.
  13. ^ Йост и Ли-Йост 1998, Лемма 3.2.3 на стр.170

Ссылки

  • Йост, Юрген; Ли-Йост, Сяньцин (1998), Вариационное исчисление , Кембриджский университет
  • Гельфанд, И.М.; Фомин, С.В. (1963), Вариационное исчисление , Prentice-Hall(перевод с русского).
  • Хестенес, Магнус Р. (1966), Вариационное исчисление и теория оптимального управления , Джон Уайли
  • Джаквинта, Мариано; Хильдебрандт, Стефан (1996), Вариационное исчисление I , Springer
  • Либерзон, Дэниел (2012), Вариационное исчисление и теория оптимального управления , Princeton University Press
Retrieved from "https://en.wikipedia.org/w/index.php?title=Fundamental_lemma_of_the_calculus_of_variations&oldid=1245174818"