Субдеривативный

Обобщение производных на действительные функции
Выпуклая функция (синяя) и «подкасательные линии» в точке (красная). х 0 {\displaystyle x_{0}}

В математике субпроизводные (или субградиенты) обобщают производную на выпуклые функции , которые не обязательно дифференцируемы . Набор субпроизводных в точке называется субдифференциалом в этой точке. [1] Субпроизводные возникают в выпуклом анализе , изучении выпуклых функций , часто в связи с выпуклой оптимизацией .

Пусть будет вещественной -значной выпуклой функцией, определенной на открытом интервале вещественной прямой. Такая функция не обязана быть дифференцируемой во всех точках: Например, функция абсолютного значения недифференцируема, когда . Однако, как видно на графике справа (где синим цветом обозначены недифференцируемые изломы, подобные функции абсолютного значения), для любого в области определения функции можно провести линию, которая проходит через точку и которая всюду касается или находится ниже графика функции f . Наклон такой линии называется субпроизводной . ф : я Р {\displaystyle f:I\to \mathbb {R} } ф ( х ) = | х | {\displaystyle f(x)=|x|} х = 0 {\displaystyle x=0} ф ( х ) {\displaystyle f(x)} х 0 {\displaystyle x_{0}} ( х 0 , ф ( х 0 ) ) {\displaystyle (x_{0},f(x_{0}))}

Определение

Строго говоря, субпроизводная выпуклой функции в точке открытого интервала — это действительное число, такое что для всех . По обратной теореме о среднем значении множество субпроизводных в для выпуклой функции является непустым замкнутым интервалом , где и — односторонние пределы Интервал всех субпроизводных называется субдифференциалом функции в , обозначаемым . Если является выпуклой, то ее субдифференциал в любой точке непуст. Более того, если ее субдифференциал в содержит ровно одну субпроизводную, то дифференцируем в и . [2] ф : я Р {\displaystyle f:I\to \mathbb {R} } х 0 {\displaystyle x_{0}} я {\displaystyle Я} с {\displaystyle с} ф ( х ) ф ( х 0 ) с ( х х 0 ) {\displaystyle f(x)-f(x_{0})\geq c(x-x_{0})} х я {\displaystyle x\in I} х 0 {\displaystyle x_{0}} [ а , б ] {\displaystyle [а,б]} а {\displaystyle а} б {\displaystyle б} а = лим х х 0 ф ( х ) ф ( х 0 ) х х 0 , {\displaystyle a=\lim _{x\to x_{0}^{-}}{\frac {f(x)-f(x_{0})}{x-x_{0}}},} б = лим х х 0 + ф ( х ) ф ( х 0 ) х х 0 . {\displaystyle b=\lim _{x\to x_{0}^{+}}{\frac {f(x)-f(x_{0})}{x-x_{0}}}.} [ а , б ] {\displaystyle [а,б]} ф {\displaystyle f} х 0 {\displaystyle x_{0}} ф ( х 0 ) {\displaystyle \partial f(x_{0})} ф {\displaystyle f} х 0 {\displaystyle x_{0}} ф {\displaystyle f} х 0 {\displaystyle x_{0}} ф ( х 0 ) = { ф ( х 0 ) } {\displaystyle \partial f(x_{0})=\{f'(x_{0})\}}

Пример

Рассмотрим функцию, которая является выпуклой. Тогда субдифференциал в начале координат — это интервал . Субдифференциал в любой точке — это одноэлементное множество , в то время как субдифференциал в любой точке — это одноэлементное множество . Это похоже на функцию знака , но не является однозначной в , а вместо этого включает все возможные субпроизводные. ф ( х ) = | х | {\displaystyle f(x)=|x|} [ 1 , 1 ] {\displaystyle [-1,1]} х 0 < 0 {\displaystyle x_{0}<0} { 1 } {\displaystyle \{-1\}} х 0 > 0 {\displaystyle x_{0}>0} { 1 } {\displaystyle \{1\}} 0 {\displaystyle 0}

Характеристики

  • Выпуклая функция дифференцируема в тогда и только тогда, когда субдифференциал является одноэлементным множеством, что равно . ф : я Р {\displaystyle f:I\to \mathbb {R} } х 0 {\displaystyle x_{0}} { ф ( х 0 ) } {\displaystyle \{f'(x_{0})\}}
  • Точка является глобальным минимумом выпуклой функции тогда и только тогда, когда ноль содержится в субдифференциале. Например, на рисунке выше можно провести горизонтальную «субкасательную линию» к графику при . Последнее свойство является обобщением того факта, что производная функции, дифференцируемой в локальном минимуме, равна нулю. х 0 {\displaystyle x_{0}} ф {\displaystyle f} ф {\displaystyle f} ( х 0 , ф ( х 0 ) ) {\displaystyle (x_{0},f(x_{0}))}
  • Если и являются выпуклыми функциями с субдифференциалами и с внутренней точкой одной из функций, то субдифференциал есть (где оператор сложения обозначает сумму Минковского ). Это читается как «субдифференциал суммы есть сумма субдифференциалов». [3] ф {\displaystyle f} г {\displaystyle г} ф ( х ) {\displaystyle \partial f(x)} г ( х ) {\displaystyle \partial g(x)} х {\displaystyle x} ф + г {\displaystyle f+g} ( ф + г ) ( х ) = ф ( х ) + г ( х ) {\displaystyle \partial (f+g)(x)=\partial f(x)+\partial g(x)}

Субградиент

Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если - вещественнозначная выпуклая функция, определенная на выпуклом открытом множестве в евклидовом пространстве , вектор в этом пространстве называется субградиентом в , если для любого имеет место, что ф : У Р {\displaystyle f:U\to \mathbb {R} } Р н {\displaystyle \mathbb {R} ^{n}} в {\displaystyle v} х 0 У {\displaystyle x_{0}\in U} х У {\displaystyle x\in U}

ф ( х ) ф ( х 0 ) в ( х х 0 ) , {\displaystyle f(x)-f(x_{0})\geq v\cdot (x-x_{0}),}

где точка обозначает скалярное произведение . Множество всех субградиентов в точке называется субдифференциалом в точке и обозначается . Субдифференциал всегда является непустым выпуклым компактным множеством . х 0 {\displaystyle x_{0}} х 0 {\displaystyle x_{0}} ф ( х 0 ) {\displaystyle \partial f(x_{0})}

Эти концепции далее обобщаются на выпуклые функции на выпуклом множестве в локально выпуклом пространстве . Функционал в сопряженном пространстве называется субградиентом в , если для всех , ф : У Р {\displaystyle f:U\to \mathbb {R} } В {\displaystyle V} в {\displaystyle v^{*}} В {\displaystyle V^{*}} х 0 {\displaystyle x_{0}} У {\displaystyle U} х У {\displaystyle x\in U}

ф ( х ) ф ( х 0 ) в ( х х 0 ) . {\displaystyle f(x)-f(x_{0})\geq v^{*}(x-x_{0}).}

Множество всех субградиентов в называется субдифференциалом в и снова обозначается . Субдифференциал всегда является выпуклым замкнутым множеством . Он может быть пустым множеством; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если является непрерывным, то субдифференциал непуст. х 0 {\displaystyle x_{0}} х 0 {\displaystyle x_{0}} ф ( х 0 ) {\displaystyle \partial f(x_{0})} ф {\displaystyle f}

История

Субдифференциал на выпуклых функциях был введен Жаном Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. [4]

Смотрите также

Ссылки

  1. ^ Бубек, С. (2014). Теория выпуклой оптимизации для машинного обучения. ArXiv, abs/1405.4980.
  2. ^ Рокафеллар, РТ (1970). Выпуклый анализ . Princeton University Press. стр. 242 [Теорема 25.1]. ISBN 0-691-08069-0.
  3. ^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. п. 183. ИСБН 978-3-642-56468-0.
  4. ^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: John Wiley & Sons . С. xiii+308. ISBN  0-471-87504-X. МР  0709590.
  • Борвейн, Джонатан; Льюис, Адриан С. (2010). Выпуклый анализ и нелинейная оптимизация: теория и примеры (2-е изд.). Нью-Йорк: Springer. ISBN 978-0-387-31256-9.
  • Хириар-Уррути, Жан-Батист; Лемарешаль, Клод (2001). Основы выпуклого анализа . Спрингер. ISBN 3-540-42205-6.
  • Zălinescu, C. (2002). Выпуклый анализ в общих векторных пространствах . World Scientific Publishing Co., Inc. стр. xx+367. ISBN 981-238-067-1. МР  1921556.
  • "Использование lim h → 0 f ( x + h ) − f ( x − h ) 2 h {\displaystyle \lim \limits _{h\to 0}{\frac {f(x+h)-f(xh)}{2h}}} ". Stack Exchange . 18 сентября 2011 г.
Получено с "https://en.wikipedia.org/w/index.php?title=Subderivative&oldid=1248251312"