Русская Википедия:Функциональная производная

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Нет ссылок В математике и теоретической физике функциональная производная является обобщением производной по направлению. Разница заключается в том, что для последней дифференцирование производится в направлении какого-нибудь вектора, а для первой речь идёт о функции. Оба эти понятия можно рассматривать как обобщение обычного дифференциального исчисления.

Существуют два основных вида функциональных производных, соответствующих общему определению производной Фреше и производной Гато функции на банаховом пространстве. На практике они зачастую не различаются.

Определение

Пусть <math>F</math> — некоторый функционал, то есть функция, определённая на некотором множестве функций. Значение функционала <math>F</math> на функции <math>\phi</math> обозначают <math>F[\phi]</math>. Его производная Гато (производная по направлению) есть предел (если он существует) выражения <math>\lim_{\varepsilon \to 0} \frac{F[\phi + \varepsilon \delta \phi] - F[\phi]}{\varepsilon}</math>. Здесь <math>\delta \phi</math> — некоторая функция из области определения <math>F</math>. Отметим, что такая производная, вообще говоря, зависит от выбора функции <math>\delta \phi</math>. В этом смысле ситуация вполне аналогичная конечномерной. Например, функция <math>y=|x|</math> дифференцируема в точке <math>x=0</math> справа и слева, но эти односторонние производные различны, а в обычном смысле эта функция в 0 не дифференцируема.

Гораздо чаще в приложениях возникает производная функционала, аналогичная классической конечномерной производной и являющаяся частным случаем производной Гато. Не давая общего определения, рассмотрим типичный пример: поиск экстремума функционала на множестве траекторий, проходящих через две заданные точки. Такая задача возникает при исследовании задач классической механики с помощью принципа наименьшего действия, подобного же типа задача о нахождении фигуры максимальной площади с заданным периметром и т. п.

Пусть функционал <math>F</math> имеет интегральный видШаблон:Sfn

<math>F[\phi] = \int_a^b L(\phi, \dot \phi, t)dt</math>

Его первой вариацией называется выражение

<math>\delta F = F[\phi + \delta \phi] - F[\phi]</math>

Если она представима в виде

<math>\delta F = \int_a^b S(\phi, \dot \phi, t) \delta\phi(t)dt</math>

с точностью до величин второго порядка по <math>\delta \phi</math>, то функция <math>S</math> называется функциональной производнойШаблон:Sfn <math>F</math> по <math>\phi</math> и обозначается <math>\frac{\delta F}{\delta \phi}</math>. Функционал при этом называют дифференцируемым.

Конкретно в данной задаче <math>\frac{\delta F}{\delta \phi} = \frac{\partial L}{\partial \phi} - \frac{d}{dt}\frac{\partial L}{\partial \dot \phi}</math>, но в общем случае ответ существенно зависит от постановки задачи и граничных условий.

Вторая вариация

Если функционал дифференцируем, то можно определить аналог второй производной (в данном случае он скорее аналогичен матрице вторых частных производных). Раскладывая полную вариацию <math>\delta F</math> до второго порядка по <math>\delta \varphi</math> и отбрасывая величины первого порядка, получим выражение, называемое второй вариацией функционала:

<math>\delta^2 F = \iint \frac{\delta^2 F}{\delta \varphi \, \delta \varphi^\prime} \, \delta \varphi(x) \, \delta \varphi^\prime (x^\prime) \, dx \, dx^\prime</math>

Свойства

Функциональная производная по свойствам аналогично обычной. Например:

  • Линейность. <math>\frac{\delta}{\delta \phi}(\lambda F + \mu G) = \lambda \frac{\delta F}{\delta \phi} + \mu \frac{\delta G}{\delta \phi},\ \lambda,\mu\in \Complex</math>
  • Тождество Лейбница. <math>\frac{\delta FG}{\delta \phi} = \frac{\delta F}{\delta \phi} G + F \frac{\delta G}{\delta \phi}</math>
  • Разложение полной вариации по частным производным: <math>\delta F[\phi, \psi] = \frac{\delta F}{\delta \phi} \delta \phi + \frac{\delta F}{\delta \psi} \delta \psi</math>
  • В точке экстремума функционала его производная равна 0. Точка экстремума является точкой минимума (максимума), если вторая вариация — положительно (отрицательно) определённая квадратичная форма.

и так далее.

Примеры

Энтропия

Информационная энтропия дискретной случайной величины — это функционал функции вероятности.

<math>

\begin{align} H[p(x)] = -\sum_x p(x) \log p(x) \end{align}

</math> Поэтому

<math>

\begin{align} \left\langle \frac{\delta H}{\delta p}, \phi \right\rangle & {} = \sum_x \frac{\delta H[p(x)]}{\delta p(x')} \, \phi(x') \\ & {} = \left. \frac{d}{d\epsilon} H[p(x) + \epsilon\phi(x)] \right|_{\epsilon=0}\\ & {} = -\frac{d}{d\varepsilon} \left. \sum_x [p(x) + \varepsilon\phi(x)] \log [p(x) + \varepsilon\phi(x)] \right|_{\varepsilon=0} \\ & {} = \displaystyle -\sum_x [1+\log p(x)]\phi(x)\\ & {} = \left\langle -[1+\log p(x)], \phi \right\rangle. \end{align} </math>

Поэтому

<math>

\frac{\delta H}{\delta p} = -[1+\log p(x)]. </math>

Экспонента

Пусть

<math> F[\varphi(x)]= e^{\int \varphi(x) g(x)dx}.</math>

Используем в качестве пробной функции дельта-функцию:

<math>

\begin{align} \frac{\delta F[\varphi(x)]}{\delta \varphi(y)} & {} = \lim_{\varepsilon\to 0}\frac{F[\varphi(x)+\varepsilon\delta(x-y)]-F[\varphi(x)]}{\varepsilon}\\ & {} = \lim_{\varepsilon\to 0}\frac{e^{\int (\varphi(x)+\varepsilon\delta(x-y)) g(x)dx}-e^{\int \varphi(x) g(x)dx}}{\varepsilon}\\ & {} = e^{\int \varphi(x) g(x)dx}\lim_{\varepsilon\to 0}\frac{e^{\varepsilon \int \delta(x-y) g(x)dx}-1}{\varepsilon}\\ & {} = e^{\int \varphi(x) g(x)dx}\lim_{\varepsilon\to 0}\frac{e^{\varepsilon g(y)}-1}{\varepsilon}\\ & {} = e^{\int \varphi(x) g(x)dx}g(y). \end{align} </math>

Поэтому

<math> \frac{\delta F[\varphi(x)]}{\delta \varphi(y)} = g(y) F[\varphi(x)]. </math>

Примечания

Шаблон:Примечания

Литература