Русская Википедия:Метод Гамильтона — Якоби решения вариационных задач

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Метод Гамильтона — Якоби сводит задачу нахождения экстремалей (или задачу интегрирования гамильтоновой системы уравнений) к интегрированию уравнения в частных производных первого порядка — так называемого уравнения Гамильтона — Якоби. Основы теории Гамильтона-Якоби были разработаны Гамильтоном в 1820-х годах для задач волновой оптики и геометрической оптики. В 1834 году Гамильтон распространил свои идеи на проблемы динамики, и Якоби (1837) применил метод к общим задачам классического вариационного исчисления[1].

Начальные точки теории Гамильтона-Якоби были установлены в 17 веке Ферма и Гюйгенсом, которые использовали для этой цели предмет геометрической оптики (см. Принцип Ферма; принцип Гюйгенса).

Алгоритм

Рассмотрим шаги Гамильтона и проблему распространения света в неоднородной (но для простоты, изотропной) среде, где <math>v(x)</math> — локальная скорость света в точке <math>x</math>.

Согласно принципу Ферма, свет распространяется от точки к точке в неоднородной среде в кратчайшие сроки. Пусть <math>x_0 \in E</math>будет начальной точкой, и пусть <math>W(x)</math> будет кратчайшим возможным временем, когда свет пройдет расстояние от <math>x_0</math>> до <math>x</math> Функция <math>W(x)</math> известна как эйконал или оптическая длина пути. Предполагается, что за короткое время <math>dt</math> свет проходит от точки <math>x</math> до точки <math>x+dx</math>. Согласно принципу Гюйгенса, свет будет распространяться, кроме малых величин более высокого порядка, по нормали к поверхности уровня функции <math>W(x)</math>. Таким образом, выполняется уравнение[2]:

<math>W \left (x + \frac{W'(x)}{|W'(x)|} v(x)dt \right ) = W(x) + dt +o(dt)</math>.

И уравнение Гамильтона-Якоби для задач геометрической оптики имеет вид:

<math>|W'(x)|^2 = \frac{1}{v^2(x)} \Leftrightarrow \sum_{i=1}^3 \left (\frac{\partial W(x)}{\partial x_i) } \right )^2 = \frac{1}{v^2(x)}</math>.

В аналитической механике роль принципа Ферма играет вариационный принцип Гамильтона-Остроградского, а роль эйконала играет функционал действия, то есть интеграл:

<math>S(t,x) = \int_\gamma Ldt</math>, (1)

вдоль траектории γ, соединяющей данную точку <math>(t_0,x_0)</math> с точкой <math>(t,x)</math>, где находится функция Лагранжа механической системы, <math>x = (x_1,...,x_n)</math>.

Якоби предложил использовать функцию, напоминающую функционал действия (1), при решении всех задач классического вариационного исчисления. Экстремалы задачи <math>\int Ldt \rightarrow inf</math>, выходящей из точки <math>(t_0,x_0)</math>, пересекают поверхность уровня основной функции трансверсально (см. условие трансверсальности). Форма дифференциала функционала действия:

<math>dS = (p|dx) - Hdt</math>

выводится из этого условия. Здесь <math>p=L_x</math> и <math>H=px-L</math> — функции Гамильтона (см. также преобразование Лежандра).

Последнее упомянутое соотношение дает следующее уравнение для функции S:

<math>\frac{\partial S}{\partial t} + H \left (t,x,\frac{\partial S}{\partial x} \right ) = 0</math>. (2)

Это уравнение Гамильтона — Якоби[3].

Наиболее важным результатом теории Гамильтона — Якоби является теорема Якоби, которая утверждает, что полный интеграл уравнения (2), то есть решение <math>S(t,x,\alpha)</math> этого уравнения, которое будет зависеть от параметров <math>\alpha=(\alpha,...,\alpha)</math> (при условии, что <math>det \left | \frac{\partial^2 S}{\partial x \partial \alpha} \right | \ne 0)</math>, позволяет получить полный интеграл уравнения для функционала Эйлера (1) или, что то же самое, гамильтоновой системы, связанной с этим функционалом формулами <math>\frac{\partial S}{\partial x} = p</math>, <math>\frac{\partial S}{\partial \alpha} = \beta</math>. Применение теоремы Якоби к интегрированию гамильтоновых систем обычно основано на методе разделения переменных в специальных координатах.

Применение

Несмотря на то, что интегрирование уравнений в частных производных обычно сложнее, чем решение обыкновенных уравнений, теория Гамильтона-Якоби оказалась мощным инструментом в изучении проблем оптики, механики и геометрии. Суть принципа Гюйгенса была использована Беллманом при решении задач оптимального управления. См. также инвариантный интеграл Гильберта.

Комментарии

В оптимальном управлении уравнение Гамильтона-Якоби имеет, например, форму:

<math>\frac{\partial V}{\partial t} + H \left (t,x,\frac{\partial V}{\partial x} \right ) = 0, V(t,x) = \phi(t_1,x), t_0\leqslant t\leqslant t_1</math>,

где

<math>H(t,x,\frac{\partial V}{\partial x}) = min \left \{ \left ( \frac{\partial V}{\partial x}, f(t,x,u) \right ) + f^0(t,x,u):u \in U \right \}</math>.

См., например, оптимальное управление синтезом. В этом случае его часто называют уравнением Беллмана (особенно в технической литературе) или уравнением Гамильтона-Якоби-Беллмана[4]. Существует также версия для оптимального стохастического управления, см. [slovar.wikireading.ru/2700830 управляемый случайный процесс][5]. Поскольку классические решения уравнения Гамильтона-Якоби часто не существуют, возникает необходимость рассмотреть различные виды обобщённых решений, таких как решения с вязкостью.

Примечания

Шаблон:Примечания


Шаблон:Изолированная статья

Шаблон:Спам-ссылки