Русская Википедия:Метод Гамильтона — Якоби решения вариационных задач
Метод Гамильтона — Якоби сводит задачу нахождения экстремалей (или задачу интегрирования гамильтоновой системы уравнений) к интегрированию уравнения в частных производных первого порядка — так называемого уравнения Гамильтона — Якоби. Основы теории Гамильтона-Якоби были разработаны Гамильтоном в 1820-х годах для задач волновой оптики и геометрической оптики. В 1834 году Гамильтон распространил свои идеи на проблемы динамики, и Якоби (1837) применил метод к общим задачам классического вариационного исчисления[1].
Начальные точки теории Гамильтона-Якоби были установлены в 17 веке Ферма и Гюйгенсом, которые использовали для этой цели предмет геометрической оптики (см. Принцип Ферма; принцип Гюйгенса).
Алгоритм
Рассмотрим шаги Гамильтона и проблему распространения света в неоднородной (но для простоты, изотропной) среде, где <math>v(x)</math> — локальная скорость света в точке <math>x</math>.
Согласно принципу Ферма, свет распространяется от точки к точке в неоднородной среде в кратчайшие сроки. Пусть <math>x_0 \in E</math>будет начальной точкой, и пусть <math>W(x)</math> будет кратчайшим возможным временем, когда свет пройдет расстояние от <math>x_0</math>> до <math>x</math> Функция <math>W(x)</math> известна как эйконал или оптическая длина пути. Предполагается, что за короткое время <math>dt</math> свет проходит от точки <math>x</math> до точки <math>x+dx</math>. Согласно принципу Гюйгенса, свет будет распространяться, кроме малых величин более высокого порядка, по нормали к поверхности уровня функции <math>W(x)</math>. Таким образом, выполняется уравнение[2]:
<math>W \left (x + \frac{W'(x)}{|W'(x)|} v(x)dt \right ) = W(x) + dt +o(dt)</math>.
И уравнение Гамильтона-Якоби для задач геометрической оптики имеет вид:
<math>|W'(x)|^2 = \frac{1}{v^2(x)} \Leftrightarrow \sum_{i=1}^3 \left (\frac{\partial W(x)}{\partial x_i) } \right )^2 = \frac{1}{v^2(x)}</math>.
В аналитической механике роль принципа Ферма играет вариационный принцип Гамильтона-Остроградского, а роль эйконала играет функционал действия, то есть интеграл:
<math>S(t,x) = \int_\gamma Ldt</math>, (1)
вдоль траектории γ, соединяющей данную точку <math>(t_0,x_0)</math> с точкой <math>(t,x)</math>, где находится функция Лагранжа механической системы, <math>x = (x_1,...,x_n)</math>.
Якоби предложил использовать функцию, напоминающую функционал действия (1), при решении всех задач классического вариационного исчисления. Экстремалы задачи <math>\int Ldt \rightarrow inf</math>, выходящей из точки <math>(t_0,x_0)</math>, пересекают поверхность уровня основной функции трансверсально (см. условие трансверсальности). Форма дифференциала функционала действия:
<math>dS = (p|dx) - Hdt</math>
выводится из этого условия. Здесь <math>p=L_x</math> и <math>H=px-L</math> — функции Гамильтона (см. также преобразование Лежандра).
Последнее упомянутое соотношение дает следующее уравнение для функции S:
<math>\frac{\partial S}{\partial t} + H \left (t,x,\frac{\partial S}{\partial x} \right ) = 0</math>. (2)
Это уравнение Гамильтона — Якоби[3].
Наиболее важным результатом теории Гамильтона — Якоби является теорема Якоби, которая утверждает, что полный интеграл уравнения (2), то есть решение <math>S(t,x,\alpha)</math> этого уравнения, которое будет зависеть от параметров <math>\alpha=(\alpha,...,\alpha)</math> (при условии, что <math>det \left | \frac{\partial^2 S}{\partial x \partial \alpha} \right | \ne 0)</math>, позволяет получить полный интеграл уравнения для функционала Эйлера (1) или, что то же самое, гамильтоновой системы, связанной с этим функционалом формулами <math>\frac{\partial S}{\partial x} = p</math>, <math>\frac{\partial S}{\partial \alpha} = \beta</math>. Применение теоремы Якоби к интегрированию гамильтоновых систем обычно основано на методе разделения переменных в специальных координатах.
Применение
Несмотря на то, что интегрирование уравнений в частных производных обычно сложнее, чем решение обыкновенных уравнений, теория Гамильтона-Якоби оказалась мощным инструментом в изучении проблем оптики, механики и геометрии. Суть принципа Гюйгенса была использована Беллманом при решении задач оптимального управления. См. также инвариантный интеграл Гильберта.
Комментарии
В оптимальном управлении уравнение Гамильтона-Якоби имеет, например, форму:
<math>\frac{\partial V}{\partial t} + H \left (t,x,\frac{\partial V}{\partial x} \right ) = 0, V(t,x) = \phi(t_1,x), t_0\leqslant t\leqslant t_1</math>,
где
<math>H(t,x,\frac{\partial V}{\partial x}) = min \left \{ \left ( \frac{\partial V}{\partial x}, f(t,x,u) \right ) + f^0(t,x,u):u \in U \right \}</math>.
См., например, оптимальное управление синтезом. В этом случае его часто называют уравнением Беллмана (особенно в технической литературе) или уравнением Гамильтона-Якоби-Беллмана[4]. Существует также версия для оптимального стохастического управления, см. [slovar.wikireading.ru/2700830 управляемый случайный процесс][5]. Поскольку классические решения уравнения Гамильтона-Якоби часто не существуют, возникает необходимость рассмотреть различные виды обобщённых решений, таких как решения с вязкостью.
Примечания
- Русская Википедия
- Физические законы и уравнения
- Симплектическая геометрия
- Теоретическая механика
- Гамильтонова механика
- Именные законы и правила
- Оптимальное управление
- Страницы, где используется шаблон "Навигационная таблица/Телепорт"
- Страницы с телепортом
- Википедия
- Статья из Википедии
- Статья из Русской Википедии