Русская Википедия:Оптимальное управление

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Универсальная карточка Оптимальное управление — это задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы[1].

Определение

Задача оптимального управления включает в себя расчет оптимальной программы управления и синтез системы оптимального управления. Оптимальные программы управления, как правило, рассчитываются численными методами нахождения экстремума функционала или решения краевой задачи для системы дифференциальных уравненийШаблон:Sfn. Синтез систем оптимального управления с математической точки зрения представляет собой задачу нелинейного программирования в функциональных пространствахШаблон:Sfn.

Для решения задачи определения программы оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния[2].

Если математическая модель управляемого объекта или процесса заранее неизвестна, то для её определения необходимо провести процедуру идентификации управляемого объекта или процесса[3]

Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравненийШаблон:Sfn, описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств[4].

Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.Шаблон:SfnШаблон:Sfn

При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления[5]Шаблон:Sfn.

Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида <math>\dot{x}(t)=a[x(t),u(t),t]</math>. В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.

Для решения задач оптимального управления в условиях конфликта или неопределенности используется теория дифференциальных игр.[6]

Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных (некорректная задача), то такая задача решается специальными численными методами.[7]

Для решения задач оптимального управления с неполной исходной информацией и при наличии ошибок измерений используется метод максимального правдоподобияШаблон:Sfn.

Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления[8].

Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т. д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.[9]

Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.[10]Шаблон:Sfn

Для решения задач оптимального управления очень большой размерности, не позволяющей их решать методами классической математики, используются методы ситуационного управления.

Для оптимального управления экономическими процессами применяются методы экономической кибернетики, теории игр, теории графов[11]

Оптимальное управление детерминированными системами

Системы с сосредоточенными параметрами

Наиболее широко при проектировании систем управления детерминированными объектами c сосредоточенными параметрами, описываемыми обыкновенными дифференциальными уравнениями, применяются следующие методы: вариационное исчисление, принцип максимума Понтрягина и динамическое программирование Беллмана[1].

Задача оптимального управления

Сформулируем задачу оптимального управления:

  • Уравнения состояния: <math>\dot{x}(t)=a[x(t),u(t),t]</math> (1).
  • Граничные условия <math>x(t_0)=x_{0}^{*}</math>, <math>x(t_1)=x_{1}^{*}</math> (2).
  • Минимизируемый функционал: <math>\eta=\int_{t_0}^{t_1}F[x(\tau),\dot{x}(\tau),\tau]d\tau,</math>.

здесь <math>x(t)</math> — вектор состояния <math>u(t)</math> — управление, <math>t_{0}, t_{1}</math> — начальный и конечный моменты времени.

Задача оптимального управления заключается в нахождении функций состояния <math>x(t)</math> и управления <math>u(t)</math> для времени <math>({t_0}\le{t}\le{t_1})</math>, которые минимизируют функционал.

Вариационное исчисление

Шаблон:Main Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления[12]. Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа[12]. Функция Лагранжа <math>\Lambda</math> имеет вид: <math>\Lambda=\int_{t_0}^{t_1}(F[x(t),\dot{x}(t),t]+\lambda_1^T(t)(\dot{x}(t)-a[x(t),u(t),t]))dt+l</math>, где <math>l=\lambda_2^T(x(t_0)-x_{0}^{*})+\lambda_3^T(x(t_1)-x_{1}^{*})</math> — граничные условия. Лагранжиан <math>L</math> имеет вид: <math>L[x(t),\dot{x}(t),u(t),\lambda(t),t]=F[x(t),\dot{x}(t),t]+\lambda_1^T(t)(\dot{x}(t)-a[x(t),u(t),t])</math>, где <math>\lambda_1</math>, <math>\lambda_2</math>, <math>\lambda_3</math> — n-мерные вектора множителей Лагранжа.

Необходимые условия экстремума, согласно этой теореме, имеют вид:

  • стационарность по u: <math>\hat{L}_{u}=0</math>, (3)
  • стационарность по x, уравнение Эйлера: <math>\hat{L}_{x}-\frac{d}{dt}\hat{L}_{\dot{x}}=0</math> (4)
  • трансверсальность по x: <math>\hat{L}_{\dot{x}}(t_0)=\hat{l}_{x(t_0)}</math>, <math>\hat{L}_{\dot{x}}(t_1)=-\hat{l}_{x(t_1)}</math> (5)

Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть — в конечный момент. Методы решения подобных задач подробно разбираются в книге[13]

Принцип максимума Понтрягина

Необходимость в принципе максимума Понтрягина возникает в случае, когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно <math>\hat{L}_{u}=0</math>.

В этом случае условие (3) заменяется на условие (6):

<math>\begin{align} \min_{u \in U}L(t,x(t),\dot{x}(t),u)&=L(t,\hat{x}(t),\dot{x}(t),\hat{u}) \Longleftrightarrow\\

&\Longleftrightarrow \min_{ u \in U}\left(F(t,x(t),u)-\lambda(t)a(t,x(t),u)\right)=f(t)-\lambda(t)a(t). \end{align}</math> (6)

В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона <math>H</math>, определяемой соотношением <math>H = F(t,x(t),u) - \lambda(t)a(t,x(t),u)</math>. Из уравнений следует, что функция Гамильтона <math>H</math> связана с функцией Лагранжа <math>L</math> следующим образом: <math>L=H+\lambda(t)\dot{x}(t)</math>. Подставляя <math>L</math> из последнего уравнения в уравнения (3—5), получаем необходимые условия, выраженные через функцию Гамильтона:

  • уравнение управления по u: <math>\hat{H}_{u}=0</math>, (7)
  • уравнение состояния: <math>\dot{x}=-\hat{H}_{\lambda}</math>, (8)
  • сопряжённое уравнение: <math>\dot{\lambda}=-\hat{H}_{x}</math>, (9)
  • трансверсальность по x: <math>\lambda (t_0) =\hat{l}_{x(t_0)}</math>, <math>\lambda (t_1)=-\hat{l}_{x(t_1)}</math> (10)

Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге[12].

Пример

Пусть требуется решить задачу минимизации функционала:

<math>\int_{0}^{1}(u^{2}-4x)dt</math>, где <math>\frac{dx}{dt} = u</math>, <math>0 \leqslant u \leqslant 1</math>, <math>x(0)=0</math>.

Функция Гамильтона в данном случае имеет вид:

<math>H = \lambda u - u^2 + 4x</math>.

Из условий 9) и 10) находим, что:

<math>\lambda = 4 - 4t</math>, <math>t \in [0, 1]</math>.

Получаем:

<math>H = (4-4t)u-u^2+4x</math>.

Максимум этой функции по <math>u</math>, <math>0 < u < 1</math>, достигается при <math>u=u^{*}(t)</math>, где

<math>u^{*}(t) = \begin{cases}
 1,  & \mbox{if } 0 \leqslant t \leqslant \frac{1}{2} \\
 2-2t, & \mbox{if } \frac{1}{2} \leqslant t \leqslant 1

\end{cases}</math>

По условию, <math>\frac{dx^{*}(t)}{dt} = u^{*}(t)</math>. Значит:

<math>x^{*}(t) = \begin{cases}
 t+c_{1},  & \mbox{if } 0 \leqslant t \leqslant \frac{1}{2} \\
 2t - t^{2} - c_{2}, & \mbox{if } \frac{1}{2} \leqslant t \leqslant 1

\end{cases}</math>

Из <math>x^{*}(0) = 0</math>, получаем <math>c_{1} = 0</math>. Из условия непрерывности <math>x^{*}(t)</math> в точке <math>t = \frac{1}{2}</math> найдем постоянную <math>c_{2} = - \frac{1}{4}</math>.

Таким образом:

<math>x^{*}(t) = \begin{cases}
 t,  & \mbox{if } 0 \leqslant t \leqslant \frac{1}{2} \\
 2t - t^{2} - \frac{1}{4}, & \mbox{if } \frac{1}{2} \leqslant t \leqslant 1

\end{cases}</math>

Можно проверить, что найденные <math>x^{*}(t)</math> и <math>u^{*}(t)</math> составляют оптимальное решение данной задачи[14]

Где применяется

Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.

История

За разработку теории оптимального управления Л. С. Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе, и Е. Ф. Мищенко в 1962 году была присуждена Ленинская премия.

Метод динамического программирования

Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса, последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса[15]. Более подробно метод динамического программирования изложен в книге[16]

Достаточные условия оптимальности

Достаточные условия оптимальности управляемых процессов были получены в 1962 году В. Ф. Кротовым, на их основе были построены итерационные вычислительные методы последовательного улучшения, позволяющие находить глобальный оптимум в задачах управления[17][18][19].

Оптимальное управление системами с распределёнными параметрами

В задачах оптимального управления такими объектами, как проходная нагревательная печь, теплообменный аппарат, установка для нанесения покрытия, сушильный агрегат, химический реактор, установка для разделения смесей, доменная или мартеновская печь, коксовая батарея, прокатный стан, печь индукционного нагрева и т. д. управляемый процесс описывается дифференциальными уравнениями в частных производных, интегральными уравнениями и интегро-дифференциальными уравнениями.

Теория оптимального управления в этом случае разработана лишь для отдельных видов этих уравнений: эллиптического, параболического и гиперболического типа.

В некоторых простых случаях удается получить аналог принципа максимума Понтрягина.[20][21]

Если решения систем уравнений имеют неустойчивости, точки разрыва, точки бифуркации, кратные решения, то для их получения используется ряд специальных методов[22].

Задача оптимального управления

  • Задана область определения управляемого процесса <math>0 \leqslant x \leqslant a, 0 \leqslant y \leqslant b</math>
  • Уравнения, описывающие управляемый процесс: <math>\frac{\partial^{2} Q_{i}}{\partial x \partial y}=f_i(x, y, Q, \frac{\partial Q}{\partial x}, \frac{\partial Q}{\partial y}, u);(1)</math> , где <math>Q</math> — <math>n</math> — мерный вектор, описываемый управляемый процесс, <math>\frac{\partial Q}{\partial x}</math> — <math>n</math> — мерный вектор производных вектора <math>Q</math> по координате <math>x</math>, <math>\frac{\partial Q}{\partial y}</math> — <math>n</math> — мерный вектор производных вектора <math>Q</math> по координате <math>y</math>, <math>u</math> — <math>r</math> — мерный управляющий вектор.
  • Граничные условия для управляемого процесса: <math>Q_{i}(0, y)=\phi_{i}(y); Q_{i}(x, 0)=\psi_{i}(x); i=1,..., n; (2)</math>
  • Задача оптимального управления состоит в том, чтобы найти такое управление <math>u(x, y)</math>, при котором допустимое уравнениями <math>(1), (2)</math> решение <math>Q(x, y)</math> приводит к максимуму функционала <math>J = \sum^{n}_{i=1} c_{i} Q_{i} (a,b)</math>.
Принцип максимума для систем с распределёнными параметрами

С целью формулировки принципа максимума для систем с распределёнными параметрами вводится функция Гамильтона: <math>H(N, Q, \frac{dQ}{dx}, \frac{dQ}{dy}, u) = \sum_{i=1}^{n} N_{i} f_{i} (x, y, Q, \frac{dQ}{dx}, \frac{dQ}{dy}, u)</math>, где вспомогательные функции <math>N_{1}(x, y), ..., N_{n}(x, y)</math> должны удовлетворять уравнениям <math>\frac{dN_{i}}{dxdy}=\frac{dH}{dQ_{i}}-\frac{d}{dx}\frac{dH}{dQ_{ix}}-\frac{d}{dy}\frac{dH}{dQ_{iy}}(2)</math> и граничным условиям <math>\frac{dN_{i}}{dx} = - \frac{dH}{dQ_{iy}}</math> при <math>y=b (3)</math>, <math>\frac{dN_{i}}{dy} = - \frac{dH}{dQ_{ix}}</math> при <math>x=a (4)</math>, <math>N_{i}(a,b)=-c_{i} (5)</math>. Шаблон:Теорема Если система <math>(1)</math> является линейной системой вида <math>\frac{d^{2}Q_{i}}{dxdy}=\sum_{k=1}^{n}\Bigl[ m_{ik}(x,y)\frac{dQ_{k}}{dx}+p_{ik}(x,y)\frac{dQ_{k}}{dy} + q_{ik}(x,y)Q_{k} \Bigr] + f_{i}(u)</math>, то выполняется теорема Шаблон:Теорема Доказательство этих двух теорем смотри в книге[21].

Оптимальное управление линейными стохастическими системами

В этом случае управляемый объект или процесс описывается линейными стохастическими дифференциальными уравнениями. В этом случае решение задачи оптимального управления осуществляется на основе уравнения Риккати[23].

Задача оптимального управления

  • Система описывается линейными стохастическими дифференциальными уравнениями <math>dx=Axdt+Budt+dv, dy=Cxdt+de</math>, где <math>x</math> — <math>n</math>-мерный вектор состояния, <math>u</math> — <math>p</math>-мерный вектор управления, <math>y</math> — <math>v</math>-мерный вектор наблюдаемых переменных, <math>v(t), e(t)</math> — независимые винеровские процессы с нулевыми средними значениями и заданными ковариациями приращений, <math>A, B, C</math> — матрицы.
  • Необходимо найти оптимальное управление, минимизирующее математическое ожидание функции потерь <math>x^T(t_1)Q_0x(t_1)+\int_{t_0}^{t_1}[x^T(t)Q_1x(t)+u^TQ_2u(t)]dt]</math>.

См. также

Шаблон:Colbegin

Шаблон:Colend

Примечания

Шаблон:Примечания

Литература

Ссылки

Шаблон:Вс

  1. 1,0 1,1 Самойленко В. И., Пузырев В. А., Грубрин И. В. «Техническая кибернетика», учеб. пособие, М., изд-во МАИ, 1994, 280 с. ил., ISBN 5-7035-0489-9, гл. 4 «Оптимальные системы управления динамическими объектами и процессами», с. 63-113;
  2. Растригин Л. А. Этот случайный, случайный, случайный мир. — М., Молодая гвардия, 1969. — С. 47 — 50
  3. Шаблон:Книга
  4. Коршунов Ю. М. «Математические основы кибернетики», учеб. пособие для вузов, 2-е изд., перераб. и доп., М., «Энергия», 1980, 424 с., ил., ББК 32.81 6Ф0.1, гл. 5 «Структура и математическое описание задач оптимального управления», c. 202;
  5. Месарович М., Мако Д., Ткахара И. Теория иерархических многоуровневых систем — М., Мир, 1973. — с. 344
  6. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. - М., Наука, 1974. - с. 24
  7. Васильев Ф. П. Методы решения экстремальных задач. — М.: Наука, 1981. — С. 159.
  8. Цыпкин Я. З. Основы теории обучающихся систем. — М.: Наука, 1970. — С. 252.
  9. Александров А. Г. Оптимальные и адаптивные системы. — М.: Высшая школа, 1989. — 263 с. ISBN 5-06-000037-0
  10. Методы робастного, нейро-нечёткого и адаптивного управления: Учебник / Под ред. Н. Д. Егупова, изд. 2-ое, стер., М., Изд-во МГТУ им Н. Э. Баумана, 2002, 744 с ил., ISBN 5-7038-2030-8, тир. 2000 экз, ч. 2 «Нечёткое управление»
  11. Теплов Л. Что считать: популярные очерки по экономической кибернетике. — М., Московский рабочий, 1970. — 317 c.
  12. 12,0 12,1 12,2 Э. М. Галеев, В. М. Тихомиров «Оптимизация: теория, примеры, задачи», М., «Эдиториал УРСС», 2000, 320 с., ISBN 5-8360-0041-7, гл. 3 «Вариационное исчисление», п. 6 «Задача Лагранжа», с. 173—181;
  13. «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 2 «Численные методы расчета оптимальных программ, использующие необходимые условия экстремума», с 80 — 155;
  14. Барбаумов В. Е., Ермаков В. И., Кривенцова Н. Н. Справочник по математике для экономистов. — М., Высшая школа, 1987. — с. 243
  15. Беллманн Р. «Динамическое программирование», ИЛ, М., 1960;
  16. «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 3 «Прямые методы теории оптимального управления», с 156—265;
  17. Воронов А. А. Теория автоматического управления. Т. 1. — М.: Высшая школа, 1986, стр. 294—304.
  18. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука, 1988, стр. 522—530.
  19. Кротов В. Ф. Методы решения вариационных задач на основе достаточных условий абсолютного минимума. I—IV // Автоматика и телемеханика, 1962, т. 23, № 12, стр. 1571—1583; 1963, т. 24, № 5, стр. 581—598; 1963, т. 24, № 7, стр. 826—843; 1965, т. 26, № 1, стр. 24-41.
  20. Ж.-Л. Лионс Оптимальное управление системами, описываемыми уравнениями с частными производными, М., Мир, 1972, 412 c.
  21. 21,0 21,1 Бутковский А. Г. Теория оптимального управления системами с распределенными параметрами, М., Наука, 1965
  22. Ж.-Л. Лионс Управление сингулярными распределенными системами, М., Мир, 1987, 367 c.
  23. К. Ю. Острем Введение в стохастическую теорию управления, М., Мир, 1973