Русская Википедия:Метод сопряжённых градиентов

Шаблон:Другие значения Метод сопряжённых градиентов (Метод Флетчера — Ривcа) — метод нахождения локального экстремума функции на основе информации о её значениях и её градиенте. В случае квадратичной функции в <math>\mathbb{R}^n</math> минимум находится не более чем за <math>n</math> шагов.

Основные понятия

Определим терминологию:

Пусть <math>\vec{S_1},\ldots,\vec{S_n} \in \mathbb{X} \subset \mathbb{R}^n</math>.

Введём на <math>\mathbb{X}</math> целевую функцию <math>f(\vec{x})\in \mathrm{C^2}(\mathbb{X})</math>.

Векторы <math>\vec{S_1},\ldots,\vec{S_n}</math> называются сопряжёнными, если:

<math>\vec{S_i}^T H \vec{S_j}=0, \quad i\neq j, \quad i,j=1,\ldots,n</math>
<math>\vec{S_i}^T H \vec{S_i}\geqslant 0, \quad i=1,\ldots,n</math>

где <math>H</math> — матрица Гессе <math>f(\vec{x})</math>.

Шаблон:Message box

Обоснование метода

Нулевая итерация

Файл:Conjugate gradient illustration.svg

Иллюстрация последовательных приближений метода наискорейшего спуска (зелёная ломаная) и метода сопряжённых градиентов (красная ломаная) к точке экстремума.

Пусть <math>\vec{S_0}=-\nabla f(\vec{x_0})\qquad (1)</math>

Тогда <math>\vec{x_1}=\vec{x_0}+\lambda_1 \vec{S_0} \qquad</math>.

Определим направление

<math>\vec{S_1}=-\nabla f(\vec{x_1})+\omega_1 \vec{S_0}\ \qquad (2)</math>

так, чтобы оно было сопряжено с <math>\vec{S_0}</math>:

<math>\vec{S_0}^T H \vec{S_1}=0 \qquad (3)</math>

Разложим <math>\nabla f(\vec{x})</math> в окрестности <math>\vec{x_0}</math> и подставим <math>\vec{x}=\vec{x_1}</math>:

<math>\nabla f(\vec{x_1})-\nabla f(\vec{x_0})=H \, (\vec{x_1}-\vec{x_0})=\lambda_1 H \vec{S_0}</math>

Транспонируем полученное выражение и домножаем на <math>H^{-1}</math> справа:

<math>(\nabla f(\vec{x_1})-\nabla f(\vec{x_0}))^T H^{-1}=\lambda_1 \vec{S_0}^T H^T H^{-1}</math>

В силу непрерывности вторых частных производных <math>H^T=H</math>. Тогда:

<math>\vec{S_0}^T=\frac{(\nabla f(\vec{x_1})-\nabla f(\vec{x_0}))^T H^{-1}}{\lambda_1}</math>

Подставим полученное выражение в (3):

<math>\frac{(\nabla f(\vec{x_1})-\nabla f(\vec{x_0}))^T H^{-1}H\vec{S_1}}{\lambda_1}=0</math>

Тогда, воспользовавшись (1) и (2):

<math>(\nabla f(\vec{x_1})-\nabla f(\vec{x_0}))^T (-\nabla f(\vec{x_1})-\omega_1\nabla f(\vec{x_0})))=0\qquad (4)</math>

Если <math>\lambda=\arg\min_\lambda f(\vec{x_0}+\lambda \vec{S_0})</math>, то градиент в точке <math>\vec{x_1}=\vec{x_0}+\lambda \vec{S_0}</math> перпендикулярен градиенту в точке <math>\vec{x_0}</math>, тогда по правилам скалярного произведения векторов:

<math>(\nabla f(\vec{x_0}),\nabla f(\vec{x_1}))=0</math>

Приняв во внимание последнее, получим из выражения (4) окончательную формулу для вычисления <math>\omega</math>:

<math>\omega_1=\frac{||\nabla f(\vec{x_1})||^2}{||\nabla f(\vec{x_0})||^2}</math>

К-я итерация

На k-й итерации имеем набор <math>\vec{S_0},\ldots,\vec{S_{k-1}}</math>.

Тогда следующее направление вычисляется по формуле:

<math>\vec{S_k}=-\nabla f(\vec{x_k}) - \|\nabla f(\vec{x_k})\|^2 {\cdot} \left( \frac{\nabla f(\vec{x}_{k-1})}{\|\nabla f(\vec{x}_{k-1})\|^2} + \ldots + \frac{\nabla f(\vec{x_0})}{\|\nabla f(\vec{x}_0)\|^2} \right)</math>

Это выражение может быть переписано в более удобном итеративном виде:

<math>\vec{S_k}=-\nabla f(\vec{x_k})+\omega_k \vec{S}_{k-1},\qquad \omega_i=\frac{\|\nabla f(\vec{x_i})\|^2}{\|\nabla f(\vec{x}_{i-1})\|^2},</math>

где <math>\omega_k</math> непосредственно рассчитывается на k-й итерации.

Алгоритм

Пусть <math>\vec{x}_0</math> — начальная точка, <math>\vec{r}_0</math> — направление антиградиента и мы пытаемся найти минимум функции <math>f(\vec{x})</math>. Положим <math>\vec{S}_0=\vec{r}_0</math> и найдём минимум вдоль направления <math>\vec{S}_0</math>. Обозначим точку минимума <math>\vec{x}_1</math>.

Пусть на некотором шаге мы находимся в точке <math>\vec{x}_k</math>, и <math>\vec{r}_k</math> — направление антиградиента. Положим <math>\vec{S}_k=\vec{r}_{k}+\omega_k \vec{S}_{k-1}</math>, где <math>\omega_k</math> выбирают либо <math>\frac{(\vec{r}_k,\vec{r}_k)}{(\vec{r}_{k-1},\vec{r}_{k-1})}</math> (стандартный алгоритм — Флетчера-Ривса, для квадратичных функций с <math>H>0</math>), либо <math>\max(0,\frac{(\vec{r}_k,\vec{r}_k-\vec{r}_{k-1})}{(\vec{r}_{k-1},\vec{r}_{k-1})})</math> (алгоритм Полака–Рибьера). После чего найдём минимум в направлении <math>\vec{S_k}</math> и обозначим точку минимума <math>\vec{x}_{k+1}</math>. Если в вычисленном направлении функция не уменьшается, то нужно забыть предыдущее направление, положив <math>\omega_k=0</math> и повторив шаг.

Формализация

Задаются начальным приближением и погрешностью: <math>\vec{x}_0,\quad \varepsilon, \quad k=0</math>
Рассчитывают начальное направление: <math>j=0,\quad \vec{S}_k^j=-\nabla f(\vec{x}_k),\quad \vec{x}_k^j=\vec{x}_k</math>
<math>\vec{x}_k^{j+1}=\vec{x}_k^j+\lambda\vec{S}_k^j,\quad \lambda=\arg\min_\lambda f(\vec{x}_k^j+\lambda \vec{S}_k^j),\quad \vec{S}_k^{j+1}=-\nabla f(\vec{x}_k^{j+1})+\omega \vec{S}_k^j,\quad \omega=\frac{||\nabla f(\vec{x}_k^{j+1})||^2}{||\nabla f(\vec{x}_k^{j})||^2}</math>
- Если <math>||\vec{S}_k^{j+1}||<\varepsilon</math> или <math>||\vec{x}_k^{j+1}-\vec{x}_k^j||<\varepsilon</math>, то <math>\vec{x}=\vec{x}_k^{j+1}</math> и остановка.
- Иначе
  - если <math>(j+1)<n</math>, то <math>j=j+1</math> и переход к 3;
  - иначе <math>\vec{x}_{k+1}=\vec{x}_k^{j+1},\quad k=k+1</math> и переход к 2.

Случай квадратичной функции

Шаблон:Message box

Литература

Шаблон:Методы оптимизации

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Метод сопряжённых градиентов

Содержание

Основные понятия

Обоснование метода

Нулевая итерация

К-я итерация

Алгоритм

Формализация

Случай квадратичной функции

Литература

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты