Русская Википедия:Стохастическая аппроксимация

Стохастическая аппроксимация — рекуррентный метод построения состоятельной последовательности оценок решений уравнений регрессии и экстремумов функций регрессии в задачах непараметрического оценивания. В биологии, химии, медицине используется для анализа результатов опытов. В теории автоматического управления применяется как средство решения задач распознавания, идентификации, обучения и адаптации^[1]. Основоположниками метода стохастической аппроксимации являются Кифер, Вольфовиц^[2], Робинс, Монро ^[3].

Поиск решения уравнения регрессии

Пусть каждому значению параметра <math>x</math> соответствует измеряемая опытным путём случайная величина <math>y</math> с функцией распределения <math>F(y|x)</math>, причем математическое ожидание величины <math>y</math> при фиксированном параметре <math>x</math> <math>m(y|x)=m(x)</math>. Требуется найти решение уравнения регрессии <math>m(x)=\alpha</math>. Предполагается, что решение уравнения регрессии единственно, а функции <math>F(y|x)</math> и <math>m(x)</math> неизвестны.

Процедура стохастической аппроксимации для получения оценок корня <math>\hat{x}</math> уравнения регрессии <math>m(\hat{x})=\alpha</math> заключается в использовании полученной на основании опыта обучающей выборки измеряемых случайных величин <math>y_{1}, ..., y_{n}</math>.

Оценка <math>\hat{x_{n+1}}</math> искомого корня находится на основе предыдущей оценки <math>\hat{x_{n}}</math> с помощью обучающего значения измеренной случайной величины <math>y_{n}</math> с помощью соотношения <math>\hat{x_{n+1}} = \hat{x_{n}} + a_{n}(\alpha - y_{n})</math>, где <math>n \geqslant 1</math>, <math>\hat{x_{1}}</math> - произвольное число^[3].

Если последовательность коэффициентов <math>a_{n}</math> удовлетворяет условиям <math>a_{n} > 0</math>, <math>\sum_{n=1}^{\infty} a_{n} = \infty</math>, <math>\sum_{n=1}^{\infty} a_{n}^{2} < \infty</math>, то при <math>n \to \infty</math> оценка <math>\hat{x_{n+1}}</math> стремится по вероятности к корню уравнения <math>m(\hat{x})=\alpha</math>.

При некоторых дополнительных требованиях к функции регрессии <math>m(x)</math> оценки <math>\hat{x_{n+1}}</math> могут сходится в среднеквадратическом к решению уравнения регрессии Шаблон:Sfn^[4].

Примеры

Твёрдость сплава меди с железом <math>y</math> зависит от времени <math>x</math>, в течение которого сплав подвергается воздействию высокой температуры. В этом случае измеряемой случайной величиной является твёрдость сплава <math>y</math>, а задача состоит в определении времени <math>\hat{x}</math>, при котором сплав имеет заданную твёрдость <math>y = \alpha</math>Шаблон:Sfn.

Поиск экстремума функции регрессии

Оценка <math>\hat{x_{n+1}}</math> экстремального значения функции регрессии находится на основе предыдущей оценки <math>\hat{x_{n}}</math> и обучающих значений измеренной случайной величины <math>y_{2n}</math> и <math>y_{2n-1}</math> с помощью соотношения <math>\hat{x_{n+1}} = \hat{x_{n}} + \frac{a_{n}}{c_{n}}(y_{2n}-y_{2n-1})</math>, где <math>n \geqslant 1</math>, <math>\hat{x_{1}}</math> - произвольное число, <math>a_{n}</math> - последовательность положительных чисел, а последовательности <math>y_{2n}</math> и <math>y_{2n-1}</math> независимы и соответствуют значениям параметра <math>\hat{x_{n}}+c_{n}</math> и <math>\hat{x_{n}}-c_{n}</math>^[2].

Если последовательности коэффициентов <math>a_{n}</math> и <math>c_{n}</math> удовлетворяют условиям <math>a_{n} > 0</math>, <math>c_{n} > 0</math>, <math>c_{n} \to 0</math> при <math>n \to \infty</math>, <math>\sum_{n=1}^{\infty} a_{n} = \infty</math>, <math>\sum_{n=1}^{\infty} a_{n}c_{n} < \infty</math>, <math>\sum_{n=1}^{\infty} (\frac{a_{n}}{c_{n}})^{2} < \infty</math>, то при <math>n \to \infty</math> оценка <math>\hat{x_{n+1}}</math> стремится по вероятности к экстремальному значению функции регрессии.

При некоторых дополнительных требованиях к функции регрессии <math>m(x)</math> оценки <math>\hat{x_{n+1}}</math> могут сходится в среднеквадратическом к экстремуму функции регрессии^[4].

Примеры

Урожайность участка земли <math>y</math> зависит от количества удобрений <math>x</math>. В этом случае измеряемой случайной величиной является урожайность <math>y</math>, а задача состоит в определении количества удобрений <math>\hat{x}</math>, при котором участок земли имеет макcимальную урожайностьШаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

↑ Цыпкин Я.З. “Адаптация, обучение и самообучение в автоматических системах”, // Автоматика и телемеханика. — 1966. — № 1. — С. 23–61. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at10991
↑ ^2,0 ^2,1 Кiefer J., Wolfowitz J. Stochastic Estimation of the Maximum of a Regression Function // Ann. Math. Statistics. — 1952. — v. 23. — № 3.
↑ ^3,0 ^3,1 Robbins Н., Monro S. A stochastic approximation method // Annals of Math. Stat. — 1951. — v. 22. — № 1. — С. 400—407.
↑ ^4,0 ^4,1 Логинов Н. В. “Методы стохастической аппроксимации” // Автоматика и телемеханика. — 1966. — № 4. — С. 185–204. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at11080

[1] Цыпкин Я.З. “Адаптация, обучение и самообучение в автоматических системах”, // Автоматика и телемеханика. — 1966. — № 1. — С. 23–61. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at10991

[Kiefer-2] 2,0 ^2,1 Кiefer J., Wolfowitz J. Stochastic Estimation of the Maximum of a Regression Function // Ann. Math. Statistics. — 1952. — v. 23. — № 3.

[Robbins-3] 3,0 ^3,1 Robbins Н., Monro S. A stochastic approximation method // Annals of Math. Stat. — 1951. — v. 22. — № 1. — С. 400—407.

[Loginov-4] 4,0 ^4,1 Логинов Н. В. “Методы стохастической аппроксимации” // Автоматика и телемеханика. — 1966. — № 4. — С. 185–204. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at11080

[1]

[2]

[3]

[4]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Стохастическая аппроксимация

Содержание

Поиск решения уравнения регрессии

Примеры

Поиск экстремума функции регрессии

Примеры

Примечания

Литература

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты