Русская Википедия:Минимизация эмпирического риска

Минимизация эмпирического риска (МЭР, Шаблон:Lang-en, ERM) — это принцип статистической теории обучения, который определяет семейство обучающихся алгоритмов и который задаёт теоретические границы результативности.

Основания

Рассмотрим следующую ситуацию, которая является основной установкой многих задач контролируемого обучения. Мы имеем два пространства объектов <math>X</math> и <math>Y</math> и хотели бы натренировать функцию <math>\ h: X \to Y</math> (часто именуемую гипотезой), которая ставит объект <math>y \in Y</math> в соответствие объекту <math>x \in X</math>. Для этого мы имеем в распоряжении тренировочный набор из <math>n</math> экземпляров <math>\ (x_1, y_1), \ldots, (x_n, y_n)</math>, где <math>x_i \in X</math> является входом, а <math>y_i \in Y</math> является соответствующим ответом, который мы хотим получить от <math>\ h(x_i)</math>.

Выражаясь более формально, предположим, что существует совместное распределение <math>P(x, y)</math> над <math>X</math> и <math>Y</math>, и что тренировочный набор состоит из <math>n</math> экземпляров <math>\ (x_1, y_1), \ldots, (x_n, y_n)</math>, выбранных из независимых случайно распределённых величин из <math>P(x, y)</math>. Заметим, что допущение о совместном распределении позволяет симулировать неопределённость в предсказании (например, из-за шума в данных), поскольку <math>y</math> не является детерминированной функцией от <math>x</math>, а скорее случайной величиной с условным распределением <math>P(y | x)</math> для фиксированного <math>x</math>.

Предположим также, что нам дана неотрицательная вещественнозначная функция потери <math>L(\hat{y}, y)</math>, которая измеряет то, насколько отличается предсказание <math>\hat{y}</math> гипотезы от истинного выхода <math>y.</math> Шаблон:Не переведено 5, ассоциированный с гипотезой <math>h(x)</math>, определяется тогда как математическое ожидание функции потери:

<math>R(h) = \mathbf{E}[L(h(x), y)] = \int L(h(x), y)\,dP(x, y).</math>

Часто в качестве функции потери в теории используется 0-1 функция потери: <math>L(\hat{y}, y) = I(\hat{y} \ne y)</math>, где <math>I(\dots)</math> означает индикатор.

Высшей целью обучающегося алгоритма является отыскание гипотезы <math> h^*</math> в фиксированном классе функций <math>\mathcal{H}</math>, для которых риск <math>R(h)</math> минимален:

<math>h^* = \arg \min_{h \in \mathcal{H}} R(h).</math>

Минимизация эмпирического риска

В общем случае риск <math>R(h)</math> не может быть вычислен, поскольку распределение <math>P(x, y)</math> неизвестно для обучающего алгоритма (эта ситуация называется агностическим обучением). Однако мы можем вычислить аппроксимацию, именуемую эмпирическим риском, путём усреднения функции потери на тренировочном наборе:

Принцип минимизации эмпирического риска (МЭР) Шаблон:Sfn утверждает, что обучающийся алгоритм должен выбирать гипотезу <math>\hat{h}</math>, которая минимизирует риск:

<math>\hat{h} = \arg \min_{h \in \mathcal{H}} R_{\text{emp}}(h).</math>

Тогда обучающийся алгоритм, определённый принципом МЭР состоит в решении вышеуказанной задачи оптимизации.

Свойства

Вычислительная сложность

Известно, что минимизация эмпирического риска для задачи классификации с 0-1 функцией потери является NP-трудной даже для такого относительно простого класса функций задач, как линейные классификаторы Шаблон:Sfn. Хотя она может быть эффективно решена, когда минимальный эмпирический риск равен нулю, то есть данные линейно сепарабельны.

На практике автоматически обучающиеся алгоритмы справляются с этим либо путём выпуклой аппроксимации до 0-1 функции потери (подобно Шаблон:Не переведено 5 для машин опорных элементов), которую проще оптимизировать, либо выдвижением допущения о распределении <math>P(x, y)</math> (а тогда обучающийся алгоритм перестаёт быть агностическим).

См. также

Метод максимального правдоподобия

Примечания

Шаблон:Примечания

Литература

Шаблон:Refbegin

Шаблон:Refend

Литература для дальнейшего чтения

Шаблон:Книга

Шаблон:Машинное обучение

Шаблон:Rq

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Минимизация эмпирического риска

Содержание

Основания

Минимизация эмпирического риска

Свойства

Вычислительная сложность

См. также

Примечания

Литература

Литература для дальнейшего чтения

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты