Русская Википедия:F-дивергенция

f-дивергенцией (f-расхождением) называется класс функционалов <math>D_f(P\parallel Q)</math>, определяющих в общем случае несимметричную меру расхождения между двумя распределениями вероятностей <math>P</math> и <math>Q</math>. Обычно применяется в теории информации и теории вероятностей. Функционал однозначно определяется (порождается) функцией <math>f(t)</math>, удовлетворяющей определённым условиям.

Данный класс дивергенций был введён и изучался независимо друг от друга учёными Шаблон:Harvtxt, Шаблон:Harvtxt и Шаблон:Harvtxt. Поэтому иногда можно встретить названия f-дивергенция Чисара, дивергенция Чисара—Моримото или расстояние Али—Силви.

Определение

Пусть <math>P</math> и <math>Q</math> — распределения вероятностей, заданные на множестве <math>\Omega</math>, такие что <math>P</math> абсолютно непрерывно по отношению к <math>Q</math>. Пусть функция <math>f(t)</math> выпукла при <math>t \geq 0</math> и <math>f(1)=0</math>. Тогда функция <math>f</math> задаёт f-дивергенцию <math>P</math> относительно <math>Q</math> следующим образом:

<math> D_f(P\parallel Q) = \int_{\Omega} f\left(\frac{dP}{dQ}\right)dQ = \operatorname{E}_Q f\left(\frac{dP}{dQ}\right).</math>

Если <math>\mu</math> — любая мера на <math>\Omega</math>, и оба распределения <math>P</math> и <math>Q</math> непрерывны относительно <math>\mu</math>, т.е. существуют функции <math>p = \frac{dP}{d\mu}</math> и <math>q = \frac{dQ}{d\mu}</math>, тогда f-дивергенция может быть записана как

<math> D_f(P\parallel Q) = \int_{\Omega} f\left(\frac{p}{q}\right)q\,d\mu.</math>

В случае лебеговой меры <math>\mu=x</math> распределения имеют плотности <math>p(x)</math> и <math>q(x)</math>, тогда f-дивергенция принимает вид

<math> D_f(P\parallel Q) = \int_{\Omega} f\left(\frac{p(x)}{q(x)}\right)q(x)\,dx.</math>

Для дискретных распределений <math>P=\{p_i\}</math> и <math>Q=\{q_i\}</math>, где <math>i=1,...,N</math>,

<math> D_f(P\parallel Q) = \sum_{i=1}^N f\left(\frac{p_i}{q_i}\right)q_i. </math>

Нужно заметить, что функция <math>f(t)</math> определена с точностью до слагаемого <math>c(t-1)</math>, где <math>c</math> — произвольная константа. Действительно, вид f-дивергенции не зависит от выбора <math>c</math>, поскольку слагаемое <math>c(t-1)</math> функции <math>f(t)</math> даёт нулевой вклад в значение интеграла. Кроме того, функция <math>f(t)</math> может содержать положительную мультипликативную константу <math>k</math>, которая определяет единицу измерения дивергенции. В связи с этим некоторые авторы (например, Шаблон:Harvtxt) указывают дополнительные ограничения, налагаемые на функцию <math>f(t)</math>:

Первое из этих ограничений фиксирует константу <math>c</math>, второе — константу <math>k</math>. Условие <math>f'(1)=0</math> может быть полезно тем, что в этом случае <math>f(t) \geq 0</math> с минимумом в точке <math>t=1</math> (см. Шаблон:Harvtxt), и выражение для f-дивергенции интуитивно проще воспринимается. Однако такой способ конкретизировать функцию <math>f(t)</math> не всегда удобен: например, для существования непрерывной версии f-энтропии, связанной с данной f-дивергенцией, может потребоваться другое значение константы <math>c</math>.

f-дивергенция может быть разложена в ряд Тейлора и записана в виде взвешенной суммы расстояний χ-типа (см. Шаблон:Harvtxt).

Частные случаи f-дивергенции

Многие известные дивергенции, такие как дивергенция Кульбака—Лейблера, квадрат расстояния Хеллингера, расстояние хи-квадрат и ряд других, являются частными случаями f-дивергенции, которым соответствует определённый выбор функции <math>f(t)</math>. В следующей таблице приведены некоторые распространённые виды дивергенций между распределениями вероятностей и соответствующая им функция <math>f(t)</math> (см. Шаблон:Harvtxt).

Дивергенция	Порождающая функция <math>f(t)</math>
Дивергенция Кульбака—Лейблера	<math> t \ln t</math>
Обратная Дивергенция Кульбака—Лейблера	<math> - \ln t </math>
Квадрат расстояния Хеллингера	<math>\frac12(\sqrt{t} - 1)^2,\,1-\sqrt{t},\,t-\sqrt{t}</math>
Расстояние полной вариации	t - 1\| \,</math>
Расстояние <math>\chi^2</math> Пирсона	<math>(t - 1)^2,\,t^2 -1,\,t^2 -t</math>
Расстояние <math> \chi^2</math> Неймана	<math>\frac1t-1,\,\frac1t-t</math>
Альфа-дивергенция	<math>\begin{cases} \frac{4}{1-\alpha^2}\big(t - t^{(1+\alpha)/2}\big), & \text{если}\ \alpha\neq\pm1, \\ t \ln t, & \text{если}\ \alpha=1, \\ - \ln t, & \text{если}\ \alpha=-1 \end{cases}</math>
Альфа-дивергенция (другие обозначения)	<math>\begin{cases} \frac{t^\alpha-t}{\alpha(\alpha-1)}, & \text{если}\ \alpha\neq 0,\, \alpha\neq 1, \\ t \ln t, & \text{если}\ \alpha=1, \\ - \ln t, & \text{если}\ \alpha=0 \end{cases}</math>

Свойства

Шаблон:Unordered list{\;=\;} D_f(Q\parallel P) = \int_{\Omega} f\left(\frac{dQ}{dP}\right)dP = \int_{\Omega} f^*\left(\frac{dP}{dQ}\right)dQ = D_{f^*}(P\parallel Q),</math>

где <math>f^*(t)=tf(1/t)</math> — двойственная порождающая функция. Нетрудно видеть, что <math>f^*(1)=f(1)=0</math>, <math>f^*(t)</math> непрерывна (кроме, быть может, точки <math>t = 0</math>) и <math>{f^*}(t)=\frac{1}{t^3}f(1/t) \geq 0</math> почти всюду на <math>t \geq 0</math> в силу выпуклости <math>f</math>, т.е. функция <math>f^*(t)</math> удовлетворяет условиям порождающей функции f-дивергенции. }} С учётом последнего свойства класс f-дивергенций можно было бы эквивалентным образом определить как <math>{D^*}_f(P\parallel Q)=\operatorname{E}_P f\left(\frac{dQ}{dP}\right)</math>. Подобное определение встречается, например, у Шаблон:Harvtxt. Таким образом, интерпретация распределения <math>Q</math> как истинного, которая следует из определения f-дивергенции, не является её фундаментальным свойством, а является лишь следствием соглашения о порядке следования аргументов в определении. Иными словами, аргументы <math>P</math> и <math>Q</math> концептуально равноправны.

Также стоит отметить, что f-дивергенция является безразмерной величиной независимо от размерности множества <math>\Omega</math>.

Связанные понятия

Кроме f-дивергенции, И. Чисар определил связанное с ней понятие f-энтропии (Шаблон:Harvtxt).

Ссылки

Шаблон:Refbegin

Шаблон:Refend

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:F-дивергенция

Содержание

Определение

Частные случаи f-дивергенции

Свойства

Связанные понятия

Ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты