Русская Википедия:Неравенство Гаусса

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.

Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (Xm)2. (τ2 может также быть выражено как (μm)2 + σ2, где μ и σ являются средним значением и стандартным отклонением X.)

<math>

\Pr(|X - m| > k) \leq \begin{cases} \left( \frac{2\tau}{3k} \right)^2, & \text{if } k \geq \frac{2\tau}{\sqrt{3}}; \\[6pt] 1 - \frac{k}{\tau\sqrt{3}}, & \text{if } 0 \leq k \leq \frac{2\tau}{\sqrt{3}}. \end{cases}</math>

Эта теорема была впервые доказана Гауссом в 1823 году.

Доказательство

Без ограничения общности можно считать, что мода находится в нуле, то есть <math>m=0</math>.

Переход к квантилям

Рассмотрим вероятность того, что выполняется неравенство <math>\left\vert X \right\vert \leq x</math>, как функцию от <math>x</math>:

<math>p\left(x\right)=\int\limits_{-x}^{x}f\left(z\right)dz.</math>

Так как <math>f\left(x\right)</math> является неотрицательной функцией, то <math>p(x)</math>растёт с ростом <math>x</math>.

Кроме того, по определению определённого интеграла:

<math>p\left(0\right)=0.</math>

В силу формулы Лейбница:

<math>\frac{dp}{dx}=f\left(x\right)+f\left(-x\right).</math>

Рассмотрим обратную функцию (квантиль) распределения случайной величины <math>\left\vert X \right\vert</math>:

<math>x=q\left(p\right).</math>

В силу теоремы о производной обратной функции:

<math>q^{\prime}\left(p\right)=\frac{dx}{dp}=\left[\frac{dp}{dx}\right]^{-1}=\frac{1}{f\left(x\right)+f\left(-x\right)}.</math>

Заметим, что с ростом <math>p</math>возрастает и <math>x</math>, в силу унимодальности с ростом по модулю <math>x</math>функция <math>f\left(x\right)</math>не возрастает, значит с ростом <math>x</math>функция <math>q^{\prime}\left(p\right)</math>не убывает.

Линеаризация функции <math>q\left(p\right)</math>

Выберем произвольную точку <math>q_{0}=q\left(p_{0}\right)</math> и линеаризуем <math>q\left(p\right)</math> точке <math>p_{0}</math>, то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:

<math>L\left(p\right)=q\left(p_{0}\right)+q^{\prime}\left(p_{0}\right)\left(p-p_{0}\right)=q_{0}+q^{\prime}\left(p_{0}\right)\left(p-p_{0}\right).</math>

Данное уравнение можно переписать следующим образом:

<math>L\left(p\right)=q^{\prime}\left(p_{0}\right)\left(p-p_{1}\right),</math>

где

<math>p_{1}=p_{0}-\frac{q_{0}}{q^{\prime}\left(p_{0}\right)}=p_{0}\left(1-\frac{q_{0}}{p_{0}\cdot q^{\prime}\left(p_{0}\right)}\right)=g\cdot p_{0}.</math>

Поскольку величины <math>p_0</math>, <math>q_0</math>и <math>q^{\prime}\left(p_0\right)</math>являются неотрицательными, то

<math>0 \le p_{1}\le p_{0},</math>

а значит

<math>0\le g\le1.</math>

Так как <math>q^{\prime}\left(p\right)</math> не убывает с ростом <math>p</math>, а <math>L^{\prime}\left(p\right)=q^{\prime}\left(p_{0}\right)=\operatorname{const},</math>то разность <math>q^{\prime}\left(p\right)-L^{\prime}\left(p\right)</math> имеет тот же знак, что <math>p-p_{0}</math>. Из этого следует, что величина <math>q\left(p\right)-L\left(p\right)</math> всегда является неотрицательной, а следовательно:

<math>q\left(p\right)\ge L\left(p\right).</math>

Поскольку <math>q\left(p\right)\ge0</math> то из <math>L\left(p\right)\ge0</math> (то есть из <math>p\ge p_{1}</math>) следует

<math>L^{2}\left(p\right)\le q^{2}\left(p\right)</math>.

Получение оценки

Проинтегрируем последнее неравенство в пределах от <math>p_{1}</math>до <math>1</math>:

<math> \int_{p_{1}}^{1}L^{2}\left(p\right) dp \le \int_{p_{1}}^{1}q^{2}\left(p\right)dp \le \int_{0}^{1}q^{2}\left(p\right)dp=\int_{-\infty}^{+\infty}x^{2}\cdot f\left(x\right)dx.</math>

Последнее выражение обозначим как <math> \tau^{2}</math>:

<math> \tau^{2}=\int_{-\infty}^{+\infty}x^{2}\cdot f\left(x\right)dx.</math>

Данная величина есть математическое ожидание квадрата случайной величины <math>X</math>. По свойствам дисперсии:

<math> \tau^{2}=\mu^2+\sigma^2,</math>

где <math> \sigma^2</math>— дисперсия случайной величины <math> X</math>, <math> \mu</math> — её математическое ожидание.

Вычислим теперь интеграл в левой части последнего неравенства:

<math>\int_{p_{1}}^{1}L^{2}\left(p\right)dp = \int_{p_{1}}^{1}\left[q^{\prime}\left(p_{0}\right)\right]^{2}\left(p-p_{1}\right)^{2}dp = \left[q^{\prime}\left(p_{0}\right)\right]^{2}\left.\frac{\left(p-p_{1}\right)^{3}}{3}\right|_{p_{1}}^{1}=\left[q^{\prime}\left(p_{0}\right)\right]^{2}\frac{\left(1-p_{1}\right)^{3}}{3}\le\tau^{2}</math>
<math>p_{1}=p_{0}-\frac{q_{0}}{q^{\prime}\left(p_{0}\right)}.</math>
<math>p_{0}-p_{1}=\frac{q_{0}}{q^{\prime}\left(p_{0}\right)}</math>
<math>q^{\prime}\left(p_{0}\right)=\frac{q_{0}}{p_{0}-p_{1}}</math>
<math>\left[\frac{q_{0}}{p_{0}-p_{1}}\right]^{2}\frac{\left(1-p_{1}\right)^{3}}{3}\le\tau^{2}</math>

Преобразуем это неравенство к виду

<math id="main_inequality">\frac{q_{0}^{2}}{\tau^{2}} \le \frac{3\left(p_{0}-p_{1}\right)^{2}}{\left(1-p_{1}\right)^{3}}=\frac{3\left(p_{0}-gp_{0}\right)^{2}}{\left(1-gp_{0}\right)^{3}}=\frac{3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}.</math>

Исследование верхней границы

Исследуем верхнюю границу на экстремальные значения (в зависимости от значения <math> g</math>). Начнём с нахождения корней производной:

<math>\begin{align} \frac{\partial}{\partial g}\left[\frac{3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}\right] = \\

& =3p_{0}^{2}\cdot\frac{2\left(1-g\right)\cdot\left(-1\right)\cdot\left(1-gp_{0}\right)^{3}-\left(1-g\right)^{2}\cdot3\left(1-gp_{0}\right)^{2}\cdot\left(-p_{0}\right)}{\left(1-gp_{0}\right)^{6}} = \\ & =\frac{3p_{0}^{2}\left(1-g\right)\left(1-gp_{0}\right)^{2}\left[-2\left(1-gp_{0}\right)+3\left(1-g\right)p_{0}\right]}{\left(1-gp_{0}\right)^{6}} = \\ & =\frac{3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}\left[-2+2gp_{0}+3p_{0}-3gp_{0}\right] = \\ & =-\frac{3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}\left[2-3p_{0}+gp_{0}\right] \\ \end{align}</math>

Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:

<math>2-3p_{0}+g_{0}\cdot p_{0}=0.</math>

Решая данное уравнение, получим:

<math>g_{0}\cdot p_{0}=3p_{0}-2.</math>
<math>g_{0}=3-\frac{2}{p_{0}}.</math>

Величина <math>g</math> также должно удовлетворять условию <math>0\le g\le1</math> :

<math>0\le3-\frac{2}{p_{0}}\le1</math>

Решая данное неравенство, получим:

<math>-3\le-\frac{2}{p_{0}}\le-2</math>
<math>2\le\frac{2}{p_{0}}\le3</math>
<math>\frac{1}{3}\le\frac{p_{0}}{2}\le\frac{1}{2}</math>
<math>\frac{2}{3}\le p_{0}\le1.</math>

Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать <math>\left[0;1\right]</math> только при <math>p_{0}\ge\frac{2}{3}.</math>

Рассмотрим сначала случай <math>p_{0}\le\frac{2}{3}</math>.

В этом случае всегда

<math>\frac{\partial}{\partial g}\left[\frac{3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}\right]\le0,</math>

а следовательно максимум выражения в квадратных скобках достигается при <math>g=0</math>:

<math>\frac{q_{0}^{2}}{\tau^{2}} \le 3p_{0}^{2}</math>

или

<math>p_{0}\le\frac{q_{0}}{\tau\sqrt{3}}.</math>

Если же <math>p_{0}>\frac{2}{3}</math>, то максимум будет в точке <math>g_{0}=3-\frac{2}{p_{0}}=\frac{3p_{0}-2}{p_{0}}.</math> Вычислим необходимые нам величины:

<math>1-g_{0}=1-3+\frac{2}{p_{0}}=\frac{2}{p_{0}}-2=\frac{2\left(1-p_{0}\right)}{p_{0}}</math>

и

<math>1-g_{0}p_{0}=1-\left(3p_{0}-2\right)=3\left(1-p_{0}\right).</math>

Подставляя эти выражения в исследуемое неравенство, получим:

<math>\frac{q_{0}^{2}}{\tau^{2}} \le \frac{3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}=\frac{3p_{0}^{2}}{3^{3}\left(1-p_{0}\right)^{3}}\frac{2^{2}\left(1-p_{0}\right)^{2}}{p_{0}^{2}}=\left(\frac{2}{3}\right)^{2}\frac{1}{1-p_{0}}</math>

или

<math> 1-p_{0}\le\left(\frac{2}{3}\right)^{2}\frac{\tau^{2}}{q_{0}^{2}}.</math>

Объединим полученные неравенства:

<math>\frac{q_{0}^{2}}{\tau^{2}}\le\begin{cases}

3p_{0}^{2}, & p_{0}\le\frac{2}{3}\\ \frac{4}{9}\frac{1}{\left(1-p_{0}\right)}, & p_{0}>\frac{2}{3} \end{cases}</math>

Извлекая квадратный корень, окончательно получим:

<math>\frac{q_{0}}{\tau}\le\begin{cases}

\sqrt{3}p_{0}, & p_{0}\le\frac{2}{3}\\ \frac{2}{3}\frac{1}{\sqrt{1-p_{0}}}, & p_{0}>\frac{2}{3} \end{cases}</math>

Обращение неравенств

Если <math>p_{0}\le\frac{2}{3}</math>, то

<math>\frac{q_{0}^{2}}{\tau^{2}}\le3p_{0}^{2}\le3\left(\frac{2}{3}\right)^{2}=\frac{4}{3}.</math>

Откуда получаем

<math>q_{0}\le\frac{2\tau}{\sqrt{3}}.</math>

Это позволяет получить следующее неравенство:

<math> 1-p_{0}=\begin{cases}

1-\frac{q_{0}}{\sqrt{3}\tau}, & q_{0}\le\frac{2\tau}{\sqrt{3}}\\ \frac{4}{9}\frac{\tau^{2}}{q_{0}^{2}}, & q_{0}\ge\frac{2\tau}{\sqrt{3}} \end{cases}</math>

Обозначая <math>p_{0}=p</math> и <math>q_{0}=x</math>, получим:

<math>\Pr\left\{ \left|X\right|>x\right\} =\begin{cases}

1-\frac{x}{\sqrt{3}\tau}, & x\le\frac{2\tau}{\sqrt{3}}\\ \frac{4}{9}\frac{\tau^{2}}{x^{2}}, & x\ge\frac{2\tau}{\sqrt{3}} \end{cases}.</math>

Завершение доказательства

Выше мы предполагали, что мода случайной величины <math> X</math> равна нулю. В случае произвольной моды <math> m</math>, нужно приведённые выше рассуждения применить к случайной величине <math> X-m</math>, мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:

<math>\Pr\left\{ \left|X-m\right|>x\right\} =\begin{cases}

1-\frac{x}{\sqrt{3}\tau}, & x\le\frac{2\tau}{\sqrt{3}}\\ \frac{4}{9}\frac{\tau^{2}}{x^{2}}, & x\ge\frac{2\tau}{\sqrt{3}} \end{cases}.</math> Величина <math>\tau^2</math>перейдём, по свойствам математического ожидания и дисперсии, в

<math>\tau^2=\left(\mu-m\right)^2+\sigma^2.</math>

Таким образом, теорема полностью доказана.

См. также

Ссылки