Русская Википедия:Локальная теорема Муавра — Лапласа

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Файл:De moivre-laplace-bzn.gif
С ростом n форма биномиальной фигуры распределения становится похожа на плавную кривую Гаусса.

Теорема Муавра — Лапласа — одна из предельных теорем теории вероятностей, установлена Лапласом в 1812 году. Если при каждом из <math>n</math> независимых испытаний вероятность появления некоторого случайного события <math>E</math> равна <math>p \in (0, 1)</math>, и <math>m</math> — число испытаний, в которых <math>E</math> фактически наступает, то вероятность справедливости неравенства близка (при больших <math>n</math>) к значению интеграла Лапласа.

Применение

При рассмотрении количества <math>m</math> появлений события <math>A</math> в <math>n</math> испытаниях Бернулли чаще всего нужно найти вероятность того, что <math>m</math> заключено между некоторыми значениями <math>a</math> и <math>b</math>. Так как при достаточно больших <math>n</math> промежуток <math>[a, b]</math> содержит большое число единиц, то непосредственное использование биномиального распределения

<math>p_n(m)=\frac{n!}{m!(n - m)!}p^mq^{n-m}</math>

требует громоздких вычислений, так как нужно суммировать большое число определённых по этой формуле вероятностей.

Поэтому используют асимптотическое выражение для биномиального распределения при условии, что <math>p</math> фиксировано, а <math>n\rightarrow+\infty</math>. Теорема Муавра — Лапласа утверждает, что таким асимптотическим выражением для биномиального распределения является нормальная функция.

Формулировка

Если в схеме Бернулли <math>n</math> стремится к бесконечности, величина <math>p \in (0, 1)</math> постоянна, а величина <math>x_m = \frac{m - np}{\sqrt{npq}}</math> ограничена равномерно по <math>m</math> и <math>n</math> (то есть <math>\exists a, b: -\infty < a \leqslant x_m \leqslant b < +\infty</math>), то

<math>P_n(m) = \frac{1}{\sqrt{2\pi npq}}\exp\left(-\frac{x_m^2}{2}\right)(1 + \alpha_n(m))</math>

где <math>\left| \alpha_n(m) \right| < \frac{c}{\sqrt{n}}, c=\text{const} >0</math>.

Приближённую формулу

<math>P_n(m) \approx \frac{1}{\sqrt{2\pi npq}}\exp\left(-\frac{x_m^2}{2}\right)</math>

рекомендуется применять при <math>n > 100</math> и при <math>m > 20</math>.

Доказательство

Для доказательства теоремы будем использовать формулу Стирлинга из математического анализа:

<math>s!=\sqrt{2\pi}s^{s+1/2}e^{-s}e^{\theta_s},</math> (1)

где <math>0<\theta_s<1/{12s}</math>.

При больших <math>s</math> величина <math>\theta</math> очень мала, и приближённая формула Стирлинга, записанная в простом виде

<math>s!=\sqrt{2\pi}s^{s+1/2}e^{-s}</math> (2)

даёт малую относительную ошибку, быстро стремящуюся к нулю при <math>s\rightarrow+\infty</math>.

Нас будут интересовать значения <math>m</math>, не очень отличающиеся от наивероятнейшего. Тогда при фиксированном <math>p</math> условие <math>n\rightarrow+\infty</math> будет также означать, что

<math>m\rightarrow+\infty, n-m\rightarrow+\infty.</math> (3)

Поэтому использование приближённой формулы Стирлинга для замены факториалов в биномиальном распределении допустимо, и мы получаем

<math>p_n(m)\approx\sqrt{\frac{n}{2\pi m(n-m)}}\left(\frac{np}{m}\right)^{m}\left(\frac{nq}{n-m}\right)^{n-m}.</math> (4)

Также понадобится использование отклонения относительной частоты от наивероятнейшего значения:

<math>x_m=\frac{m}{n}-p.</math> (5)

Тогда выражение (4) приобретает вид:

<math>p_n(m)=\left[2\pi n(p+x_m)(q-x_m)\right]^{-1/2}\left(1+\frac{x_m}{p}\right)^{-n(p+x_m)}\left(1-\frac{x_m}{q}\right)^{-n(q-x_m)}.</math> (6)

Предположим, что

<math>x_m<pq.</math> (7)

Взяв логарифм второго и третьего множителей равенства (6), применим разложение в ряд Тейлора:

<math>-n\left[(p+x_m)\ln{\left(1+\frac{x_m}{p}\right)} + (q-x_m)\ln{\left(1-\frac{x_m}{q}\right)}\right]=</math>
<math>-n\left[(p+x_m)\left(\frac{x_m}{p}-\frac{x_m^2}{2p^2}+\frac{x_m^3}{3p^3}-\cdots\right)+(q-x_m)\left(-\frac{x_m}{q}-\frac{x_m^2}{2q^2}-\frac{x_m^3}{3q^3}-\cdots\right)\right].</math> (8)

Располагаем члены этого разложения по степеням <math>x_m</math>:

<math>-n\left[\frac{x_m^2}{2}\left(\frac{1}{p}+\frac{1}{q}\right)-\frac{x_m^3}{6}\left(\frac{1}{p^2}-\frac{1}{q^2}\right)+\cdots\right].</math> (9)

Предположим, что при <math>n\rightarrow+\infty,</math>

<math>nx_m^3\rightarrow 0.</math> (10)

Это условие, как уже было указано выше, означает, что рассматриваются значения <math>m</math> не очень далёкие от наивероятнейшего. Очевидно, что (10) обеспечивает выполнение (7) и (3).

Теперь, пренебрегая вторым и последующими членами в разложении (6), получаем, что логарифм произведения второго и третьего членов произведения в правой части (8) равен

<math>-\frac{n}{2pq}x_m^2.</math> (11)

Отбрасывая малые слагаемые в скобках первого множителя (6), получаем

<math>p_n(m)\approx\left(\frac{1}{\sqrt{2\pi npq}}\right)\exp{\left(-\frac{n}{2pq}x_m^2\right)}.</math> (12)

Обозначив

<math>\sigma=\sqrt{\frac{pq}{n}},</math> (13)

переписываем (12) в виде

<math>p_n(m)\approx\frac{1}{n}\frac{1}{\sigma\sqrt{2\pi}}\exp{\left(-\frac{x_m^2}{2\sigma^2}\right)}=\frac{1}{n}\varphi(x_m),</math> (14)

Где <math>\varphi(x_m)</math> — нормальная функция.

Поскольку в интервале <math>[m,m+1)</math> имеется только одно целое число <math>m</math>, то можно сказать, что <math>p_n(m)</math> есть вероятность попадания <math>m</math> в интервал <math>[m,m+1)</math>. Из (5) следует, что изменению <math>m</math> на 1 соответствует изменение <math>x_m</math> на

<math>\Delta x=\frac{1}{n}.</math> (15)

Поэтому вероятность попадания <math>m</math> в интервал <math>[m,m+1)</math> равна вероятности попадания <math>x_m</math> в промежуток <math>[x_{m0},x_{m0} + \Delta x),</math>

<math>P(x_{m0} \le x_m \le x_{m0} + \Delta x) = \varphi(x_m)\Delta x.</math> (16)

Если <math>n\rightarrow+\infty</math>, то <math>\Delta x\rightarrow+0</math> и равенство (16) показывает, что нормальная функция <math>\varphi(x)</math> является плотностью случайной переменной <math>x_m</math>.

Таким образом, если <math>n\rightarrow+\infty, nx^3\rightarrow0</math> то для отклонения относительной частоты от наивероятнейшего значения справедлива асимптотическая формула (16), в которой <math>\varphi(x)</math> — нормальная функция с <math>x_m=0</math> и <math>\sigma^2=\frac{pq}{n}</math>.

Таким образом, теорема доказана.

Литература

  • Гмурман В. Е. Теория вероятностей и математическая статистика, — Шаблон:М: Высшее образование. 2005
  • Ширяев А. Н. Вероятность, — Шаблон:М: Наука. 1989.
  • Чистяков В. П. Курс теории вероятностей, — Шаблон:М, 1982.