Русская Википедия:Центральная предельная теорема

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Файл:Central limit thm.png
«Сглаживание» распределения суммированием. Показана функция плотности вероятности одной случайной величины, а также распределения суммы двух, трёх и четырёх случайных величин с такой же функцией распределения.
Файл:IllustrationCentralTheorem.png
Какова бы ни была форма распределения генеральной совокупности, выборочное распределение стремится к нормальному, а его дисперсия задается центральной предельной теоремой.[1]

Центра́льные преде́льные теоре́мы (ЦПТ) — класс теорем в теории вероятностей, утверждающих, что сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.

Так как многие случайные величины в приложениях формируются под влиянием нескольких слабо зависимых случайных факторов, их распределение считают нормальным. При этом должно соблюдаться условие, что ни один из факторов не является доминирующим. Центральные предельные теоремы в этих случаях обосновывают применение нормального распределения.

Классическая ЦПТ

Пусть <math>X_1,\ldots, X_n,\ldots</math> есть бесконечная последовательность независимых одинаково распределённых случайных величин, имеющих конечное математическое ожидание <math>\mu</math> и дисперсию <math>\sigma^2</math>. Пусть также

<math>S_n = \sum\limits_{i=1}^n X_i</math>.

Тогда

<math>\frac{S_n - \mu n}{\sigma \sqrt n} \to N(0,1)</math> по распределению при <math>n \to \infty</math>,

где <math>N(0,1)</math> — нормальное распределение с нулевым математическим ожиданием и стандартным отклонением, равным единице. Определяя выборочное среднее первых <math>n</math> величин как

<math>\bar{X}_n = \frac{1}{n} \sum\limits_{i=1}^n X_i</math>,

мы можем переписать результат центральной предельной теоремы в следующем виде:

<math>\sqrt{n} \frac{ \bar{X}_n - \mu}{\sigma} \to N(0,1)</math> по распределению при <math>n \to \infty</math>.

Скорость сходимости можно оценить с помощью неравенства Берри — Эссеена.

Замечания

  • Неформально говоря, классическая центральная предельная теорема утверждает, что сумма <math>n</math> независимых одинаково распределённых случайных величин имеет распределение, близкое к <math>N(n\mu, n\sigma^2 )</math>. Эквивалентно, <math>\bar{X}_n</math> имеет распределение близкое к <math>N(\mu,\sigma^2/n)</math>.
  • Так как функция распределения стандартного нормального распределения непрерывна, сходимость к этому распределению эквивалентна поточечной сходимости функций распределения к функции распределения стандартного нормального распределения. Положив <math>Z_n = \frac{S_n - \mu n}{\sigma \sqrt{n}}</math>, получаем <math>F_{Z_n}(x) \to \Phi(x),\; \forall x \in \mathbb{R}</math>, где <math>\Phi(x)</math> — функция распределения стандартного нормального распределения.
  • Центральная предельная теорема в классической формулировке доказывается методом характеристических функций (теорема Леви о непрерывности).
  • Вообще говоря, из сходимости функций распределения не вытекает сходимость плотностей. Тем не менее в данном классическом случае это имеет место.

Локальная ЦПТ

В предположениях классической формулировки, допустим в дополнение, что распределение случайных величин <math>\{X_i\}_{i=1}^{\infty}</math> абсолютно непрерывно, то есть оно имеет плотность. Тогда распределение <math>Z_n</math> также абсолютно непрерывно, и более того,

<math>f_{Z_n}(x) \to \frac{1}{\sqrt{2\pi}}\, e^{-\frac{x^2}{2}}</math> при <math>n \to \infty</math>,

где <math>f_{Z_n}(x)</math> — плотность случайной величины <math>Z_n</math>, а в правой части стоит плотность стандартного нормального распределения.

Обобщения

Результат классической центральной предельной теоремы справедлив для ситуаций гораздо более общих, чем полная независимость и одинаковая распределённость.

ЦПТ Линдеберга

[2]Пусть независимые случайные величины <math>X_1,\ldots ,X_n, \ldots</math> определены на одном и том же вероятностном пространстве и имеют конечные математические ожидания и дисперсии: <math> \mathbb{E}[X_i] = \mu_i,\; \mathrm{D}[X_i] = \sigma^2_i</math>.

Пусть <math>S_n = \sum\limits_{i=1}^n X_i</math>.

Тогда <math>\mathbb{E}[S_n] = m_n = \sum\limits_{i=1}^n \mu_i,\; \mathrm{D}[S_n] = s_n^2 = \sum\limits_{i=1}^n \sigma_i^2</math>.

И пусть выполняется условие Линдеберга:

<math>\forall \varepsilon>0,\; \lim\limits_{n\to \infty}\sum\limits_{i=1}^n \mathbb{E}\left[\frac{(X_i-\mu_i)^2}{s_n^2}\, \mathbf{1}_{\{|X_i-\mu_i|> \varepsilon s_n \}}\right] = 0,</math>

где <math> \mathbf{1}_{\{|X_i-\mu_i|> \varepsilon s_n \}}</math> функция — индикатор.

Тогда

<math>\frac{S_n-m_n}{s_n} \to N(0,1)</math> по распределению при <math>n \to \infty</math>.

ЦПТ Ляпунова

Пусть выполнены базовые предположения ЦПТ Линдеберга. Пусть случайные величины <math>\{X_i\}</math> имеют конечный третий момент. Тогда определена последовательность

<math>r^3_n = \sum_{i=1}^n \mathbb{E}\left[|X_i-\mu_i|^3\right]</math>.

Если предел

<math>\lim\limits_{n\to \infty} \frac{r_n}{s_n} = 0</math> (условие Ляпунова),

то

<math>\frac{S_n-m_n}{s_n} \to N(0,1)</math> по распределению при <math>n \to \infty</math>.

ЦПТ для мартингалов

Пусть процесс <math>(X_n)_{n\in \mathbb{N}}</math> является мартингалом с ограниченными приращениями. В частности, допустим, что

<math>\mathbb{E}\left[X_{n+1}-X_n \mid X_1,\ldots,X_n \right] = 0,\; n \in \mathbb{N},\; X_0 \equiv 0,</math>

и приращения равномерно ограничены, то есть

<math>\exists C>0\, \forall n \in \mathbb{N}\; |X_{n+1}-X_n| \le C</math> п.н.

Введём случайные процессы <math>\sigma^2_n</math> и <math>\tau_n</math> следующим образом:

<math>\sigma_n^2 = \mathbb{E} \left[(X_{n+1}-X_n)^2 \mid X_1 ,\ldots, X_n\right]</math>

и

<math>\tau_n = \min\left\{k \left\vert\; \sum_{i=1}^k \sigma^2_i \ge n \right. \right\}</math>.

Тогда

<math>\frac{X_{\tau_n}}{\sqrt{n}} \to N(0,1)</math> по распределению при <math>n \to \infty</math>.

ЦПТ для случайных векторов

Пусть <math>\vec{X_1},\ldots ,\vec{X_n}, \ldots</math> последовательность независимых и одинаково распределённых случайных векторов, каждый из которых имеет среднее <math>E\vec{X_1}=\vec{a}</math> и невырожденную матрицу ковариаций <math>\Sigma</math>. Обозначим через <math>S_n=\vec{X_1}+\ldots+\vec{X_n}</math> вектор частичных сумм. Тогда при <math>n \to \infty</math> имеет место слабая сходимость распределений векторов

<math>\vec{\eta_n}=\frac{S_n-na}{\sqrt{n}}\xrightarrow{weak}\vec{\eta}</math>, где <math>\vec{\eta}</math> имеет распределение <math>N({\vec{0},\Sigma})</math>.

См. также

Примечания

Шаблон:Примечания

Ссылки

Внешние ссылки

Шаблон:Выбор языка Шаблон:Нет ссылок Шаблон:Перевести