Русская Википедия:Распределение хи-квадрат

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Вероятностное распределение{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}</math>|

 cdf        =<math>\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}</math>|
 mean       =<math>k</math>|
 median     =примерно <math>k-2/3</math>|
 mode       =0 для <math>k<2,</math>
<math>k-2,</math> если <math>k\geq 2</math>| variance =<math>2\,k</math>| skewness =<math>\sqrt{8/k}</math>| kurtosis =<math>12/k</math>| entropy =<math>\frac{k}{2}\!+\!\ln\left[2\Gamma\left({k \over 2}\right)\right]\!+\!\left(1\!-\!\frac{k}{2}\right)\psi\left(\frac{k}{2}\right)</math>

<math>\psi(x) = \Gamma'(x) / \Gamma(x).</math>|

 mgf        =<math>(1-2\,t)^{-k/2}</math>, если <math>2\,t<1</math>|
 char       =<math>(1-2\,i\,t)^{-k/2}</math>

}}

Распределе́ние <math>\chi^2</math> (хи-квадра́т) с <math>k</math> степеня́ми свобо́ды — распределение суммы квадратов <math>k</math> независимых стандартных нормальных случайных величин.

Определение

Пусть <math>z_1, \ldots, z_k</math> — совместно независимые стандартные нормальные случайные величины, то есть: <math> z_i \sim N(0,1) </math>. Тогда случайная величина

<math>x = z_1^2 + \ldots + z_k^2</math>

имеет распределение хи-квадрат с <math>k</math> степенями свободы, то есть <math>x \sim f_{\chi^2(k)}(x)</math>, или, если записать по-другому:

<math>x = \sum\limits_{i=1}^k z_i^2 \sim \chi^2(k)</math>.

Распределение хи-квадрат является частным случаем гамма-распределения, и его плотность имеет вид:

<math>f_{\chi^2(k)}(x) \equiv \Gamma\!\left({k \over 2}, { 2}\right) = \frac{(1/2)^{k \over 2}}{\Gamma\!\left({k \over 2}\right)}\, x^{{k \over 2} - 1}\, e^{-\frac{x}{2}}</math>,

где <math>\Gamma\!\left({k/2}, 2\right)</math> означает гамма-распределение, а <math>\Gamma\!\left({k/2}\right)</math> — гамма-функцию.

Функция распределения имеет следующий вид:

<math>F_{\chi^2(k)}(x) = \frac{\gamma\left({k \over 2}, {x \over 2}\right)}{\Gamma\left({k \over 2}\right)}</math>,

где <math>\Gamma</math> и <math>\gamma</math> обозначают соответственно полную и неполную гамма-функции.

Свойства распределения хи-квадрат

  • Из определения легко получить моменты распределения хи-квадрат. Если <math>Y \sim \chi^2(k)</math>, то
<math>\mathbb{E}[Y] = k</math>,
<math>\mathrm{D}[Y] = 2k</math>.
  • В силу центральной предельной теоремы, при большом числе степеней свободы распределение случайной величины <math>Y \sim \chi^2(k)</math> может быть приближено нормальным <math>Y \approx N( k, 2k )</math>. Более точно
<math>\frac{Y-k}{\sqrt{2k}} \to N(0,1)</math> по распределению при <math>k \to \infty</math>.

Связь с другими распределениями

  • Если <math>X_1 ,\ldots , X_k</math> независимые нормальные случайные величины, то есть: <math>X_i \sim N(\mu,\sigma^2),\; i=1,\ldots, k;\; \mu</math> известно, то случайная величина
<math>Y = \sum_{i=1}^k \left(\frac{X_i - \mu}{\sigma}\right)^2</math>

имеет распределение <math>\chi^2(k)</math>.

<math> \chi^2(2) \equiv \mathrm{Exp}(1/2)</math>.
  • Если <math>X \sim \chi^2(2k)</math>, тогда <math>X \sim \operatorname{Erlang}(k, 1/2)</math> — распределение Эрланга.
  • Если <math>Y_1 \sim \chi^2(k_1)</math> и <math>Y_2 \sim \chi^2(k_2)</math>, то случайная величина
<math>F = \frac{Y_1/k_1}{Y_2 / k_2}</math>

имеет распределение Фишера со степенями свободы <math>(k_1,k_2)</math>.

Вариации и обобщение

Дальнейшим обобщением распределения хи-квадрат является так называемое Шаблон:Iw, возникающее в некоторых задачах статистики.

Квантили

Шаблон:Main Квантиль — это число (аргумент), на котором функция распределения равна заданной, требуемой вероятности. Грубо говоря, квантиль — это результат обращения функции распределения, но есть тонкости с разрывными функциями распределения.

История

Критерий <math> \chi^2 </math> был предложен Карлом Пирсоном в 1900 году[1]. Его работа рассматривается как фундамент современной математической статистики. Предшественники Пирсона просто строили графики экспериментальных результатов и утверждали, что они правильны. В своей статье Пирсон привёл несколько интересных примеров злоупотреблений статистикой. Он также доказал, что некоторые результаты наблюдений за рулеткой (на которой он проводил эксперименты в течение двух недель в Монте-Карло в 1892 году) были так далеки от ожидаемых частот, что шансы получить их снова при предположении, что рулетка устроена добросовестно, равны одному из 1029.

Общее обсуждение критерия <math> \chi^2 </math> и обширную библиографию можно найти в обзорной работе Вильяма Дж. Кокрена[2].

Приложения

Распределение хи-квадрат имеет многочисленные приложения при статистических выводах, например при использовании критерия хи-квадрат и при оценке дисперсий. Оно используется в проблеме оценивания среднего нормально распределённой популяции и проблеме оценивания наклона линии регрессии благодаря его роли в распределении Стьюдента. Оно используется в дисперсионном анализе.

Далее приведены примеры ситуаций, в которых распределение хи-квадрат возникает из нормальной выборки:

Название Статистика
распределение хи-квадрат <math>\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2</math>
нецентральное распределение хи-квадрат <math>\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2</math>
распределение хи <math>\sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}</math>
нецентральное распределение хи <math>\sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}</math>


Таблица значений Шаблон:Math и Шаблон:Math-значений

Для любого числа Шаблон:Math между 0 и 1 определено [[P-значение|Шаблон:Math-значение]] — вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с наблюдаемым, при условии верности нулевой гипотезы. В данном случае это распределение <math>\chi^2</math>. Так как значение функции распределения в точке для соответствующих степеней свободы дает вероятность получить значение статистики менее экстремальное, чем эта точка, Шаблон:Math-значение можно получить, если отнять от единицы значение функции распределения. Малое Шаблон:Math-значение — ниже выбранного уровня значимости — означает статистическую значимость. Этого будет достаточно, чтобы отвергнуть нулевую гипотезу. Чтобы различать значимые и незначимые результаты, обычно используют уровень 0,05.

В таблице даны Шаблон:Math-значения для соответствующих значений <math> \chi^2 </math> у первых десяти степеней свободы.

Степени свободы (Шаблон:Math) Значение <math> \chi^2 </math>[3]
1 0,004 0,02 0,06 0,15 0,46 1,07 1,64 2,71 3,84 6,63 10,83
2 0,10 0,21 0,45 0,71 1,39 2,41 3,22 4,61 5,99 9,21 13,82
3 0,35 0,58 1,01 1,42 2,37 3,66 4,64 6,25 7,81 11,34 16,27
4 0,71 1,06 1,65 2,20 3,36 4,88 5,99 7,78 9,49 13,28 18,47
5 1,14 1,61 2,34 3,00 4,35 6,06 7,29 9,24 11,07 15,09 20,52
6 1,63 2,20 3,07 3,83 5,35 7,23 8,56 10,64 12,59 16,81 22,46
7 2,17 2,83 3,82 4,67 6,35 8,38 9,80 12,02 14,07 18,48 24,32
8 2,73 3,49 4,59 5,53 7,34 9,52 11,03 13,36 15,51 20,09 26,12
9 3,32 4,17 5,38 6,39 8,34 10,66 12,24 14,68 16,92 21,67 27,88
10 3,94 4,87 6,18 7,27 9,34 11,78 13,44 15,99 18,31 23,21 29,59
Шаблон:Math-значение 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 0,001

Эти значения могут быть вычислены через квантиль (обратную функцию распределения) распределения хи-квадрат[4]. Например, квантиль <math>\chi^2</math> для Шаблон:Math и Шаблон:Math дает <math> \chi^2 </math>=Шаблон:Math, как в таблице сверху. Это означает, что для экспериментального наблюдения семи независимых случайных величин <math> x_1,...,x_7 </math> при справедливости нулевой гипотезы «каждая величина описывается нормальным стандартным распределением с медианой 0 и стандартным отклонением 1» значение <math>x_1^2+...+x_7^2 > 14{,}07</math> можно получить лишь в 5 % реализаций. Получение большего значения обычно можно считать достаточным основанием для отбрасывания этой нулевой гипотезы.

В таблице дано округление до сотых; более точные таблицы для большего количества степеней свободы см., например, здесь[5].

См. также

Примечания

Шаблон:Примечания

Шаблон:Перевести Шаблон:Список вероятностных распределений

  1. Шаблон:Статья
  2. Шаблон:Статья
  3. Chi-Squared Test Шаблон:Wayback Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. Этот источник, в свою очередь, ссылается на: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Два значения были исправлены, 7,82 на 7,81 и 4,60 на 4,61.
  4. Шаблон:Cite web
  5. Шаблон:Cite web