Русская Википедия:Распределение хи-квадрат
Шаблон:Вероятностное распределение{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}</math>|
cdf =<math>\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}</math>| mean =<math>k</math>| median =примерно <math>k-2/3</math>| mode =0 для <math>k<2,</math>
<math>k-2,</math> если <math>k\geq 2</math>| variance =<math>2\,k</math>| skewness =<math>\sqrt{8/k}</math>| kurtosis =<math>12/k</math>| entropy =<math>\frac{k}{2}\!+\!\ln\left[2\Gamma\left({k \over 2}\right)\right]\!+\!\left(1\!-\!\frac{k}{2}\right)\psi\left(\frac{k}{2}\right)</math>
<math>\psi(x) = \Gamma'(x) / \Gamma(x).</math>|
mgf =<math>(1-2\,t)^{-k/2}</math>, если <math>2\,t<1</math>| char =<math>(1-2\,i\,t)^{-k/2}</math>
}}
Распределе́ние <math>\chi^2</math> (хи-квадра́т) с <math>k</math> степеня́ми свобо́ды — распределение суммы квадратов <math>k</math> независимых стандартных нормальных случайных величин.
Определение
Пусть <math>z_1, \ldots, z_k</math> — совместно независимые стандартные нормальные случайные величины, то есть: <math> z_i \sim N(0,1) </math>. Тогда случайная величина
- <math>x = z_1^2 + \ldots + z_k^2</math>
имеет распределение хи-квадрат с <math>k</math> степенями свободы, то есть <math>x \sim f_{\chi^2(k)}(x)</math>, или, если записать по-другому:
- <math>x = \sum\limits_{i=1}^k z_i^2 \sim \chi^2(k)</math>.
Распределение хи-квадрат является частным случаем гамма-распределения, и его плотность имеет вид:
- <math>f_{\chi^2(k)}(x) \equiv \Gamma\!\left({k \over 2}, { 2}\right) = \frac{(1/2)^{k \over 2}}{\Gamma\!\left({k \over 2}\right)}\, x^{{k \over 2} - 1}\, e^{-\frac{x}{2}}</math>,
где <math>\Gamma\!\left({k/2}, 2\right)</math> означает гамма-распределение, а <math>\Gamma\!\left({k/2}\right)</math> — гамма-функцию.
Функция распределения имеет следующий вид:
- <math>F_{\chi^2(k)}(x) = \frac{\gamma\left({k \over 2}, {x \over 2}\right)}{\Gamma\left({k \over 2}\right)}</math>,
где <math>\Gamma</math> и <math>\gamma</math> обозначают соответственно полную и неполную гамма-функции.
Свойства распределения хи-квадрат
- Распределение хи-квадрат устойчиво относительно суммирования. Если <math>Y_1, Y_2</math> независимы, и <math>Y_1 \sim \chi^2(k_1)</math>, а <math>Y_2 \sim \chi^2(k_2)</math>, то <math>Y_1 + Y_2 \sim \chi^2(k_1 + k_2)</math>.
- Из определения легко получить моменты распределения хи-квадрат. Если <math>Y \sim \chi^2(k)</math>, то
- <math>\mathbb{E}[Y] = k</math>,
- <math>\mathrm{D}[Y] = 2k</math>.
- В силу центральной предельной теоремы, при большом числе степеней свободы распределение случайной величины <math>Y \sim \chi^2(k)</math> может быть приближено нормальным <math>Y \approx N( k, 2k )</math>. Более точно
- <math>\frac{Y-k}{\sqrt{2k}} \to N(0,1)</math> по распределению при <math>k \to \infty</math>.
Связь с другими распределениями
- Если <math>X_1 ,\ldots , X_k</math> независимые нормальные случайные величины, то есть: <math>X_i \sim N(\mu,\sigma^2),\; i=1,\ldots, k;\; \mu</math> известно, то случайная величина
- <math>Y = \sum_{i=1}^k \left(\frac{X_i - \mu}{\sigma}\right)^2</math>
имеет распределение <math>\chi^2(k)</math>.
- Если <math>k=2</math>, то распределение хи-квадрат совпадает с экспоненциальным распределением:
- <math> \chi^2(2) \equiv \mathrm{Exp}(1/2)</math>.
- Если <math>X \sim \chi^2(2k)</math>, тогда <math>X \sim \operatorname{Erlang}(k, 1/2)</math> — распределение Эрланга.
- Если <math>Y_1 \sim \chi^2(k_1)</math> и <math>Y_2 \sim \chi^2(k_2)</math>, то случайная величина
- <math>F = \frac{Y_1/k_1}{Y_2 / k_2}</math>
имеет распределение Фишера со степенями свободы <math>(k_1,k_2)</math>.
- <math> \chi_k^2 \sim {\chi'}^2_k(0)</math> (нецентральное хи-квадрат распределение с параметром нецентральности <math> \lambda = 0 </math>)
- Если <math>X \sim \chi^2(\nu)\,</math> и <math>c>0 \,</math>, тогда <math>cX \sim \Gamma(k=\nu/2, \theta=2c)\,</math>. (гамма-распределение)
- Если <math>X \sim \chi^2_k</math>, тогда <math>\sqrt{X} \sim \chi_k</math> (хи распределение)
- Если <math>X \sim \operatorname{Rayleigh}(1)\,</math> (распределение Рэлея), тогда <math>X^2 \sim \chi^2(2)\,</math>
- Если <math>X \sim \operatorname{Maxwell}(1)\,</math> (распределение Максвелла), тогда <math>X^2 \sim \chi^2(3)\,</math>
- Если <math>X \sim \chi^2(\nu_1)\,</math> и <math>Y \sim \chi^2(\nu_2)\,</math> независимы, тогда <math>\tfrac{X}{X+Y} \sim \operatorname{Beta}(\tfrac{\nu_1}{2}, \tfrac{\nu_2}{2})\,</math> — (бета-распределение)
- Если <math> X \sim \operatorname{U}(0,1)\, </math> — (равномерное распределение), тогда <math> -2\log(X) \sim \chi^2(2)\,</math>
- <math>\chi^2(6)\,</math> — преобразование распределения Лапласа
- Если <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math>, тогда <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2(2n)\,</math>
- хи-квадрат распределение — преобразование распределения Парето
- t-распределение — преобразование распределения хи-квадрат
- t-распределение может быть пролучено из распределения хи-квадрат и нормального распределения
- Если <math>X_1 \sim \chi^2(k_1)</math> и <math>X_2 \sim \chi^2(k_2)</math> — независимы, тогда <math>X_1 + X_2\sim \chi^2(k_1+k_2)</math>. Если <math>X_1</math> и <math>X_2</math> не являются независимыми, тогда <math>X_1+X_2</math> не распределено по закону хи-квадрат.
Вариации и обобщение
Дальнейшим обобщением распределения хи-квадрат является так называемое Шаблон:Iw, возникающее в некоторых задачах статистики.
Квантили
Шаблон:Main Квантиль — это число (аргумент), на котором функция распределения равна заданной, требуемой вероятности. Грубо говоря, квантиль — это результат обращения функции распределения, но есть тонкости с разрывными функциями распределения.
История
Критерий <math> \chi^2 </math> был предложен Карлом Пирсоном в 1900 году[1]. Его работа рассматривается как фундамент современной математической статистики. Предшественники Пирсона просто строили графики экспериментальных результатов и утверждали, что они правильны. В своей статье Пирсон привёл несколько интересных примеров злоупотреблений статистикой. Он также доказал, что некоторые результаты наблюдений за рулеткой (на которой он проводил эксперименты в течение двух недель в Монте-Карло в 1892 году) были так далеки от ожидаемых частот, что шансы получить их снова при предположении, что рулетка устроена добросовестно, равны одному из 1029.
Общее обсуждение критерия <math> \chi^2 </math> и обширную библиографию можно найти в обзорной работе Вильяма Дж. Кокрена[2].
Приложения
Распределение хи-квадрат имеет многочисленные приложения при статистических выводах, например при использовании критерия хи-квадрат и при оценке дисперсий. Оно используется в проблеме оценивания среднего нормально распределённой популяции и проблеме оценивания наклона линии регрессии благодаря его роли в распределении Стьюдента. Оно используется в дисперсионном анализе.
Далее приведены примеры ситуаций, в которых распределение хи-квадрат возникает из нормальной выборки:
- если <math>X_1, ..., X_n</math> — независимые и одинаково распределенные по закону <math>N(\mu, \sigma^2)</math> случайные величины, тогда <math>\sum_{i=1}^n(X_i - \overline X)^2 \sim \sigma^2 \chi^2_{n-1}</math>, где <math>\overline X = \frac{1}{n} \sum_{i=1}^n X_i.</math>
- В таблице показаны некоторые статистики, основанные на <math>X_i \sim N(\mu_i, \sigma^2_i), i = 1, ..., k</math> независимых случайных величин, распределения которых связаны с распределением хи-квадрат:
Название | Статистика |
---|---|
распределение хи-квадрат | <math>\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2</math> |
нецентральное распределение хи-квадрат | <math>\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2</math> |
распределение хи | <math>\sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}</math> |
нецентральное распределение хи | <math>\sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}</math> |
Таблица значений Шаблон:Math и Шаблон:Math-значений
Для любого числа Шаблон:Math между 0 и 1 определено [[P-значение|Шаблон:Math-значение]] — вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с наблюдаемым, при условии верности нулевой гипотезы. В данном случае это распределение <math>\chi^2</math>. Так как значение функции распределения в точке для соответствующих степеней свободы дает вероятность получить значение статистики менее экстремальное, чем эта точка, Шаблон:Math-значение можно получить, если отнять от единицы значение функции распределения. Малое Шаблон:Math-значение — ниже выбранного уровня значимости — означает статистическую значимость. Этого будет достаточно, чтобы отвергнуть нулевую гипотезу. Чтобы различать значимые и незначимые результаты, обычно используют уровень 0,05.
В таблице даны Шаблон:Math-значения для соответствующих значений <math> \chi^2 </math> у первых десяти степеней свободы.
Степени свободы (Шаблон:Math) | Значение <math> \chi^2 </math>[3] | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0,004 | 0,02 | 0,06 | 0,15 | 0,46 | 1,07 | 1,64 | 2,71 | 3,84 | 6,63 | 10,83 |
2 | 0,10 | 0,21 | 0,45 | 0,71 | 1,39 | 2,41 | 3,22 | 4,61 | 5,99 | 9,21 | 13,82 |
3 | 0,35 | 0,58 | 1,01 | 1,42 | 2,37 | 3,66 | 4,64 | 6,25 | 7,81 | 11,34 | 16,27 |
4 | 0,71 | 1,06 | 1,65 | 2,20 | 3,36 | 4,88 | 5,99 | 7,78 | 9,49 | 13,28 | 18,47 |
5 | 1,14 | 1,61 | 2,34 | 3,00 | 4,35 | 6,06 | 7,29 | 9,24 | 11,07 | 15,09 | 20,52 |
6 | 1,63 | 2,20 | 3,07 | 3,83 | 5,35 | 7,23 | 8,56 | 10,64 | 12,59 | 16,81 | 22,46 |
7 | 2,17 | 2,83 | 3,82 | 4,67 | 6,35 | 8,38 | 9,80 | 12,02 | 14,07 | 18,48 | 24,32 |
8 | 2,73 | 3,49 | 4,59 | 5,53 | 7,34 | 9,52 | 11,03 | 13,36 | 15,51 | 20,09 | 26,12 |
9 | 3,32 | 4,17 | 5,38 | 6,39 | 8,34 | 10,66 | 12,24 | 14,68 | 16,92 | 21,67 | 27,88 |
10 | 3,94 | 4,87 | 6,18 | 7,27 | 9,34 | 11,78 | 13,44 | 15,99 | 18,31 | 23,21 | 29,59 |
Шаблон:Math-значение | 0,95 | 0,90 | 0,80 | 0,70 | 0,50 | 0,30 | 0,20 | 0,10 | 0,05 | 0,01 | 0,001 |
Эти значения могут быть вычислены через квантиль (обратную функцию распределения) распределения хи-квадрат[4]. Например, квантиль <math>\chi^2</math> для Шаблон:Math и Шаблон:Math дает <math> \chi^2 </math>=Шаблон:Math, как в таблице сверху. Это означает, что для экспериментального наблюдения семи независимых случайных величин <math> x_1,...,x_7 </math> при справедливости нулевой гипотезы «каждая величина описывается нормальным стандартным распределением с медианой 0 и стандартным отклонением 1» значение <math>x_1^2+...+x_7^2 > 14{,}07</math> можно получить лишь в 5 % реализаций. Получение большего значения обычно можно считать достаточным основанием для отбрасывания этой нулевой гипотезы.
В таблице дано округление до сотых; более точные таблицы для большего количества степеней свободы см., например, здесь[5].
См. также
Примечания
Шаблон:Перевести Шаблон:Список вероятностных распределений
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Chi-Squared Test Шаблон:Wayback Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. Этот источник, в свою очередь, ссылается на: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Два значения были исправлены, 7,82 на 7,81 и 4,60 на 4,61.
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web