Русская Википедия:Распределение хи-квадрат

 cdf        =<math>\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}</math>|
 mean       =<math>k</math>|
 median     =примерно <math>k-2/3</math>|
 mode       =0 для <math>k<2,</math>
<math>k-2,</math> если <math>k\geq 2</math>|
 variance   =<math>2\,k</math>|
 skewness   =<math>\sqrt{8/k}</math>|
 kurtosis   =<math>12/k</math>|
 entropy    =<math>\frac{k}{2}\!+\!\ln\left[2\Gamma\left({k \over 2}\right)\right]\!+\!\left(1\!-\!\frac{k}{2}\right)\psi\left(\frac{k}{2}\right)</math>

<math>\psi(x) = \Gamma'(x) / \Gamma(x).</math>|

 mgf        =<math>(1-2\,t)^{-k/2}</math>, если <math>2\,t<1</math>|
 char       =<math>(1-2\,i\,t)^{-k/2}</math>

}}

Распределе́ние <math>\chi^2</math> (хи-квадра́т) с <math>k</math> степеня́ми свобо́ды — распределение суммы квадратов <math>k</math> независимых стандартных нормальных случайных величин.

Определение

Пусть <math>z_1, \ldots, z_k</math> — совместно независимые стандартные нормальные случайные величины, то есть: <math> z_i \sim N(0,1) </math>. Тогда случайная величина

<math>x = z_1^2 + \ldots + z_k^2</math>

имеет распределение хи-квадрат с <math>k</math> степенями свободы, то есть <math>x \sim f_{\chi^2(k)}(x)</math>, или, если записать по-другому:

<math>x = \sum\limits_{i=1}^k z_i^2 \sim \chi^2(k)</math>.

Распределение хи-квадрат является частным случаем гамма-распределения, и его плотность имеет вид:

<math>f_{\chi^2(k)}(x) \equiv \Gamma\!\left({k \over 2}, { 2}\right) = \frac{(1/2)^{k \over 2}}{\Gamma\!\left({k \over 2}\right)}\, x^{{k \over 2} - 1}\, e^{-\frac{x}{2}}</math>,

где <math>\Gamma\!\left({k/2}, 2\right)</math> означает гамма-распределение, а <math>\Gamma\!\left({k/2}\right)</math> — гамма-функцию.

Функция распределения имеет следующий вид:

<math>F_{\chi^2(k)}(x) = \frac{\gamma\left({k \over 2}, {x \over 2}\right)}{\Gamma\left({k \over 2}\right)}</math>,

где <math>\Gamma</math> и <math>\gamma</math> обозначают соответственно полную и неполную гамма-функции.

Свойства распределения хи-квадрат

Распределение хи-квадрат устойчиво относительно суммирования. Если <math>Y_1, Y_2</math> независимы, и <math>Y_1 \sim \chi^2(k_1)</math>, а <math>Y_2 \sim \chi^2(k_2)</math>, то <math>Y_1 + Y_2 \sim \chi^2(k_1 + k_2)</math>.

Из определения легко получить моменты распределения хи-квадрат. Если <math>Y \sim \chi^2(k)</math>, то

<math>\mathbb{E}[Y] = k</math>,

<math>\mathrm{D}[Y] = 2k</math>.

В силу центральной предельной теоремы, при большом числе степеней свободы распределение случайной величины <math>Y \sim \chi^2(k)</math> может быть приближено нормальным <math>Y \approx N( k, 2k )</math>. Более точно

<math>\frac{Y-k}{\sqrt{2k}} \to N(0,1)</math> по распределению при <math>k \to \infty</math>.

Связь с другими распределениями

Если <math>X_1 ,\ldots , X_k</math> независимые нормальные случайные величины, то есть: <math>X_i \sim N(\mu,\sigma^2),\; i=1,\ldots, k;\; \mu</math> известно, то случайная величина

<math>Y = \sum_{i=1}^k \left(\frac{X_i - \mu}{\sigma}\right)^2</math>

имеет распределение <math>\chi^2(k)</math>.

Если <math>k=2</math>, то распределение хи-квадрат совпадает с экспоненциальным распределением:

<math> \chi^2(2) \equiv \mathrm{Exp}(1/2)</math>.

Если <math>X \sim \chi^2(2k)</math>, тогда <math>X \sim \operatorname{Erlang}(k, 1/2)</math> — распределение Эрланга.
Если <math>Y_1 \sim \chi^2(k_1)</math> и <math>Y_2 \sim \chi^2(k_2)</math>, то случайная величина

имеет распределение Фишера со степенями свободы <math>(k_1,k_2)</math>.

<math> \chi_k^2 \sim {\chi'}^2_k(0)</math> (нецентральное хи-квадрат распределение с параметром нецентральности <math> \lambda = 0 </math>)
Если <math>X \sim \chi^2(\nu)\,</math> и <math>c>0 \,</math>, тогда <math>cX \sim \Gamma(k=\nu/2, \theta=2c)\,</math>. (гамма-распределение)
Если <math>X \sim \chi^2_k</math>, тогда <math>\sqrt{X} \sim \chi_k</math> (хи распределение)
Если <math>X \sim \operatorname{Rayleigh}(1)\,</math> (распределение Рэлея), тогда <math>X^2 \sim \chi^2(2)\,</math>
Если <math>X \sim \operatorname{Maxwell}(1)\,</math> (распределение Максвелла), тогда <math>X^2 \sim \chi^2(3)\,</math>
Если <math>X \sim \chi^2(\nu_1)\,</math> и <math>Y \sim \chi^2(\nu_2)\,</math> независимы, тогда <math>\tfrac{X}{X+Y} \sim \operatorname{Beta}(\tfrac{\nu_1}{2}, \tfrac{\nu_2}{2})\,</math> — (бета-распределение)
Если <math> X \sim \operatorname{U}(0,1)\, </math> — (равномерное распределение), тогда <math> -2\log(X) \sim \chi^2(2)\,</math>
<math>\chi^2(6)\,</math> — преобразование распределения Лапласа
Если <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math>, тогда <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2(2n)\,</math>
хи-квадрат распределение — преобразование распределения Парето
t-распределение — преобразование распределения хи-квадрат
t-распределение может быть пролучено из распределения хи-квадрат и нормального распределения
Если <math>X_1 \sim \chi^2(k_1)</math> и <math>X_2 \sim \chi^2(k_2)</math> — независимы, тогда <math>X_1 + X_2\sim \chi^2(k_1+k_2)</math>. Если <math>X_1</math> и <math>X_2</math> не являются независимыми, тогда <math>X_1+X_2</math> не распределено по закону хи-квадрат.

Вариации и обобщение

Дальнейшим обобщением распределения хи-квадрат является так называемое Шаблон:Iw, возникающее в некоторых задачах статистики.

Квантили

Шаблон:Main Квантиль — это число (аргумент), на котором функция распределения равна заданной, требуемой вероятности. Грубо говоря, квантиль — это результат обращения функции распределения, но есть тонкости с разрывными функциями распределения.

История

Критерий <math> \chi^2 </math> был предложен Карлом Пирсоном в 1900 году^[1]. Его работа рассматривается как фундамент современной математической статистики. Предшественники Пирсона просто строили графики экспериментальных результатов и утверждали, что они правильны. В своей статье Пирсон привёл несколько интересных примеров злоупотреблений статистикой. Он также доказал, что некоторые результаты наблюдений за рулеткой (на которой он проводил эксперименты в течение двух недель в Монте-Карло в 1892 году) были так далеки от ожидаемых частот, что шансы получить их снова при предположении, что рулетка устроена добросовестно, равны одному из 10²⁹.

Общее обсуждение критерия <math> \chi^2 </math> и обширную библиографию можно найти в обзорной работе Вильяма Дж. Кокрена^[2].

Приложения

Распределение хи-квадрат имеет многочисленные приложения при статистических выводах, например при использовании критерия хи-квадрат и при оценке дисперсий. Оно используется в проблеме оценивания среднего нормально распределённой популяции и проблеме оценивания наклона линии регрессии благодаря его роли в распределении Стьюдента. Оно используется в дисперсионном анализе.

Далее приведены примеры ситуаций, в которых распределение хи-квадрат возникает из нормальной выборки:

если <math>X_1, ..., X_n</math> — независимые и одинаково распределенные по закону <math>N(\mu, \sigma^2)</math> случайные величины, тогда <math>\sum_{i=1}^n(X_i - \overline X)^2 \sim \sigma^2 \chi^2_{n-1}</math>, где <math>\overline X = \frac{1}{n} \sum_{i=1}^n X_i.</math>
В таблице показаны некоторые статистики, основанные на <math>X_i \sim N(\mu_i, \sigma^2_i), i = 1, ..., k</math> независимых случайных величин, распределения которых связаны с распределением хи-квадрат:

Название	Статистика
распределение хи-квадрат	<math>\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2</math>
нецентральное распределение хи-квадрат	<math>\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2</math>
распределение хи	<math>\sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}</math>
нецентральное распределение хи	<math>\sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}</math>

Таблица значений Шаблон:Math и Шаблон:Math-значений

Для любого числа Шаблон:Math между 0 и 1 определено [[P-значение|Шаблон:Math-значение]] — вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с наблюдаемым, при условии верности нулевой гипотезы. В данном случае это распределение <math>\chi^2</math>. Так как значение функции распределения в точке для соответствующих степеней свободы дает вероятность получить значение статистики менее экстремальное, чем эта точка, Шаблон:Math-значение можно получить, если отнять от единицы значение функции распределения. Малое Шаблон:Math-значение — ниже выбранного уровня значимости — означает статистическую значимость. Этого будет достаточно, чтобы отвергнуть нулевую гипотезу. Чтобы различать значимые и незначимые результаты, обычно используют уровень 0,05.

В таблице даны Шаблон:Math-значения для соответствующих значений <math> \chi^2 </math> у первых десяти степеней свободы.

Степени свободы (Шаблон:Math)	Значение <math> \chi^2 </math>^[3]
1	0,004	0,02	0,06	0,15	0,46	1,07	1,64	2,71	3,84	6,63	10,83
2	0,10	0,21	0,45	0,71	1,39	2,41	3,22	4,61	5,99	9,21	13,82
3	0,35	0,58	1,01	1,42	2,37	3,66	4,64	6,25	7,81	11,34	16,27
4	0,71	1,06	1,65	2,20	3,36	4,88	5,99	7,78	9,49	13,28	18,47
5	1,14	1,61	2,34	3,00	4,35	6,06	7,29	9,24	11,07	15,09	20,52
6	1,63	2,20	3,07	3,83	5,35	7,23	8,56	10,64	12,59	16,81	22,46
7	2,17	2,83	3,82	4,67	6,35	8,38	9,80	12,02	14,07	18,48	24,32
8	2,73	3,49	4,59	5,53	7,34	9,52	11,03	13,36	15,51	20,09	26,12
9	3,32	4,17	5,38	6,39	8,34	10,66	12,24	14,68	16,92	21,67	27,88
10	3,94	4,87	6,18	7,27	9,34	11,78	13,44	15,99	18,31	23,21	29,59
Шаблон:Math-значение	0,95	0,90	0,80	0,70	0,50	0,30	0,20	0,10	0,05	0,01	0,001

Эти значения могут быть вычислены через квантиль (обратную функцию распределения) распределения хи-квадрат^[4]. Например, квантиль <math>\chi^2</math> для Шаблон:Math и Шаблон:Math дает <math> \chi^2 </math>=Шаблон:Math, как в таблице сверху. Это означает, что для экспериментального наблюдения семи независимых случайных величин <math> x_1,...,x_7 </math> при справедливости нулевой гипотезы «каждая величина описывается нормальным стандартным распределением с медианой 0 и стандартным отклонением 1» значение <math>x_1^2+...+x_7^2 > 14{,}07</math> можно получить лишь в 5 % реализаций. Получение большего значения обычно можно считать достаточным основанием для отбрасывания этой нулевой гипотезы.

В таблице дано округление до сотых; более точные таблицы для большего количества степеней свободы см., например, здесь^[5].

См. также

Критерий согласия Пирсона (критерий <math> \chi^2 </math>)

Примечания

Шаблон:Примечания

Шаблон:Перевести Шаблон:Список вероятностных распределений

↑ Шаблон:Статья
↑ Шаблон:Статья
↑ Chi-Squared Test Шаблон:Wayback Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. Этот источник, в свою очередь, ссылается на: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Два значения были исправлены, 7,82 на 7,81 и 4,60 на 4,61.
↑ Шаблон:Cite web
↑ Шаблон:Cite web

[1] Шаблон:Статья

[2] Шаблон:Статья

[3] Chi-Squared Test Шаблон:Wayback Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. Этот источник, в свою очередь, ссылается на: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Два значения были исправлены, 7,82 на 7,81 и 4,60 на 4,61.

[4] Шаблон:Cite web

[Statsoft-5] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Распределение хи-квадрат

Содержание