Русская Википедия:Проверка статистических гипотез

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Проверка статистических гипотез является содержанием одного из обширных классов задач математической статистики[1].

Статистическая гипотеза — гипотеза о виде распределения и свойствах случайной величины, которую можно подтвердить или опровергнуть применением статистических методов к данным выборки[1].

Статистические гипотезы

Определения

Пусть в (статистическом) эксперименте доступна наблюдению случайная величина <math>X</math>, распределение которой <math>\mathbb{P}</math> полностью или частично неизвестно. Тогда любое утверждение относительно <math>\mathbb{P}</math> называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:

  • Статистическая гипотеза, однозначно определяющая распределение <math>\mathbb{P}</math>, то есть <math>H:\;\{\mathbb{P}= \mathbb{P}_0\}</math>, где <math>\mathbb{P}_0</math>— какой-то конкретный закон, называется простой.
  • Статистическая гипотеза, утверждающая принадлежность распределения <math>\mathbb{P}</math> к некоторому семейству распределений, то есть вида <math>H:\;\{\mathbb{P}\in \mathcal{P}\}</math>, где <math>\mathcal{P}</math> — семейство распределений, называется сложной.

На практике обычно требуется проверить какую-то конкретную и, как правило, простую гипотезу <math>H_0</math>. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза <math>H_1</math>, называемая конкурирующей или альтернативной.

Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.

В большинстве случаев статистические критерии основаны на случайной выборке <math>(X_1,X_2,\dots,X_n)</math> фиксированного объема <math>n\geq 1</math> для распределения <math>\mathbb P</math>. В последовательном анализе выборка формируется в ходе самого эксперимента и потому её размер является случайной величиной (см. Последовательный статистический критерий).

Пример

Пусть дана независимая выборка <math>(X_1,\ldots,X_n) \sim \mathcal{N}(\mu, 1)</math> из нормального распределения, где <math>\mu</math> — неизвестный параметр. Тогда <math>H_0:\;\{\mu = \mu_0\}</math>, где <math>\mu_0</math> — фиксированная константа, является простой гипотезой, а конкурирующая с ней <math>H_1:\;\{\mu > \mu_0\}</math> — сложной.

Этапы проверки статистических гипотез

  1. Формулировка основной гипотезы <math>H_0</math> и конкурирующей гипотезы <math>H_1</math>.
  2. Задание уровня значимости <math>\alpha</math>, на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода.
  3. Расчёт статистики <math>\phi</math> критерия такой, что:
    • её величина зависит от исходной выборки <math>\mathbf{X}=(X_1,\ldots,X_n): \; \phi=\phi(X_1,\ldots,X_n) </math>;
    • по её значению можно делать выводы об истинности гипотезы <math>H_0</math>;
    • статистика <math>\phi</math>, как функция случайной величины <math>\mathbf{X}</math>, также является случайной величиной и подчиняется какому-то закону распределения.
  4. Построение критической области. Из области значений <math>\phi</math> выделяется подмножество <math>\mathcal{C}</math> таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство <math>P(\phi\in\mathcal{C})=\alpha</math>. Это множество <math>\mathcal{C}</math> и называется критической областью.
  5. Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику <math>\phi</math> и по попаданию (или непопаданию) в критическую область <math>\mathcal{C}</math> выносится решение об отвержении (или принятии) выдвинутой гипотезы <math>H_0</math>.

Виды критической области

Выделяют три вида критических областей:

  • Двусторонняя критическая область определяется двумя интервалами <math>(-\infty,\;x_{\alpha/2})\cup(x_{1-\alpha/2}\;+\infty)</math>, где <math>x_{\alpha/2},\; x_{1-\alpha/2}</math> находят из условий <math>P(\phi<x_{\alpha/2})=\frac{\alpha}{2}, \quad P(\phi>x_{1-\alpha/2})=1-\frac{\alpha}{2}</math>.
  • Левосторонняя критическая область определяется интервалом <math>(-\infty,\; x_\alpha)</math>, где <math>x_\alpha</math> находят из условия <math>P(\phi<x_\alpha)=\alpha</math>.
  • Правосторонняя критическая область определяется интервалом <math>(x_{1-\alpha},\;+\infty)</math>, где <math>x_{1-\alpha}</math> находят из условия <math>P(\phi<x_{1-\alpha})=1-\alpha</math>.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Вс