Русская Википедия:Статистическая значимость

Материал из Онлайн справочника
Версия от 17:33, 17 сентября 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} В статистике величину (значение) переменной называют '''статисти́чески зна́чимой''', если мала вероятность случайного возникновения этой или ещё более крайних величин. Здесь под кра...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

В статистике величину (значение) переменной называют статисти́чески зна́чимой, если мала вероятность случайного возникновения этой или ещё более крайних величин. Здесь под крайностью понимается степень отклонения тестовой статистики от нуль-гипотезы.

Разница называется статистически значимой, если появление имеющихся данных (или ещё более крайних данных) было бы маловероятно, если предположить, что эта разница отсутствует; это выражение не означает, что данная разница должна быть велика, важна, или значима в общем смысле этого слова.

Общая картина проблемы такова: дана выборка из некоторого пространства <math>\Omega</math> элементарных событий (например, список пациентов, прошедших обследование на некоторую болезнь) и, возможно, значения на этой выборке некоторых переменных (функций от <math>\omega \in \Omega</math>, например — возраст пациента, интенсивность курения, количество часов физических упражнений и т. п.). Вероятностное распределение на <math>\Omega</math> не известно, а, наоборот, является здесь главным объектом поиска.

Различные гипотезы соответствуют различным возможным вероятностным распределениям на <math>\Omega</math>. Точный смысл термина «гипотеза» — набор утверждений, который содержит полное описание некоторого вероятностного распределения.

Проверка гипотезы

Проверка гипотезы <math>H</math> (задающей вероятностное распределение <math>P_{H}</math>) состоит в следующем. Выбирается событие <math>S \subset \Omega</math> (называемое статистическим критерием), которое (по каким-либо соображениям) «почти несовместимо» с гипотезой <math>H</math> в том смысле, что условная вероятность <math>P_{H}(S)</math> события <math>S</math> (при условии, что гипотеза <math>H</math> верна) не превышает какого-то малого (по сравнению с единицей) числа <math>\alpha</math>, называемого уровнем значимости: <math>P_{H}(S) \leq \alpha</math>. Затем проводится опыт. Если событие <math>S</math> происходит, то гипотеза <math>H</math> отвергается (говорят, что наблюдается отклонение от гипотезы на уровне значимости <math>\alpha</math>). В противном случае, гипотеза не отвергается (однако никакой метод статистики, ни даже науки в целом, не может «окончательно доказать» гипотезу).

Таким образом, уровень <math>\alpha</math> значимости теста — вероятность отклонить гипотезу <math>H</math>, если на самом деле она верна (решение известное как ошибка первого рода, или ложноположительное решение).

Популярными уровнями значимости являются 10 %, 5 %, 1 %, и 0,1 %.

Различные значения α-уровня имеют свои достоинства и недостатки. Меньшие α-уровни дают бо́льшую уверенность в том, что уже установленная альтернативная гипотеза значима, но при этом есть больший риск не отвергнуть ложную нулевую (или отвергнуть истинную альтернативную) гипотезу (ошибка второго рода, или «ложноотрицательное решение»), и таким образом меньшая статистическая мощность. Выбор α-уровня неизбежно требует компромисса между значимостью и мощностью, и следовательно между вероятностями ошибок первого и второго рода.

При использовании тестов на статистическую значимость нужно иметь в виду, что тест вовсе не дает оснований для принятия гипотезы[1].

См. также

Примечания

Шаблон:Примечания

Литература

Ссылки

Шаблон:Вс