Русская Википедия:U-критерий Манна — Уитни
U-критерий Манна — Уитни (Шаблон:Lang-en) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна — Уитни — Уилкоксона (Шаблон:Lang-en), критерий суммы рангов Уилкоксона (Шаблон:Lang-en) или критерий Уилкоксона — Манна — Уитни (Шаблон:Lang-en). Реже: критерий числа инверсий[1].
История
Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком Уилкоксоном. В 1947 году он был существенно переработан и расширен Г. Б. Манном и Шаблон:Нп4, по именам которых сегодня обычно и называется.
Описание критерия
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
Ограничения применимости критерия
- В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
- В выборочных данных не должно быть совпадающих значений (все числа — разные) или таких совпадений должно быть очень мало (до 10).Шаблон:Нет АИ
Использование критерия
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
- Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным <math>N = n_1 + n_2,</math> где <math>n_1</math> — количество элементов в первой выборке, а <math>n_2</math> — количество элементов во второй выборке.
- Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки <math>R_1 </math>, и отдельно — на долю элементов второй выборки <math>R_2 </math>, затем вычислить:
<math>U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 </math>,
<math>U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 </math>,
если всё вычислено верно, то
<math>U_1+U_2=n_1\cdot n_2. </math>, - Определить значение U-статистики Манна-Уитни по формуле <math>U = \min\{U_1, U_2\}.</math>
- По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных <math>n_1</math> и <math>n_2</math>. Если полученное значение <math>U</math> меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение <math>U</math> больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение <math>U</math>.
- При справедливости нулевой гипотезы критерий имеет математическое ожидание <math>M(U) = n_1 n_2 / 2</math> и дисперсию <math>D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12</math> и при достаточно большом объёме выборочных данных <math>(n_1 > 19, n_2 > 19)</math> распределён практически нормально.
Таблица критических значений
- Critical Values for the Mann — Whitney U-Test.
- Расчет критических значений U-критерия Манна — Уитни для выборок больше 20 (N>20)
См. также
- Критерий Краскела — Уоллиса — обобщение U-критерия Манна — Уитни на случай нескольких выборок.
Примечания
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947. — № 18. — P. 50—60.
- Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. — 1945. — P. 80—83.
- Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. — Л., 1973.
- Сидоренко Е. В. Методы математической обработки в психологии. — Шаблон:СПб, 2002.