Русская Википедия:Критерий знаков

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

В математической статистике критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух связанных выборок).[1] Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.

Описание метода для двух выборок

Рассмотрим две непрерывно распределенные случайные величины X и Y, и пусть нулевая гипотеза выполняется, то есть медиана их разности равна нулю. Тогда <math>p=\mathbb P(X>Y)=0.5</math>. Иными словами, каждая из случайных величин равновероятно больше другой.

Рассмотрим пару связных выборок <math>\{(x_1,y_1),\ldots,(x_n,y_n)\}</math>. Будем считать, что в выборке нет элементов, для которых <math>x_i=y_i</math> (иначе уберем эти элементы из выборки). Построим статистику w, равную числу элементов в выборке, при которых <math>x_i>y_i</math>. При выполнении нулевой гипотезы, эта величина имеет биномиальное распределение: <math>w\sim B(n,0.5)</math>.

Для применения критерия необходимо вычислить «левый хвост» биномиального распределения до w: <math>b=2^{-n}\sum_{i=0}^w C_n^i</math>. Согласно критерию, при уровне значимости <math>\alpha</math>:

  • против двусторонней альтернативной гипотезы <math>p\ne 0.5</math>
если <math>b \not\in \left[ \alpha/2,\, 1-\alpha/2 \right] </math>, то нулевая гипотеза отвергается;
  • против альтернативы <math>p < 0.5</math>
если <math>b < \alpha </math>, то нулевая гипотеза отвергается;
  • против альтернативы <math>p > 0.5</math>
если <math> b > 1-\alpha </math>, то нулевая гипотеза отвергается;

Пример задачи

Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения.

Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки и называются связанными.

Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Заданы две выборки одинаковой длины <math>x^n = (x_1,\ldots,x_n),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</math>.

Дополнительные предположения:

  • обе выборки простые;
  • выборки связные, то есть элементы <math>x_i,\,y_i</math> соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза <math>H_0:\; \mathbb{P} \{ x>y \} = 1/2</math>.

Если в выборке имеются случаи <math> x_i = y_i </math>, то их следует исключить из выборки, уменьшив число наблюдений. Статистика критерия — это число w элементов в выборке, при которых <math>x_i>y_i</math>.

Ссылки

Шаблон:Reflist

  1. The Sign Test for a Median Шаблон:Wayback // STAT 415 Intro Mathematical Statistics. Penn State University.