Русская Википедия:Последовательный статистический критерий
Последовательный статистический критерий — последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе.
Пусть наблюдению в статистическом эксперименте доступна случайная величина <math>\displaystyle X</math> с неизвестным (полностью или частично) распределением <math>\mathbb P</math> (формально, в математической нотации, <math>X:\Omega\mapsto \mathbb R</math>, где вероятностное пространство <math>\Omega</math> снабжено <math>\sigma</math>-алгеброй событий <math>\mathcal F</math>, и <math>\displaystyle X</math> измерима относительно Борелевской <math>\sigma</math>-алгебры).
Пусть проверяется нулевая гипотеза <math>H_0:\, \mathbb P\in \mathcal P_0</math> против альтернативы <math>H_1:\, \mathbb P\in \mathcal P_1</math>.
На каждом этапе <math>i\geq 1</math> статистического эксперимента, независимо от других этапов, наблюдается случайная величина <math>\displaystyle X_i</math> — копия <math>\displaystyle X</math>, до тех пор пока <math>i\leq \nu</math>, где <math>\displaystyle\nu</math> — некоторый (случайный) момент остановки. Последовательный статистический критерий — это пара <math>(\nu,\delta)</math>, где <math>\displaystyle \delta</math> — любая функция от <math>(X_1,\dots,X_\nu)</math>, принимающая значение 0 или 1 (решение, соответственно, в пользу нулевой <math>H_0</math> или альтернативной <math>H_1</math> гипотезы).
Этому определению может быть придан формальный смысл с помощью понятия момента остановки относительно последовательности <math>\sigma</math>-алгебр <math>\mathcal F_n=\sigma(X_1,X_2,\dots X_n)</math>, порожденных случайными величинами <math>X_1,X_2,\dots X_n</math>, <math> n=1,2,\dots</math>. Тогда решающая функция <math>\displaystyle \delta</math> должна быть измеримой относительно <math>\sigma</math>-алгебры <math>\mathcal F_\nu</math> событий, предшествующих моменту <math>\nu</math>: <math>\mathcal F_\nu=\{A\in \mathcal F:A\cap\{\nu\leq n\}\in\mathcal F_n\}</math>.
Функция мощности критерия <math>(\nu,\delta)</math> в "точке" <math>\mathbb P</math> определяется как <math>\beta(\mathbb P;\nu,\delta)=\mathbb P(\delta=1)</math>. Если <math>\mathbb P\in\mathcal P_0</math>, то <math>\beta(\mathbb P;\nu,\delta)</math> называется вероятностью ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она верна). Если <math>\mathbb P\in\mathcal P_1</math>, то <math>\mathbb P(\delta=0)</math> называется вероятностью ошибки второго рода (вероятность принять нулевую гипотезу, когда она неверна).
Рандомизированные последовательные критерии
Рандомизированный последовательный критерий проверки гипотез может быть определен как пара <math>\displaystyle(\psi,\phi)</math>, где <math>\psi=(\psi_1,\psi_2,\dots,)</math>, <math>\phi=(\phi_1,\phi_2,\dots,)</math>, и <math>\psi_n=\psi_n(X_1,\dots,X_n)</math>, <math>\phi_n=\phi_n(X_1,\dots,X_n)</math> - (измеримые) функции, принимающие значения между 0 и 1, <math>n=1,2,\dots</math>. На каждом этапе <math>n\geq 1</math> (если эксперимент до него дошел) <math>\psi_n(X_1,\dots,X_n)</math> интерпретируется как вероятность остановится на этом этапе, без проведения дальнейших наблюдений, а <math>\phi_n(X_1,\dots,X_n)</math> - как вероятность отвергнуть нулевую гипотезу, если остановка на этом этапе произошла.
<math>\psi=(\psi_1,\psi_2,\dots,)</math> называется рандомизированным правилом остановки, а <math>\phi=(\phi_1,\phi_2,\dots,)</math> - рандомизированным правилом принятия решения.
Если все <math>\displaystyle\psi_n</math> принимают только значения 0 (продолжение наблюдений) и 1 (остановка), то правило остановки <math>\displaystyle\psi</math> определяет нерандомизированный момент остановки <math>\nu=\min\{n:\psi_n(X_1,\dots,X_n)=1\}</math>. Аналогично, если все <math>\displaystyle\phi_n</math> принимают только значения 0 (принятие нулевой гипотезы) и 1 (отвержение нулевой гипотезы), то правило принятия решения <math>\displaystyle\phi</math> определяет нерандомизированную решающую функцию: <math>\displaystyle\delta=\phi_n</math>, если <math>\displaystyle\psi_n=1</math>.
Функция мощности критерия <math>(\psi,\phi)</math> в "точке" <math>\mathbb P</math> определяется как <math>\beta(\mathbb P;\psi,\phi)=\sum_{i=1}^\infty\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i\phi_i</math>, где <math>\mathbb E</math> - математическое ожидание относительно <math>\mathbb P</math>. Если <math>\mathbb P\in \mathcal P_0</math>, то <math>\beta(\mathbb P;\psi,\phi)</math> - вероятность ошибки первого рода. Если <math>\mathbb P\in \mathcal P_1</math>, то вероятность ошибки второго рода равна <math>\mathbb P(\nu<\infty)-\beta(\mathbb P;\psi,\phi)</math>, где <math>\mathbb P(\nu<\infty)=\sum_{i=1}^\infty\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i</math>. Соответственно, средний объем выборки при использовании правила остановки <math>\psi</math> определяется как <math>E\nu=\sum_{i=1}^\infty i\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i</math>, если <math>\mathbb P(\nu<\infty)=1</math> (в противном случае <math>E\nu=\infty</math>).
Пример
Последовательный критерий отношения вероятностей (критерий Вальда)
Ссылки
- Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки — М.: Наука, 1976.
- Ghosh, M., Mukhopadhyay, N., and Sen, P.K. Sequential Estimation, New York: Wiley, 1997.