Русская Википедия:Складной нож (статистика)

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Складной нож (Шаблон:Lang-en) — один из методов ресэмплинга (линейное приближением статистического бутстрэпа), используемый для оценки погрешности в статистическом выводе. Способ заключается в следующем: для каждого элемента вычисляется среднее значение выборки без учёта данного элемента, а затем — среднее всех таких значений. Для выборки из N элементов оценка получается путём вычисления среднего значения остальных N-1 элементов.

Этот метод разработал Морис Кенуй (Maurice Quenouille 1949, 1956) с целью уменьшения погрешности оценки отдельного образца. Джон Тьюки в 1958 году расширил его возможности и предложил название «складной нож», потому что его действие напоминает складной нож — простой инструмент, которым можно решить множество различных проблем, пускай и менее эффективно, чем при помощи предназначенных для этого средств. Он может помочь улучшить оценку в случае когда данные распределены неравномерно.

Оценка

Оценочные параметры могут быть найдены как среднее значение элементов выборки без i-го элемента (назовем их <math>{\bar {x}}_{i}</math>).

<math>{\displaystyle {\bar {x}}_{i}={\frac {1}{n-1}}\sum _{j\neq i}^{n}x_{j}}</math>

Дисперсионная оценка

Оценка дисперсии параметров может быть вычислена по формуле:

<math>\operatorname {Var}_{{\mathrm {(jackknife)}}}={\frac {n-1}{n}}\sum _Шаблон:I=1^{n}({\bar {x}}_{i}-{\bar {x}}_{{\mathrm {(.)}}})^{2} = \frac{1}{n}\cdot\sum\limits_{i=1}^{n}(\frac{\sum\limits_{j=1}^{n}x_j}{n}-x_i)^2</math>

где <math>{\bar {x}}_{i}</math> — это оценочные параметры, а <math>{\displaystyle {\bar {x}}_{\mathrm {(.)} }={\frac {1}{n}}\sum _{i}^{n}{\bar {x}}_{i}}</math> — оценка, основанная на всех элементах.

Другими словами оценка дисперсии — это среднее арифметическое квадратов разности среднего арифметического всех элементов и данного.

Оценка и коррекция смещения

Данный метод может быть использован для оценки погрешности параметра относительно всей выборки. Введем <math>{\displaystyle {\hat {\theta }}}</math>, как оценку параметра на основе всех данных:

<math>\hat{\theta} = \frac{\operatorname {Var}_{{\mathrm {(jackknife)}}}} {n-1}</math>

<math>{\hat {\theta }}_{{\mathrm {(.)}}}={\frac {1}{n}}\sum _Шаблон:I=1^{n}{\hat {\theta }}_{{\mathrm {(i)}}}</math>

<math>{\displaystyle {\widehat {\text{Bias}}}_{\mathrm {(\theta )} }=(n-1)({\hat {\theta }}_{\mathrm {(.)} }-{\hat {\theta }})}</math>