Русская Википедия:Непараметрическая статистика

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Непараметрическая статистика — раздел статистики, который не основан исключительно на параметризованных семействах вероятностных распределений (широко известными примерами параметров являются математическое ожидание и дисперсия). Непараметрическая статистика включает в себя описательную статистику и статистический вывод.

Определения

Статистик Шаблон:Нп4 сказал: «Сложно дать чёткое определение непараметрической статистике»[1]. Термин «непараметрическая статистика» может быть нечётко определён, среди прочих, следующими двумя способами.

Шаблон:Ordered list

Цели и применения

Непараметрические методы широко используются для изучения популяций, которые принимают ранжированный порядок (например, обзоры фильмов, которые могут получать от одной до четырех звезд). Использование непараметрических методов может быть необходимым, когда данные имеют ранжирование, но не имеют ясной численной интерпретации, например, при оценке предпочтений. С точки зрения шкал, результатами работы непараметрических методов являются порядковые данные.

Поскольку непараметрические методы делают меньше предположений, сфера их применений гораздо шире, нежели у параметрических методов. В частности, они могут применяться в ситуациях, когда имеется меньше информации о самом применении. Также в связи с тем, что они зависят от меньшего числа предположений, непараметрические методы являются более надежными.

Другим обоснованием использования непараметрических методов является их простота. В некоторых случаях, даже в тех, когда использование параметрических методов оправдано, может быть проще использовать непараметрические методы. Из-за перечисленных выше причин, непараметрические методы рассматриваются некоторыми статистиками как дающие меньше возможностей для неправильного понимания и использования.

Более широкая применимость и повышенная робастность (надёжность) непараметрических методов обходятся дорого: в тех случаях, когда параметрический метод подходит, непараметрические имеют меньшую статистическую мощность. Другими словами, для того чтобы сделать выводы с той же уверенностью, может потребоваться больший размер выборки.

Непараметрические модели

Непараметрические модели отличаются от параметрических моделей тем, что структура модели не задается априори, а определяется данными. Термин непараметрический не означает полное отсутствие параметров. Просто их количество и характер гибки и не фиксированы заранее.

Методы

Непараметрические (или свободные от распределения) методы статистического вывода являются математическими процедурами для проверки статистических гипотез, которые, в отличие от параметрической статистики, не делают предположений о вероятностных распределениях оцениваемых переменных. Такие методы носят название непараметрических статистических критериев. Наиболее часто используемые критерии включают:

История

Среди ранних непараметрических статистик — медиана (13-й век или ранее, использовалась в оценке Эдварда Райта, 1599) и критерий знаков Джона Арбетнота (1710) при анализе соотношения полов человека при рождении.[2]

Примечания

Шаблон:Примечания

Литература

Внешние ссылки

  1. Wasserman (2007), p.1
  2. Шаблон:Citation

Шаблон:Выбор языка