Русская Википедия:Непараметрическая статистика

Непараметрическая статистика — раздел статистики, который не основан исключительно на параметризованных семействах вероятностных распределений (широко известными примерами параметров являются математическое ожидание и дисперсия). Непараметрическая статистика включает в себя описательную статистику и статистический вывод.

Определения

Статистик Шаблон:Нп4 сказал: «Сложно дать чёткое определение непараметрической статистике»^[1]. Термин «непараметрическая статистика» может быть нечётко определён, среди прочих, следующими двумя способами.

Шаблон:Ordered list

Цели и применения

Непараметрические методы широко используются для изучения популяций, которые принимают ранжированный порядок (например, обзоры фильмов, которые могут получать от одной до четырех звезд). Использование непараметрических методов может быть необходимым, когда данные имеют ранжирование, но не имеют ясной численной интерпретации, например, при оценке предпочтений. С точки зрения шкал, результатами работы непараметрических методов являются порядковые данные.

Поскольку непараметрические методы делают меньше предположений, сфера их применений гораздо шире, нежели у параметрических методов. В частности, они могут применяться в ситуациях, когда имеется меньше информации о самом применении. Также в связи с тем, что они зависят от меньшего числа предположений, непараметрические методы являются более надежными.

Другим обоснованием использования непараметрических методов является их простота. В некоторых случаях, даже в тех, когда использование параметрических методов оправдано, может быть проще использовать непараметрические методы. Из-за перечисленных выше причин, непараметрические методы рассматриваются некоторыми статистиками как дающие меньше возможностей для неправильного понимания и использования.

Более широкая применимость и повышенная робастность (надёжность) непараметрических методов обходятся дорого: в тех случаях, когда параметрический метод подходит, непараметрические имеют меньшую статистическую мощность. Другими словами, для того чтобы сделать выводы с той же уверенностью, может потребоваться больший размер выборки.

Непараметрические модели

Непараметрические модели отличаются от параметрических моделей тем, что структура модели не задается априори, а определяется данными. Термин непараметрический не означает полное отсутствие параметров. Просто их количество и характер гибки и не фиксированы заранее.

Гистограмма — это простая непараметрическая оценка вероятностного распределения.
Ядерная оценка плотности дает лучшие оценки плотности, чем гистограммы.
Методы непараметрической регрессии и полупараметрической регрессии разработаны на основе ядер, сплайнов и вейвлетов.
Анализ среды функционирования обеспечивает коэффициенты эффективности, близкие к тем, что получены многомерным анализом без каких-либо предположений о распределениях.
Метод <math>k</math>-ближайших соседей классифицирует невидимый экземпляр в обучающем наборе на основе <math>k</math> ближайших к нему точек.
Метод опорных векторов (с гауссовым ядром) является непараметрическим классификатором больших полей.

Методы

Непараметрические (или свободные от распределения) методы статистического вывода являются математическими процедурами для проверки статистических гипотез, которые, в отличие от параметрической статистики, не делают предположений о вероятностных распределениях оцениваемых переменных. Такие методы носят название непараметрических статистических критериев. Наиболее часто используемые критерии включают:

Анализ сходства: проверяет статистическую значимость различия между группами состоящими выборок
Критерий Андерсона-Дарлинга: проверяет принадлежность анализируемой выборки данному закону распределения
Бутстрэп: позволяет просто и быстро оценивать разные статистики для сложных моделей
Критерий Фридмана: применяется для исследования влияния разных значений фактора (градаций фактора) на одну и ту же выборку
Оценка Каплана-Майера: оценивает функцию выживаемости по данным времени жизни
Тау-коэффициент Кендалла: измеряет статистическую зависимость между двумя переменными
W Кендалла: непараметрическая статистика, которая измеряет степень сходства между двумя ранжированиями и может быть использован для оценки значимости отношения между ними
Двухвыборочный критерий Колмогорова—Смирнова: используется для проверки гипотезы о принадлежности двух независимых выборок одному закону распределения
Дисперсионный анализ Краскела—Уоллиса: проверяет гипотезу о том, имеют ли сравниваемые выборки одно и то же распределение или же распределения с одной и той же медианой
Критерий согласия Кёйпера: используется для проверки того, противоречит ли данное распределение или семейство распределений признакам выборки данных
Логарифмический ранговый (логранговый) критерий: сравнение распределений выживаемости двух выборок
U-критерий Манна — Уитни: используется для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно
Критерий хи-квадрата МакНемара: проверяет, значимо или нет различаются между собой несколько сравниваемых переменных, принимающих значения 0 / 1
Медианный критерий: проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу
Критерий перестановок Питмана (ресемплинг): проверка статистической значимости, которая дает точные P-значения, изучая все возможные перестановки меток
Критерий Зигеля-Туки: проверка на различия в масштабе между двумя группами
Критерий знаков: применяется в ситуациях, когда два измерения (например, при разных условиях) одних и тех же субъектов нужно проверить на наличие или отсутствие различия результатов
Коэффициент ранговой корреляции Спирмена: используется для измерения нелинейной монотонной зависимости между переменными
Критерий квадратов рангов: проверяет равенство дисперсий в двух или более выборках
Критерий Тьюки-Дакуорта: проверяет, был ли одна из двух выборок значительно больше другой
Критерий серий Вальда—Вольфовица: проверяет, являются ли элементы последовательности взаимно независимыми / случайными
Критерий Уилкоксона: используемый для проверки различий между двумя выборками парных измерений

История

Среди ранних непараметрических статистик — медиана (13-й век или ранее, использовалась в оценке Эдварда Райта, 1599) и критерий знаков Джона Арбетнота (1710) при анализе соотношения полов человека при рождении.^[2]

Примечания

Шаблон:Примечания

Литература

Bagdonavicius, V., Kruopis, J., Nikulin, M.S. (2011). «Non-parametric tests for complete data», ISTE & WILEY: London & Hoboken. Шаблон:Isbn.
Шаблон:Книга
Шаблон:Нп3; Chakraborti, Subhabrata (2003). Nonparametric Statistical Inference, 4th Ed. CRC Press. Шаблон:Isbn.
Шаблон:Книга also Шаблон:Isbn.
Hollander M., Wolfe D.A., Chicken E. (2014). Nonparametric Statistical Methods, John Wiley & Sons.
Sheskin, David J. (2003) Handbook of Parametric and Nonparametric Statistical Procedures. CRC Press. Шаблон:ISBN
Wasserman, Larry (2007). All of Nonparametric Statistics, Springer. Шаблон:Isbn.
Орлов А. И. Прикладной статистический анализ : учебник. — М.: Ай Пи Ар Медиа, 2022. — 812 c. — ISBN 978-5-4497-1480-0 [1]

Внешние ссылки

↑ Wasserman (2007), p.1
↑ Шаблон:Citation

Шаблон:Выбор языка

[1] Wasserman (2007), p.1

[Conover1999-2] Шаблон:Citation

[1]

[2]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Непараметрическая статистика

Содержание

Определения

Цели и применения

Непараметрические модели

Методы

История

Примечания

Литература

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты