Русская Википедия:Выборочная функция распределения

Материал из Онлайн справочника
Версия от 13:20, 10 августа 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} '''Выборочная (эмпири́ческая) фу́нкция распределе́ния''' в математической статистике — это приближение теоретической функции распределения, построенное с помо...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

Выборочная (эмпири́ческая) фу́нкция распределе́ния в математической статистике — это приближение теоретической функции распределения, построенное с помощью выборки из него.

Определение

Пусть <math>X_1,\ldots, X_n</math> — выборка объёма <math>n</math>, порождённая случайной величиной <math>X</math>, задаваемой функцией распределения <math>F(x)</math>. Будем считать, что <math>X_i</math>, где <math>i\in \left \{ 1,n \right \}, n\in \mathbb{N}</math>, — независимые случайные величины, определённые на некотором пространстве элементарных исходов <math>\Omega</math>. Пусть <math>x \in \mathbb{R}</math>. Определим функцию <math>\hat{F}(x)</math> следующим образом:

<math>\hat{F}(x) = \frac{1}{n}\sum\limits_{i=1}^n \mathbf{1}_{\{X_i \le x\}} = \frac{1}{n}\sum\limits_{i=1}^n \theta(x-X_i)</math>,

где <math>\mathbf{1}_A</math> — индикатор события <math>A</math>, <math>\theta(x)</math> — функция Хевисайда. Таким образом, значение функции <math>\hat{F}</math> в точке <math>x</math> равно относительной частоте элементов выборки, не превосходящих значение <math>x</math>. Функция <math>\hat{F}(x)</math> называется выборочной функцией распределения случайной величины <math>X</math>, или эмпирической функцией выборки, и является аппроксимацией для функции <math>F(x)</math>. Существует теорема Колмогорова, утверждающая, что при <math>n \to \infty</math> функция <math>\hat{F}(x)</math> равномерно сходится к <math>F(x)</math>, и указывающая скорость сходимости. Для каждого положительного <math>x</math>, <math>\hat{F}(x)</math> — случайная величина со значением <math>\frac{k}{n}, k\in \left \{ 0,n \right \}</math>.

Основные свойства

<math>p_i = p(x_i) = \frac{N_{x_i}}{n}, \; i = 1,\ldots, n</math>,

где <math>x_i = X_i(\omega)</math>, а <math>N_{x} = \sum\limits_{j=1}^n \mathbf{1}_{\{x = x_j\}}</math> — количество элементов выборки, равных <math>x</math>. В частности, если все элементы выборки различны, то <math>N_{x_i} = 1,\; \forall i</math>.

Математическое ожидание этого распределения имеет вид:

<math>\sum\limits_{i=1}^n x_i p_i = \sum\limits_{i=1}^n x_i \frac{N_{x_i}}{n} = \overline{X}(\omega)</math>.

Таким образом, выборочное среднее — это теоретическое среднее выборочного распределения. Аналогично, выборочная дисперсия — это теоретическая дисперсия выборочного распределения.

<math>n \hat{F}(x) \sim \mathrm{Bin}(n,F(x))</math>.
  • Выборочная функция распределения <math>\hat{F}(x)</math> является несмещённой оценкой функции распределения <math>F(x)</math>:
<math>\mathbb{E}\left[\hat{F}(x)\right] = F(x)</math>.
  • Дисперсия выборочной функции распределения имеет вид:
<math>\mathrm{D}\left[\hat{F}(x)\right] = \frac{F(x)(1-F(x))}{n}</math>.
<math>\hat{F}(x) \to F(x)</math> почти наверное при <math>n \to \infty</math>.
<math>\sqrt{n}\left(\hat{F}(x) - F(x)\right) \to \mathrm{N}\left(0,F(x)(1-F(x))\right)</math> по распределению при <math>n \to \infty</math>.

См. также

Шаблон:Нет ссылок