Русская Википедия:Модель упорядоченного выбора

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Модель упорядоченного выбора (упорядоченная регрессия, Шаблон:Lang-en) — применяемая в эконометрике модель с упорядоченной (с ранжированными значениями) дискретной зависимой переменной, в качестве которой могут выступать, например, оценки чего-либо по пятибалльной шкале, рейтинги компаний и т. д. В рамках данной модели предполагается, что количество значений зависимой переменной конечно.

Сущность модели

Пусть <math>y</math> — наблюдаемая дискретная переменная с <math>q</math> возможными упорядоченными значениями, которые для упрощения можно принять равными целым числам от <math>0</math> до <math>q-1</math> (или от <math>1</math> до <math>q</math>). Пусть также <math>x</math>-вектор факторов, влияющих на значение зависимой переменной. Предполагается, что существует «обычная» (недискретная) скрытая переменная <math>y^*</math>, также зависящая от этих факторов, в зависимости от значений которой зависимая переменная принимает те или иные значения. Соответственно необходимо определить (их можно либо задать априорно, либо оценить вместе с другими параметрами модели) несколько пороговых значений скрытой переменной следующим образом:

<math> y= \begin{cases} 1, y^*\leqslant c_1\\ 2, c_1 < y^*\leqslant c_2\\ 3, c_2 < y^*\leqslant c_3\\ ...\\ q, y^*>c_{q-1} \end{cases} </math>

Соответственно, если обозначить <math>p_i=P(y=i|X=x)</math>, <math>i=1...q</math>, то

<math>p_i =P(c_{i-1} < y^*\leqslant c_i)</math>.

где <math>c_0=-\infty</math>, <math>c_q=\infty</math>.

Для скрытой переменной предполагается обычная линейная модель регрессии по факторам модели: <math>y^*=x^Tb+\varepsilon</math>. Обозначим интегральную функцию распределения случайной ошибки этой модели через <math>F</math>. Тогда

<math>p_i =P(c_{i-1} < y^*\leqslant c_i)=P(c_{i-1}- x^Tb< \varepsilon \leqslant c_i-x^Tb)=F(c_i-x^Tb)-F(c_{i-1}-x^Tb)</math>

С учетом того, что <math>F(c_0-x^Tb)=0</math>, <math>F(c_q-x^Tb)=1</math> фактически модель упорядоченного выбора можно записать следующим образом:

<math> \begin{cases} p_1=F(c_1-x^Tb)\\ p_2= F(c_2-x^Tb)-F(c_1-x^Tb)\\ p_3= F(c_3-x^Tb)-F(c_2-x^Tb)\\ ...\\ p_q=1-F(c_{q-1}-x^Tb) \end{cases} </math>

В качестве распределения <math>F</math> обычно используют либо нормальное распределение (упорядоченный пробит), либо логистическое распределение (упорядоченный логит)

Оценка параметров

Оценка параметров модели (включая пороговые значения) производится обычно методом максимального правдоподобия. Логарифмическая функция правдоподобия равна:

<math>l(b,c)=\sum^q_{i=1}\sum_{\forall t , y_t=i}\ln p_i(x_t)</math>

Максимизация этой функции по неизвестным параметрам b и c и позволяет найти соответствующие оценки ММП.

См. также

Шаблон:Rq