Русская Википедия:Синтетический контроль

Сравнение реального благосостояния жителей ФРГ после объединения с ГДР в 1990 и гипотетического, если бы объединения не состоялось, с опорой на данные других стран ОЭСР^[1].

Синтетический контроль (Шаблон:Lang-en, SCM) — эконометрический метод анализа данных в рамках Шаблон:Нп4, позволяющий проводить Шаблон:Нп4 в сравнительных кейс-стади. Метод направлен на оценку эффектов исследуемого воздействия (например, экономической реформы) на примере небольшого числа кейсов с помощью моделирования их количественных показателей в гипотетической ситуации, где воздействие не было оказано, на основе ограниченного круга похожих контрольных наблюдений посредством присвоения этим переменным определённых весов.

Формальный вывод

Рассмотрим <math>i</math>-й регион, или какой-то другой объект наблюдения, причём <math>i = 1,\dots,J+1</math>, где <math>J+1</math> — число регионов, среди которых 1 испытал на себе исследуемое воздействие, а остальные <math>J</math> — нет, являясь контрольной группой (их совокупность называется «пулом доноров», Шаблон:Lang-en), в период времени <math>t</math>, где <math>t = 1,\dots,T</math>.

Пусть исследуемое воздействие будет оказано в период <math>T_0+1</math>, где <math>1 \leq T_0 < T</math>, и тогда <math>T_0</math> — число периодов до воздействия. Обозначим отклик показателя в регионе <math>i</math> в период времени <math>t</math> в отсутствие исследуемого воздействия через <math>Y^N_{it}</math>, а в его присутствие — <math>Y^I_{it}</math>. Сделаем допущение о том, что при <math>t = 1 \dots T_0</math>, <math>Y^N_{it}=Y^I_{it}</math>: до наступления исследуемого воздействия, оно не оказывает эффекта на отклик в выбранном регионе. Также допустим, что воздействие, имевшее место в рассматриваемом регионе, не оказывает влияния на регионы из контрольной группы. Эффект исследуемого воздействия обозначим как <math>a_{it}=Y^I_{it}-Y^N_{it}</math>. Поскольку воздействие имеет место только в <math>i=1</math> и <math>t>T_0</math>, целью SCM является определение <math>a_{1t}=Y^I_{1t}-Y^N_{1t}</math>, где <math>Y^I_{1t} = Y_{1t}</math> — собственно, наблюдаемый в рассматриваемом регионе показатель, а <math>Y^N_{1t}</math> — ненаблюдаемый отклик, который можно представить в качестве следующей факторной модели:

<math>Y^N_{it} = \delta_t + \boldsymbol{\theta}_t\mathbf{Z}_i + \boldsymbol{\lambda}_t\boldsymbol{\mu}_i + \epsilon_{it},</math>

где <math>\delta_t</math> — общий для всех регионов фактор, <math>\mathbf{Z}_i</math> — вектор наблюдаемых, независимых от воздействия ковариат, <math>\boldsymbol{\theta}_t</math> — вектор их оценённых для данной выборки регионов коэффициентов, <math>\boldsymbol{\lambda}_t</math> — вектор ненаблюдаемых латентных факторов, <math>\boldsymbol{\mu}_i</math> — вектор соответствующих им факторных нагрузок и <math>\epsilon_{it}</math> — специфичности, или шум. Эту модель можно переписать в виде:

<math>\sum\limits_jw_jY^N_{it} = \delta_t + \boldsymbol{\theta}_t\sum\limits_jw_j\mathbf{Z}_i + \boldsymbol{\lambda}_t\sum\limits_jw_j\boldsymbol{\mu}_i + \sum\limits_jw_j\epsilon_{it},</math>

где <math>w_j</math> — это <math>j</math>-тое значение вектора <math>\mathbf{W} = (w_2,\dots,w_{J+1})'</math>, такого, что <math>\forall j:w_j > 0 \land \sum\limits_jw_j=1</math>. Метод синтетического контроля заключается в подборе такого набора весов <math>(\tilde w_2,\dots,\tilde w_{J+1})'</math>, что при <math>t \leq T_0</math>, <math>\sum\limits_j\tilde w_jY_{jt} = Y_{1t}</math> (то есть до воздействия веса сохраняют наблюдаемое значения отклика неизменным) и <math>\sum\limits_j\tilde w_j\mathbf{Z}_j = \mathbf{Z}_1</math> (и при этом эти веса позволяют точно моделировать ковариаты рассматриваемого региона через ковариаты регионов контрольной группы).

В литературе было показано, что если отклонения специфичностей <math>\epsilon_{it}</math> незначительны при данном <math>T_0</math>, размере периода до воздействия, <math>Y^N_{1t} - \sum\limits_jw_jY_{it} \to 0</math>, то есть разница между моделируемым, ненаблюдаемым откликом в отсутствие воздействия и взвешенным, но наблюдаемым в его присутствии, в таких условиях ничтожно. Соответственно, предлагается такая оценка эффекта воздействия (<math>a_{it}=Y^I_{it}-Y^N_{it}</math>)^[2]Шаблон:Rp:

<math>\hat a_{1t}=Y_{1t}-\sum\limits_j\tilde w_jY_{jt}</math>

Оптимизация алгоритма

С вычислительной точки зрения, расчёт искомых весов связан с минимизацией по вектору весов <math>\mathbf{W}</math> нормы <math>\|\mathbf{X}_1-\mathbf{X}_0\mathbf{W}\|</math>, где <math>\mathbf{X}_1</math> — вектор значений ковариатов для исследуемого региона до момента <math>T_0+1</math>, а <math>\mathbf{X}_0</math> — матрица значений ковариатов для контрольных регионов. Вне зависимости от выбора исследователем положительно определённой матрицы <math>\mathbf{V}</math>, оптимизируемая норма раскрывается как <math>\|\mathbf{X}_1-\mathbf{X}_0\mathbf{W}\|_{\mathbf{V}} = \sqrt{(\mathbf{X}_1-\mathbf{X}_0\mathbf{W})'\mathbf{V}(\mathbf{X}_1-\mathbf{X}_0\mathbf{W})}</math> ^[2]Шаблон:Rp.

Для того, чтобы получить конечное значение <math>\mathbf{V}</math>, проводят внешнюю оптимизацию по параметру <math>\mathbf{V}</math> с использованием коэффициентом дисконтирования <math>\beta</math>, повышающим вес недавних наблюдений. Эту оптимизацию можно описать следующим образом: <math>\sum\limits_{t=1}^T\beta^{T-t}\left( Y_{1t} - \sum\limits_{j=2}^{J+1}\tilde W_j(V)Y_{jt}\right)^2 \to min</math>, где <math>\tilde \mathbf{W}</math> — вектор минимальных весов, полученный на предыдущем этапе^[3]Шаблон:Rp.

Статистическая значимость результатов

Определение статистической значимости полученных оценок может быть проведено посредством различных техник. В статье 2003 года, оценивающей влияние терроризма и прочих проявлений политического насилия на экономику Страны Басков, рассчитанный эффект был подвергнут т. н. плацебо-тесту (placebo test), заключавшемуся в осуществлении идентичного алгоритма синтетического контроля к Каталонии, также известной своим значительным сепаратистским движением, но не испытывавшей проблем с террористическими проявлениями этого движения^[4].

Плацебо-тесты в литературе, использующей метод синтетического контроля, являются примером непараметрических пермутационных тестов. Моделирование синтетического отклика для всех контрольных кейсов в выборке позволяет в явном виде работать с вероятностным распределением и проверять нулевую гипотезу об отсутствии казуальных эффектов в рассматриваемом кейсе. При этом нет необходимости асимптотически приближать распределение этих эффектов у контрольных кейсов к тому или иному распределению, что и делает тесты подобного типа пермутационными^[5].

Синтетический контроль как метод предсказания

В литературе было предложено использовать SCM не только для оценки причинно-следственных связей, но и построения прогнозов. В рамках пилотного исследования была предпринята попытка спрогнозировать экономический рост в Соединённых Штатах Америки, однако использующийся для получения весов «пул доноров» состоял уже не из стран с похожими характеристиками, но из показателей экономического роста с определённым временным лагом^[3]Шаблон:Rp.

Синтетический контроль и другие методы

Синтетический контроль совмещает элементы других каузальных статистических методов: Шаблон:Нп4 и Шаблон:Нп4.

По сравнению с разностью разностей синтетический контроль предлагает более упорядоченную процедуру подбора весов для наблюдений из контрольной группы, использует больший временной промежуток перед воздействием и требует максимально возможного приближения характеристик контрольной группы к характеристикам исследуемого объекта в ходе подбора весов.

Метод синтетического контроля обладает набором сходств с линейной регрессией. Так и синтетический контроль, и регрессионный анализ предполагают линейную комбинацию весов и переменных (в последнем веса, как правило, называются регрессионными коэффициентами), причём сумма весов равняется 1. Основным различием является то, что в SCM значения этих весов заключены в <math>[0,~1]</math>, тогда как в регрессионном анализе такого ограничения нет и коэффициенты практически не интерпретируются как веса^[1]Шаблон:Rp Так контрфактуальная Германия из исследования 2015 года^[1] была «синтезирована» на основании подушного ВВП, уровня инвестиций, торговой открытости, количества школ и доли промышленности в прибавочном продукте Австрии (42%), США (22%), Японии (16%), Швейцарии (11%) и Нидерландов (9%)^[6].

Симуляции показали, что панельный метод Сяо (фиксированные эффекты с эффектами взаимодействия) для исследования каузальных эффектов является менее робастным к изменению в пуле доноров, нежели синтетический контроль, хотя использование обоих подходов приводит к удовлетворительным результатам. Отмечалось, что синтетический контроль является более предпочтительным, если у исследователя есть данные по дополнительным временным периодам^[7]Шаблон:Rp^[8].

Применение

Область применения метода синтетического контроля охватывает исследования политики в сфере здравоохранения^[9], криминологию^[10], политическую науку^[1], различные разделы экономики.

В политологии SCM рассматривается как компромисс между конвенциональными количественными и качественными методами, позволяющий совмещать фокус на одном или нескольких кейсах со строгими критериями их подбора. Посредством этого метода изучались: экономический эффект от объединения Германии для собственно ФРГ^[1], последствия Шаблон:Нп4 для расходов на социальное обеспечение^[11].

В географии SCM используется в исследованиях антропогенных ландшафтов (в рамках land systems science)^[12]Шаблон:Rp.

В статистических пакетах

Существуют пакеты для анализа данных посредством метода синтетического контроля в статистическом программном обеспечением. Для языка R был разработан пакет Synth^[13].

См. также

Метод инструментальных переменных

Примечания

Шаблон:Примечания

[Abadie2015-1] 1,0 ^1,1 ^1,2 ^1,3 ^1,4 Шаблон:Статья

[Abadie2010-2] 2,0 ^2,1 Шаблон:Статья

[kp-3] 3,0 ^3,1 Шаблон:Статья

[4] Шаблон:Статья

[HS-5] Шаблон:Статья

[k18-6] Шаблон:Статья

[7] Шаблон:Статья

[8] Шаблон:Статья

[Kreif2016-9] Шаблон:Статья

[10] Шаблон:Статья

[11] Шаблон:Статья

[12] Шаблон:Статья

[13] Шаблон:Статья

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Синтетический контроль

Содержание

Формальный вывод

Оптимизация алгоритма

Статистическая значимость результатов

Синтетический контроль как метод предсказания

Синтетический контроль и другие методы

Применение

В статистических пакетах

См. также

Примечания

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты