WikiDer > Разница в различиях

Difference in differences

Разница в различиях (СДЕЛАЛ[1] или же DD[2]) это статистический метод используется в эконометрика и количественные исследования в социальных науках, который пытается имитировать план экспериментального исследования с помощью данные наблюдательного исследования, изучая дифференциальный эффект лечения на «лечебную группу» по сравнению с «контрольная группа' в естественный эксперимент.[3] Он рассчитывает эффект лечения (т. Е. Объясняющую переменную или независимая переменная) на результат (т. е. переменная ответа или зависимая переменная) путем сравнения среднего изменения во времени переменной результата для экспериментальной группы со средним изменением во времени для контрольной группы. Хотя он предназначен для смягчения воздействия посторонних факторов и критерий отбора, в зависимости от того, как выбрана группа лечения, этот метод все же может быть предметом определенных предубеждений (например, средняя регрессия, обратная причинность и смещение пропущенной переменной).

В отличие от оценка временного ряда воздействия лечения на субъектов (который анализирует различия во времени) или перекрестной оценки эффекта лечения (который измеряет разницу между лечебной и контрольной группами), разница в использовании различий данные панели для измерения различий между экспериментальной и контрольной группой изменений переменной результата, происходящих с течением времени.

Общее определение

Иллюстрация разницы в различиях.png

Разница в различиях требует данных, измеренных для экспериментальной группы и контрольной группы в два или более разных периода времени, в частности, по меньшей мере, один период времени до «лечения» и по меньшей мере один период времени после «лечения». В изображенном примере результат в экспериментальной группе представлен линией P, а результат в контрольной группе представлен линией S. Исходная (зависимая) переменная в обеих группах измеряется в момент времени 1, до того, как любая группа получили лечение (т.е. независимую или объясняющую переменную), представленное точками п1 и S1. Затем группа лечения получает или подвергается лечению, и обе группы снова измеряются во время 2. Не вся разница между экспериментальной и контрольной группами во время 2 (то есть разница между п2 и S2) можно объяснить как эффект лечения, потому что экспериментальная группа и контрольная группа не начинали в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница которые все еще существовали бы, если бы ни одна из групп не проходила лечение), представленный пунктирной линией Q. (Обратите внимание, что наклон от п1 к Q такой же, как уклон от S1 к S2.) Эффект лечения - это разница между наблюдаемым и «нормальным» исходом (разница между P2 и Q).

Формальное определение

Рассмотрим модель

куда является зависимой переменной для индивидуальный и , группа, к которой принадлежит (т.е. к группе лечения или контрольной группе), и это сокращение для фиктивная переменная равно 1, когда событие, описанное в верно, и 0 в противном случае. В сюжете времени против по группе, является вертикальным пересечением графика для , и временной тренд, разделяемый обеими группами в соответствии с предположением о параллельном тренде (см. Предположения ниже). это лечебный эффект, и это остаточный срок.

Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:

и предположим для простоты, что и . Обратите внимание, что не случайно; он просто кодирует то, как маркируются группы и периоды. потом

В строгое предположение экзогенности тогда следует, что

Не теряя общий смысл, предположить, что группа лечения, и это период после, то и , давая оценку DID

что можно интерпретировать как лечебный эффект лечения, обозначенный . Ниже показано, как эта оценка может быть прочитана как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, является чрезмерно параметризованной; чтобы исправить это, один из коэффициентов для фиктивных переменных может быть установлен на 0, например, мы можем установить .

Предположения

Иллюстрация предположения о параллельном тренде

Все предположения Модель OLS в равной степени относятся к DID. Кроме того, для DID требуется предположение о параллельном тренде. Предположение о параллельном тренде говорит, что одинаковы в обоих и . Учитывая, что формальное определение выше точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичным. Чтобы повысить вероятность сохранения предположения о параллельном тренде, подход разницы в различиях часто сочетается с соответствие.[4] Это включает в себя «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй до лечения, в результате СЪЕЛ (т. е. ATT: средний эффект лечения для пролеченных) обеспечивает надежную оценку разницы в разнице эффектов лечения. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до обработки предположение о параллельных тенденциях, вероятно, будет верным; и, во-вторых, этот подход снижает зависимость от связанных допущений игнорирования, необходимых для правильного вывода.

Как показано справа, лечебный эффект представляет собой разницу между наблюдаемым значением у и какова ценность у было бы с параллельными тенденциями, если бы не было лечения. Ахиллесова пята DID - это когда что-то другое, кроме лечения, изменяется в одной группе, но не в другой одновременно с лечением, что подразумевает нарушение предположения о параллельном тренде.

Чтобы гарантировать точность оценки DID, предполагается, что состав лиц двух групп со временем не изменится. При использовании модели DID возникают различные проблемы, которые могут повлиять на результаты, например: автокорреляция[5] и Дипы Ashenfelter, должны быть рассмотрены и решены.

Выполнение

Метод DID может быть реализован в соответствии с таблицей ниже, где правая нижняя ячейка - это средство оценки DID.

Разница
+ Изменить

Тот же результат дает проведение регрессионного анализа. Рассмотрим модель OLS

куда фиктивная переменная для периода, равная когда , и фиктивная переменная для членства в группе, равная когда . Составная переменная фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация модели. формальное определениекроме того, оказывается, что средние по группе и периоду в этом разделе относятся к оценкам параметров модели следующим образом

куда обозначает условные средние, вычисленные по выборке, например, - показатель последующего периода, - показатель для контрольной группы. Чтобы увидеть связь между этим обозначением и предыдущим разделом, рассмотрите, как указано выше, только одно наблюдение за период времени для каждой группы, затем

и так далее для других значений и , что эквивалентно

Но это выражение для лечебного эффекта, которое было дано в формальное определение и в приведенной выше таблице.

Кард и Крюгер (1994) пример

Рассмотрим одно из самых известных исследований DID - Карта и Крюгер статья о минимальная заработная плата в Нью-Джерси, опубликовано в 1994 году.[6] Кард и Крюгер сравнили занятость в быстрое питание сектор в Нью-Джерси и в Пенсильванияв феврале 1992 г. и в ноябре 1992 г., после того как минимальная заработная плата в Нью-Джерси выросла с 4,25 долл. до 5,05 долл. в апреле 1992 г. Наблюдение за изменением занятости только в Нью-Джерси до и после лечения не позволило бы контролировать пропущенные переменные такие как погодные и макроэкономические условия региона. Путем включения Пенсильвании в качестве элемента управления в модель разницы в различиях любое смещение, вызванное переменными, общими для Нью-Джерси и Пенсильвании, неявно контролируется, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции во времени, изменение занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не повысили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к сокращению занятости в Нью-Джерси, вопреки предположениям упрощенной экономической теории. В таблице ниже приведены оценки Card & Krueger воздействия лечения на занятость, измеренные как FTE (или эквиваленты полной занятости). Кард и Крюгер подсчитали, что повышение минимальной заработной платы на $ 0,80 в Нью-Джерси привело к увеличению занятости на 2,75 евро.

Нью-ДжерсиПенсильванияРазница
Февраль20.4423.33−2.89
Ноябрь21.0321.17−0.14
+ Изменить0.59−2.162.75

Смотрите также

Рекомендации

  1. ^ Абади, А. (2005). «Полупараметрические оценщики разности разностей». Обзор экономических исследований. 72 (1): 1–19. CiteSeerX 10.1.1.470.1475. Дои:10.1111/0034-6527.00321.
  2. ^ Бертран, М .; Дюфло, Э.; Муллайнатан, С. (2004). "Насколько мы должны доверять оценкам разницы в различиях?" (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.
  3. ^ Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN 978-0-691-12034-8.
  4. ^ Басу, Паллави; Маленький, Дилан (2020). «Создание более согласованной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующее с групповым предубеждением» (PDF). Наблюдательные исследования. 6: 103–130.
  5. ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько мы должны доверять оценкам разницы в различиях?» (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.
  6. ^ Карточка, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор. 84 (4): 772–793. JSTOR 2118030.

дальнейшее чтение

внешняя ссылка