Difference in Difference

쟤는 키가 저렇게 컸는데 난 왜 이러지? - 사춘기 소녀 멘토링(상큼발랄 블링걸스) 中

Why Difference in Difference?

  • Online Marketing → Effectiveness 측정이 쉽다.
  • Offline Marketing(billboard or TV Campaign) → 측정이 어렵다.
  • Difference in Difference(Diff in Diff or DiD) → Macro interventions의 Effect를 측정

DiD Estimator

  • $\hat{ATET} = E[Y_1(1) - Y_0(1) | D=1]$
    • $Y_0(1)$은 Counterfactual
  • $\hat{ATET} = E[Y(1)| D=1] - E[Y(1) | D=0]$으로 치환
    • $E[Y_0(1) | D=1] = E[Y_1(0) | D=1] + (E|Y_0(1)|D=01] - E[Y_0(0)|D=0])$
      • Treatment 이전 시점 수치에서 Control Group의 T=0대비 T=1시점 상승한 수치를 빼는 형태
  • 재정리하면 다음과 같다
    • $\hat{ATET} =(E[Y(1)|D=1] - E[Y(1)|D=0]) - (E[Y(0)|D=1] - E[Y(0)|D=0]) $
  • 회귀식으로 풀면 다음과 같이 볼 수 있다.
    • $Y_i = \beta_{0} + \beta_{1}I_i + \beta{2}T_i + \beta_{3}I_i*T_i + e_i$
    • 이 때 $\beta_{3}$이 DiD estimator로 볼 수 있다.
    • $\beta_{0}$은 Control Group의 Baseline
    • $\beta_{0} + \beta_{1}$은 Treatment Group의 Baseline
    • $\beta_{0} + \beta_{2}$은 Control Group의 Intervention Period 이후 수치를 보기 위한 부분
    • $\beta_{2}$ Control Group의 Trend에 따른 증가수치

Parallel Trend Assumption

  • Control Group과 Treatment Group이 동일한 Trend를 가지고 있어야 한다.
  • 하지만 그렇지 않은 경우들이 있다.
    • Rnadom Data가 아닌경우 → Treatment Group 결정시 예상반응율에 기반해서 했다든가, 또는 그 반대일 경우
    • Group간 Trend가 완연히 다르게 나타나는 경우

Alternatives

References