Instrument Variable

Going Around Omitted Variable

Background

  • Omitted Variable Bais를 Control 하기 위해서 가장 쉬운 방법은 Omitted Variable을 식에 추가하면 된다.하지만 데이터가 없으면 더할 수도 없다.
  • 아니면, Wage에 대한 Education의 Effect를 볼 때, Ability값을 일정한 레벨로 유지하는 방법도 있다.이 때는 회귀모델에 Ability를 넣고 계산하면 된다.
    • 그런데 Ability를 측정하기 위한 방법을 고민해야 한다. → IQ?

Instrument Variable

  • Instrument Variable(IV)는 Treatment를 통해서 Outcome에 영향을 미치는 변수이다.

    • Instrument Variable $Z_i$ is uncorelated with $Y_0$, but it is correlated with $T$ → a.k.a "exclusion restriction"
  • $Y_i = \beta_0 + \kappa \ T_i + \pmb{\beta}W_i + u_i$ 식이지만,

    • $W$ 관련 데이터가 없기 때문에 실제 식은 $Y_i = \beta_0 + \kappa\ T_i + v_i$이고 $v_i = \pmb{\beta}W_i + u_i$로 $W$에 관한 값을 가지고 있을 것이다.
    • 따라서 $W$는 Confounder이기 때문에 $Cov(T,v) \neq 0$일 것이다.
    • A confounder (also confounding variable, confounding factor, extraneous determinant or lurking variable) is a variable that influences both the dependent variable and independent variable, causing a spurious association.
    • 이 상황에서 그냥 계산하면 $\kappa$는 Biased Estimator일 것이다.
  • 이 때 Instrument Variable을 활용해야 한다. Instirument Variable(IV)는 $Cov(Z,v) = 0$여야 한다.

  • 안그러면 Z -> W -> Y로의 Second path가 다음과 같이 있을 것이다.

  • $Cov(Z,Y) = Cov(Z,\beta_0 + \kappa\ T_i + v_i) = \kappa Cov(Z,T) + Cov(Z, v) = \kappa Cov(Z,T)$

    • 참고) $Cox(X,Y+Z) = Cov(X,Y) + Cov(X,Z)$
  • 이 식을 $V(Z_i)$으로 나누면 $\kappa = \dfrac{Cov(Y_i, Z_i)/V(Z_i)}{Cov(T_i, Z_i)/V(Z_i)} = \dfrac{\text{Reduced Form}}{\text{1st Stage}}$

    • 분자 분모 모두 Regression Coefficient
      • $Y=\beta_{1} X + \beta_0$, 일때 $\hat{\beta_1} = {S_{xy} \over S_{xx}}$
      • $Var(Z_i) = (Z_i - \bar{Z})^2$
    • 분자: The result from the regression of Y on Z
      • only capturing how big is this effect of Z on Y through T.
      • the reduced form coefficient
    • 분모: regression of T on Z A.K.A. 1st Stage Coefficient
  • $\kappa = \dfrac{\frac{\partial y}{\partial z}}{\frac{\partial T}{\partial z}} = \dfrac{\partial y}{\partial z} * \dfrac{\partial z}{\partial T} = \dfrac{\partial y}{\partial T}$

    • Scale을 동일하게 맞췄을 때, Y에 대한 T의 Impact는, Y에 대한 Z의 Impact와 동일하다.
  • Confounder 때문에 T가 Y에게 주는 Impact는 파악하기 어려울 수 있지만, Z가 Y에게 주는 효과를 구할 수 있으니, 이 것을 구한 다음에 T에 대한 Z가 주는 효과로 Normalizing 해주면 간접적으로 우리는 T가 Y에 대해 주는 Impact를 구할 수 있게 된다.

  • When the instrument is a dummy variable.

    • $\kappa = \dfrac{E[Y|Z=1]-E[Y|Z=0]}{E[T|Z=1]-E[T|Z=0]}$ → Wald Estimator

References