Positivity Assumption Positivity Assumption * Formal 하게 말하면 관심 있는 모든 계층 및 노출 수준에 대해서 공변량을 조건부로 하였을 때 특정 수준의 노출이 있을 확률이 0보다 크고 1보다 작아야 한다는 것이 Positivty Assumption * 쉽게 말하면 어떤 두 집단을 비교한다고 할 때, Treatment를 받을 수 있거나, 받지 못할 수 있는, 또는 받게될 표본집단을 반드시
Average Treatment Effect ATE(Average Treatment Effect)는 Treatment와 Control Group을 비교해서 Treatment의 Effect를 정의한 값이다. 이름이 의미하는 것처럼 Individual이 아닌 Group단위로 합한 후 평균 효과를 본다. 개개인의 Counterfactual을 보는 것은 불가능에 가깝기 때문이다. ATE를 수식으로 쓰면 다음과 같다(참고). $$E[Y|T=1] - E[Y|T=0] = \underbrace{E[Y_1
Difference in Difference 쟤는 키가 저렇게 컸는데 난 왜 이러지? - 사춘기 소녀 멘토링(상큼발랄 블링걸스) 中 Why Difference in Difference? * Online Marketing → Effectiveness 측정이 쉽다. * Offline Marketing(billboard or TV Campaign) → 측정이 어렵다. * Difference in Difference(Diff in Diff or DiD) → Macro interventions의 Effect를 측정 DiD Estimator * $\hat{ATET} = E[Y_1(
Instrument Variable Going Around Omitted Variable Background * Omitted Variable Bais를 Control 하기 위해서 가장 쉬운 방법은 Omitted Variable을 식에 추가하면 된다.하지만 데이터가 없으면 더할 수도 없다. * 아니면, Wage에 대한 Education의 Effect를 볼 때, Ability값을 일정한 레벨로 유지하는 방법도 있다.이 때는 회귀모델에 Ability를 넣고 계산하면 된다. * 그런데 Ability를 측정하기 위한 방법을
Randomized Experiments 어떤 사람들은 3루에 태어났지만 자신이 3루타를 쳤다고 생각하면서 인생을 산다 - Barry Switzer Association $\neq$ Causation $$E[Y|T=1] - E[Y|T=0] = \underbrace{E[Y_1 - Y_0|T=1]}_{ATT} + \underbrace{\{ E[Y_0|T=1] - E[Y_0|T=0] \}}_{BIAS}$$ * 위 식에서
담배와 폐암간 오래된 논란에 대해서 담배는 폐암을 유발할까? 1950년 후반, 통계학, 의학계를 둘러싸고 아주 격렬하게 토론이 벌어진 주제가 있었습니다. 바로 "담배는 폐암을 유발하는가?"입니다. 어떤 사람들은 당연히, 담배가 폐암을 유발한다고 말합니다. 하지만 여전히 이 문제는 명확하게 정리가 된 바가 없습니다. 여전히 "크게 관련이 있어보일뿐"이라는 말로 정리가 되고 있을 뿐입니다. 오늘 이 글에서는 이 아직
인과추론(Causal Inference) – Inverse Probability Weight 역확률 가중치(Inverse Probability Weighting) * 모집단에서 일부 데이터가 유실되었을 때(예: Selection Bias) 남은 데이터로 유사 모집단(Pseudo Population)을 생성해서 통계를 계산하는 기법 * 1952년에 제시된 꽤 오래된 기법으로 각 데이터에 데이터가 치료군(Treatment)에 속할 가능성의 역수를 가중치(Weight)로 곱해주는 방식 * 개념만 쉽게 본다고 하면 Propensity Score Matching은