Bayesian Modeling이 사회과학연구에 활용하면 좋은 6가지 이유

Coherence

  • 주관적 확률이 확률 계산의 일반적인 규칙/공리(이러한 규칙의 타당성은 방금 언급한 자기 일관성에 해당함)를 따르고 따라서 이러한 확률로부터 일관된 결정을 얻을 수 있다는 가정

Conditioning on Observed Data

  • 베이지안 통계학과 빈도주의 통계학 사이의 중요한 차이점은 관측 데이터가 매개변수 추정에서 수행하는 역할에 관한 것
  • 구체적으로, 빈도주의 추론은 정확히 동일한 조건에서 동일한 실험 또는 관찰을 (무한히) 반복적으로 샘플링할 때 추정자의 행동에 대한 일련의 사전 실험/관찰 가정을 기반로 함
  • Bayesian은 실제 데이터 수집 이전에 있던 가정에 사후분포를 의지하기 보다는 정말 데이터 그자체에 깁반해서 추정한다.

Quantifying Evidence

  • p값 가설과 관련된 모순은 '증거'가 정의되는 방식에서 비롯됨
  • 특히, 베이지안 관점에서는 제안된 가설에 확률을 할당하는 것이 베이지안 가설 테스트의 방향이기 때문에 p값 가설을 거부함 두 가지 가설이 있을 때 이 가설에 사전 확률을 할당하고 사후 확률이 더 높은 가설을 받아들인다.

Validity

  • Gigerenzer 등(2004)은 베이지안 통계가 분석가가 실제로 관심을 갖는 인과관계를 제공한다고 주장함
    • p-값을 귀무 가설에 대한 증거의 강도로 해석하는 피셔의 프레임워크는 모두 이러한 바람을 배제합니다.
    • 그러나 베이지안 프레임워크는 실제로 고려 중인 과학적 가설에 대한 확률 평가를 제공하기 때문에 분석가의 바람은 실현될 수 있음 → 실제로 관심 있는 매개변수의 사후 분포에 접근하면 연구 결과를 "유의미" 또는 "유의미하지 않음"으로 비교적 인위적으로 이분화하는 것보다 관심 있는 연구 질문에 대해 훨씬 더 풍부하고 상세한 설명을 제공할 수 있음

Flexibility in Handling Complex Data Structure

  • Bayesian Hierarchical Model은 복잡한 데이터에 대해서 유연한 접근을 할 수 있게 해주고 데이터 양이 적은 연구도 충분히 가능함.

Formally Quantifying Uncertainty

  • 베이지안은 모델 매개변수와 모델 자체에 대한 불확실성을 정량화할 수 있는 방법을 제시함
  • 사전분포를 이용해서 사전 지식을 통합할 수 있고, 매개변수와 모델에 대한 불확실성을 모두 평가할 수 있음

Reference