Interpretable Machine Learning – A Brief History, State-of-the-Art and Challenges ?

Abstract

원문

We present a brief history of the field of interpretable machine learning (IML), give an overview of state-of-the-art interpretation methods and discuss challenges. Research in IML has boomed in recent years. As young as the field is, it has over 200 years old roots in regression modeling and rule-based machine learning, starting in the 1960s. Recently, many new IML methods have been proposed, many of them model-agnostic, but also interpretation techniques specific to deep learning and tree-based ensembles. IML methods either directly analyze model components, study sensitivity to input perturbations, or analyze local or global surrogate approximations of the ML model. The field approaches a state of readiness and stability, with many methods not only proposed in research, but also implemented in open-source software. But many important challenges remain for IML, such as dealing with dependent features, causal interpretation, and uncertainty estimation, which need to be resolved for its successful application to scientific problems. A further challenge is a missing rigorous definition of interpretability, which is accepted by the community. To address the challenges and advance the field, we urge to recall our roots of interpretable, data-driven modeling in statistics and (rule-based) ML, but also to consider other areas such as sensitivity analysis, causal inference, and the social sciences.

요약

XAI라는 용어대신 IML(Interpretable Machine Learning)이라고 쓰고 있는데 해당 용어는 서로 바꿔서 사용할 수 있다고 말하고 있다. 이 논문의 목적은 IML에 대한 역사를 리뷰하고 앞으로 해결해야할 과제들을 논하고 있다. XAI를 위해서는 인과추론, 불확실성추정등의 다양한 문제가 남아 있으면 이런 문제가 해결될 때 비로소 IML은 사회에서 엄격한 정의를 갖고 인정받을 수 있다고 말한다. 신기한 것은 저자가 XAI의 발전을 위해서 인과추론, 민감도 분석, 마지막으로 사회과학의 역할을 강조하는데, 특히 어떤 부분에서 사회과학의 역할이 필요한지는 확인해볼 필요가 있다.

# ML Methods
– 1) 모델의 구성요소 2) 모델의 민감도 3) 대체모델을 분석하려는지에 따라 IML은 분류될 수 있다.

모델의 구성요소를 분석

  • 모델의 각 요소를 나눠서 설명할 수 있어야 하는데, 선형회귀나, 의사결정나무 등은 가능
  • 어느 정도 복잡해지면 각 모델 요소를 나눠서 분석하기는 어렵다.

조금더 복잡한 모델을 분석하는 경우

  • CNN 등의 모델에서는 피쳐맵(Feature Map)을 활성화시켜주는 특정 이미지를 찾거나 생성시켜줌으로써 모델을 이해할 수 있다.
  • 랜덤포레스트는 지니지수 등을 이용해서 대략이나마 모델의 구조를 파악할 수 있다.

각각의 예측결과를 설명하는 것

  • 전체의 예측결과와 각각의 예측결과를 설명하는 방식으로 분류할 수 있음
  • 대체로 모델에 영향을 받지 않는 해석방법(Model Agonistic)
  • Shapley, Conterfactual explanation 등이 유명함.
  • Salency map과 같이 특정 모델(CNN)에 특화된 것도 있음.

전체적으로 모델의 패턴을 설명하는 것

  • 예상되는 모델의 결과를 이해하기 위해서 사용됨
  • Feature Importance 모델이 대표적.

대체 모델(Surrogate Model)

  • 기존 모델의 행동 패턴을 복사하도록 디자인된 설명 가능 모델
  • 설명은 대체모델을 이용해서 진행함
  • LIME 등의 모델이 대표적인 모형임

앞으로 해결해야 하는 것.

통계적 불확실성

  • 많은 IML 모형이 설명에 대한 불확실성을 정량화하여 제공하고 있지는 못함.

인과추론

  • 현재 대부분의 모형은 단순히 상관관계를 설명하는 구조로 데이터자체의 근본적인 특성보다는 데이터에서 드러나는 단순한 패턴 등만을 고려해 모델이 구성됨.

피쳐(Feature) 의존성

  • 피쳐간 상관성이 높을 때 문제가 발생할 수 있고 해당 문제는 특히 Permutation 기반 기법에서 문제가 될 수 있음
  • 해결을 위해서 Conditional Permutation Scheme 등이 연구되고 있다.

Footnotes

Interpretable Machine Learning — A Brief History, State-of-the-Art and Challenges

Read more

내가 놓치고 있던 미래, 먼저 온 미래를 읽고

내가 놓치고 있던 미래, 먼저 온 미래를 읽고

장강명 작가의 책은, 유학시절 읽고 처음이었다. 유학시절 "한국이 싫어서"라는 책은 동기부여가 상당히 되는 책이었다. 한국을 떠나 새로운 정채성을 학생으로서 Build up 해나가고 있던 상황에서 이 책은 제목부터 꽤 솔깃하였다. 물론 결말이 기억날 정도로 인상깊은 책은 아니었지만 말이다. 그렇게 시간이 흘러 장강명 작가의 책은 더 이상 읽지 않던

By Bongho, Lee
고객 경험이란 무엇일까?

고객 경험이란 무엇일까?

고객경험이란 무엇일까? 1. 과거 어느 대형 프로젝트에서 있던 일이다. 신사업을 위해서 예측 모델 값을 제공해야 하는 상황이었다. 데이터도 없고,어느정도의 정확도를 제공해야 하는지 답이 없었다. 점추정을 할 것인가? 구간 추정을 할 것인가를 가지고 논의중이었다. Product Manager 줄기차게 고객경험을 내세우며 점추정으로 해야 한다고 주장하였다. 근거는 오롯이 "고객 경험"이었다.

By Bongho, Lee
수요예측, 수정구슬이 아닌 목표를 향한 냉정한 나침반

수요예측, 수정구슬이 아닌 목표를 향한 냉정한 나침반

수요예측의 정의와 비즈니스에서의 중요성 기업의 성장과 운영 효율화를 위해 **수요예측(Demand Forecasting)**은 선택이 아닌 필수 요소로 자리 잡았다. 많은 경영진들이 수요예측을 미래 판매량을 정확히 맞히는 '예언'으로 기대하지만, 이는 수요예측의 본질을 오해하는 것이다. 수요예측의 진짜 의미: 미래를 점치는 수정구슬이 아니라, 우리가 도달해야 할 '목표'를

By Bongho, Lee