LIME 구현방식 요약

Caution

LIME 관련 설명이 쉽게 되어 있는 글이 있어서 필요한 부분만 발췌하여 정리해놓는다. 출처는 하단에 남겨놓았았다.

LIME의 특성

  • LIME은 특정 모델에 대해서 전역적인 설명을 제공하지 않는다. 즉 각 인스턴스별로는 모델에 대한 설명을 각각 제공한다. 이는 특정 결정이나 결과에 가장 정확한 설명을 제공할 수 있음을 말한다.

작동방식

  • 특정 인스턴스를 살짝 변형(일부 데이터를 Masking하거나)하여 또 다른 인스턴스를 만든다.(Permutation) 이 때 해당 인스턴스와 기존 인스턴스에 대해서는 통계적인 거리나 유사도를 통해 관계를 설명할 수 있다.(예: Euclidian 거리 계산 방식)

  • 이후 기존에 훈련된 모델을 통해서 변형된 인스턴스를 Input으로 Prediction을 진행한다.

  • 마지막으로 중요하다고 판단되는 변수들을 이용해서 예측치와 변형된 인스턴스에 대한 간단한 모델(여기서는 선형모델)을 적합한다. 이 때 앞서 계산했던 거리, 유사도는 해당 모델에서 가중치로 사용된다 이렇게 하면 원본 데이터와 가까운 형태의 데이터에 적합한 모델이 만들어지게 된다.

    • 변수는 보통 5~10개 정도 선택하게 되고, 전진선택법을 적용한 회귀를 통해서 선정하거나, 의의사결정 트리를 사용할 수 있다.

확인이 필요한 부분

  • 간단한 모델 적합시 가중치를 부여하기 위해서 Lasso를 사용한다고 하는데 해당 부분에 대해서 확인할 필요 있음.

 

참고 사이트:  Looking beyond accuracy to improve trust in machine learning

Site Footer

Sliding Sidebar