[Thesis]How to project Customer Retention

작년 이 맘때쯤 고객의 LTV를 간단하게 계산하여 유관부서에 배포한 적이 있다. 원래대로라면 고객의 잔존율을 알아야 하고 이익 및 비용에 대한 명확한 계산이 필요하다. 테크니들 편집장이셨던 성문님 블로그(링크)에서 LTV에 대한 공식을 찾아볼 수 있다.

고객 생애 가치(CLV) = (첫 해에 고객이 가져다 준 이익의 총합) – (신규 고객 유치에 들어간 비용)
+ (둘째 해에 고객이 남아 있을 확률) * ((둘째 해에 고객이 가져다 준 이익의 총합) – (고객 유지에 들어간 비용))
+ (셋째 해에 고객이 남아 있을 확률) * ((셋째 해에 고객이 가져다 준 이익의 총합) – (고객 유지에 들어간 비용))
+ …

원래대로라면 저렇게 구해야 하는데 여건 상 구하기 어려워 매우 쉽게 구해서 적용했던 아쉬움이 있다. 그러던 차에 NC Soft DANBI 블로그에서 LTV를 구하는 과정을 담은 글(링크)을 보았다. 그리고 해당 글에 잔존율 관련 와튼스쿨에서 작성한 아티클(링크)이 있어서 읽게 되었다. 이익의 총합이나 비용은 현 비즈니스 모델상 산출하기 어렵다 해도 잔존율은 지속해서 관리할 수 있기 때문에 관리 지표로 유의미하다고 생각하였기 때문이다. 

엑셀로도 충분히 수행할 수 있다는 점, 그리고 몇몇 제약 조건이 있지만 커머스 쪽에는 적용이 가능하여 이 곳에 정리하여 놓는다.

해당 모델은 회원의 이탈 확률 베타 분포를 따른다는 가정 후 시점 t에서 유저의 이탈 확률과 생존 확률을 추정한다. 

참고로 베타분포는 두 매개변수 α,β에 따라 [0,1] 구간에서 정의되는 연속 확률 분포들의 가족으로 에 따라서 다음 그림과 같이 분포의 모양이 바뀐다.(참고)

이 때 사용되는 회원의 이탈확률과 잔존확률은 다음과 같으며, 시점 t 에서의 회원의 잔존 확률을 이용하면 시점 t에서의 유저의 잔존 확률 r(t)를 구한다.

 이 때 α,β는 MLE(Maximum Likelihood Estimation)을 통해 추정한다. 추정된 α,β를 바탕으로 회원의 모든 시점의 생존 확률을 계산하여 잔존함수로 사용한다.

참고로 MLE, 우리말로 최대가능도 추정법을 잘 모른다면 이 영상을 추천한다.

처음 읽었을 때는 설명이 다소 이해되지 않았는데 Appendix에 있는 엑셀실습 내용을 보니 대체로 이해가 되었다. 

참고

Site Footer

Sliding Sidebar