데이터 모델로서 MVP(Minimum Viable Product)는 어떤 모습이어야 할까
데이터 모델로서 MVP(Minimum Viable Product)는 어떤 모습이어야 할까? MVP 자체가 프로덕트를 포함한 단어이기 때문에 데이터 모델이란 단어보다는 데이터 프로덕트라는 표현으로 접근하는게 더 좋지 않을까 생각한다.
MVP로서 데이터 프로덕트라고 한들 아주 다르지는 않을 것이라고 생각한다. 린스타트업의 저자 에릭 리스(Eric Ries)는 MVP(최소기능제품)은 결국 제품이 제공하는 핵심여량과 사용자의 니즈가 맞아 떨어지는지 정도를 보기 위한 제품이라고 설명하였다.
그렇다고 하면 데이터 프로덕트 내의 모델은 프로덕트 내에서 기대하는, 고객의 니즈와 연결된 최소한의 결과를 제공할 수 있어야 한다. 이 부분을 확인하기 위해서는 비즈니스에서 최종 도출하고자 하는 목표와 측정 방식을 파악할 필요가 있다.
여기까지 확인하면 모델에서 원하는 아웃풋을 우선은 확인할 수가 있게 된다. 그리고 나아가 이 결과치의 정확성에 대한 참을성(Tolerance)를 파악할 수 있다. 이 시점에 모델에게 어느 정도 기대하고 지속적인 개선을 하기 위한 첫 시발점으로 Evaluation을 얼마나 빡세게 해야 하는지 결정되는 것이다. 지표에 대해서는 모델의 성과와 비즈니스가 충분히 연결될 수 있도록 지표에 대해 명확하게 설정하기 위한 노력이 필요하다.
여기까지가 모델의 결과물을 확인하는 부분이 된다고 하면, 이 것만큼 중요한 것이 이제 실제 활용하는 시점이다. 그 시점에 따라 활용할 수 있는 데이터의 제약이 발생하고, 트래픽 등, 모델의 복잡도를 결정할 수 있는 데이터가 떨어져 나오게 된다. 앞에 비즈니스 내용만 듣다 보면 정확도를 높여야 할 것 같다가도, 활용시점을 보면 정확성을 일부 포기하고 실제 Real World를 안정적인 상태로 유지하기 위한 운영의 지원이 필요하게 될 수도 있다.
이 시점에 모델러로서의 전문성이 발휘되어야 할 필요가 있겠다. 트래픽에 대한 부분은 모델 개발 이전에도 어느정도는 어림짐작해볼 수 있겠지만, 아무래도 최소 요건에 만족하는 모델의 경우 대략 기본적으로 구성 이후에 테스트도 가능하다. MVP답게 빠르게 속도전으로 개발하는 것이다. 그리고 이후 스프린트를 구성해서 개선해야 한다.
정리하면 다음과 같다. 비즈니스에서 주는 요건을 기반으로 모델의 나아가야할 방향, 목표, 그리고 대략의 뼈대를 잡는다면 실제 모델은 활용시점을 통해서 복잡도를 가늠할 필요가 있다. 생각이 바뀔 수 있겠지만, 지금 이 시점에 고민해본 내용은 다음과 같다.