성공하는 프로젝트를 만들기 위한 체크리스트, 프로젝트 설계자

성공하는 프로젝트를 만들기 위한 체크리스트, 프로젝트 설계자
Photo by NEW DATA SERVICES / Unsplash

살면서 우리는 평생 프로젝트를 합니다. 삶을 살아내는 것도 프로젝트라고 할 수 있기 때문입니다. 지금도 저는 다양하게 크고 작은 프로젝트를 하고 있습니다. 어느날과 다름없이 어떤 책을 읽어볼지 두리번 거리던 차에, "아이디어를 현실로 만드는 프로젝트 계획과 실행의 법칙"이라는 광고 문구를 보고 이 책을 구매하였습니다. 사실 절대적인 성공을 보장하는 것은 없음에도 말입니다. 부디 앞의 몇장만 읽고 읽기를 멈추지 않길 바라면서 이 책을 읽어보았습니다. 그나저나 요즘은 많은 책들이 "설계자"라는 단어를 붙이거나 "자"로 끝나는 제목을 채택하는 경우가 있는데 이 책도 그래서 원서를 보니 "How Big Things Get Done"이었습니다. "큰 일을 잘 끝내는 법"이라고 하면 보다 와닿는 느낌이 있었습니다.

이 책을 보면서 과거에 하던 일들에 대해서 생각해보았습니다. 최근 3년간 데이터 과학자로 이루어진 팀과 데이터 과학자 이외에도 데이터 엔지니어, 백엔드 등 다양한 직군으로 구성된 팀을 이끌면서 가장 힘들었던 것은 단연컨대 프로젝트에 관한 것이었습니다. 정확하게 말하면 프로젝트를 기획하는 부분들이었습니다. 프로젝트의 목적과 이를 측정하기 위한 지표는 프로젝트의 일정에 의해서 항상 구체화되지는 못하였기 때문입니다. 중간리더로서 이 부분에 대해서 기술적인 지표와 비즈니스 지표 상의 다리를 놓기 위해 노력하였지만, 그 노력에 들인 시간 역시 다른 업무에 의해 치이기 일쑤였습니다.

훌륭한 기획은 탐구하고, 상상하고, 분석하고, 실험하고, 반복하는 과정을 통해 이루어진다. 여기에는 시간이 필요하다. 그러므로 ‘느림’은 올바른 기획의 자연스러운 산물이지, 그 자체가 목적인 것은 아니다. 훌륭한 기획은 깊이 있고 폭넓은 질문을 던지고, 풍부한 상상력을 발휘하고, 제기된 질문에 정확하게 대답하는 일에서 시작된다. 이 문장에서 내가 ‘질문’이라는 단어를 ‘대답’ 앞에 배열했다는 사실을 주목하라. 대답 이전에 질문이 존재해야 한다는 건 자명한 사실이다. 하지만 안타깝게도 현실에서는 그렇지 못하다. 프로젝트는 종종 질문이 아니라 대답에서부터 시작된다.

물론 기획이 충분히 이루어진 프로젝트도 있었습니다. 저자는 충분한 프로젝트의 기획이 이루어졌을 때 프로젝트의 성공율이 올라감을 건급한 바 있는데, 이런 프로젝트들은 흔히 말하는 엣지케이스(Edge Case)나 이후 진행 방향성에 대해서 그래도 대화를 충분히 나눌 시간이 있었던 것같습니다. 특히나 기존의 프로젝트 데비 데이터 기반 프로젝트는 모델이 가지고 있는 불확실성으로 인해서 프로젝트의 성패를 가늠하기 어려웠던 환경을 감안하면 기획에 기반해서 빠르게 사이클을 돌면서 모델을 개선해나가는 과정이 필요할 수 있었는데, 이 부분에 대해서는 다소 아쉬웠던 것같습니다.

이외에도 저자는 기획을 할 때 다양한 실험을 통해서 기획을 구체화하는 것도 중요하다고 언급했는데 이 부분은 에릭 리스(Eric Ries)가 언급한 린스타트업의 MVP(Minimum Viable Product)와도 다소 유사한 부분이 있습니다. 이 부분도 과거 프로젝트를 돌이켜보면, 많은 일을 해치워나가는 중에 다소 리더로서 더 깊게 고민해야 하는 부분이 아니었나 싶습니다.

이외에도 저자는 고객관점으로 일하는 부분도 언급합니다. 기업이 어느정도 커지게 되면, 배당을 늘리면서 기업이 벌어들인 것에 대해서 환원하기 위해 애씁니다. 하지만 사업이 운영하는데 있어 고객이 없어서는 운영자체가 어려워집니다. 하지만 우리는 이 부분을 쉽게 망각합니다. 고객 입장에서는 회사 내부는 관심이 없는데 말입니다. 저자는 프로젝트도 동일한 관점에서 고민해야 하며, Wokring Backward라는 아마존의 일하는 모습을 예시로 듭니다.

오른쪽에서 왼쪽으로 생각하는 작업이 어려운 이유는 그것이 자연스러운 사고 과정이 아니기 때문이다. 우리에게 더 자연스러운 것은 WYSIATI, 즉 눈앞에 놓여 있는 정보에만 매달리는 것이다. 당신이 문득 떠오른 멋진 아이디어에 집착하거나 프로젝트를 디자인하는 일에 몰두하거나 수많은 세부 사항에 묻혀버리는 순간, 오른쪽 상자는 시야에서 사라진다. 바로 그때부터 문제가 시작된다.

이외에도 그리고 프로젝트 결과 이상으로 홍보하고 싶은 포인트로 새로운 기술 도입에 대한 경종 등을 언급하면서 프로젝트가 성공하기 위해 고려해야하는 케이스와 경험들을 이야기 합니다.

세상에 하나밖에 없는’ 기술을 도입하는 일은 그것이 무엇이든 경종을 울릴 만한 위험한 시도다. 하지만 현실에서는 ‘새로운 것’ 또는 ‘독특한 것’이 피해야 할 대상이 아니라 남들에게 광고할 만한 장점으로 받아들여진다. 이는 기획자와 의사결정자들이 늘 저지르는 실수다. 그리고 많은 프로젝트가 성과를 내지 못하는 주된 이유이기도 하다.

이런 부분을 보다보면, 프로젝트의 본질로 돌아가고 다른 것에 눈이 흐려지지 않는게 제일 중요하구나, 결국 기본으로 돌아가야 한다고 생각합니다. 다양한 프로젝트를 진행하다 보면, 과거의 성공에 빠져서 현재의 상황을 경시하게 됩니다. 나발 라비칸트(Naval Ravikant)마음이 가지고 있던 지식과 생각의 하인이 되어버리는 멍키 마인드(Monkey Mind)에 사로잡혀버리는 것입니다. 지금의 상황에 최대한 충실하고 집중하는 것이 프로젝트설계자로서 성공하는데 핵심이라는 생각이 들었습니다. 이 부분은 벤호로위츠가 "심리관리 기술이 CEO로서 가장 배운 어려운 기술이다"라고 언급한 것과 일맥상통하기도 합니다.

이 책은 시작은 프로젝트 설계자였지만, 뭐랄까 10년이 넘은 사회경험 앞에 스스로를 한 번 더 점검하고 기본으로 돌아가는데 있어 쉽게 읽되 마음에는 진지함을 심어줄 수 있는 그런 책이었습니다.

Read more

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할 때 발생합니다. 즉, 한 독립 변수가 다른 독립 변수에 의해 설명될 수 있을 정도로 상관관계가 높은 상황을 의미합니다. * 이 문제는 주로 회귀 분석에서 나타나며, 변수들 간의 관계를 해석하는 데 있어 큰 장애물이 될 수 있습니다. * 일반적인 회귀식을 $Y=

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P- Value * Bayesian P-Value는 **모델의 적합도(goodness-of-fit)**를 평가하는 데 사용됩니다. * 사후 분포(posterior distribution)를 이용하여 실제 데이터와 모델이 생성한 예상 데이터를 비교함으로써, 관측된 데이터가 모델에 의해 얼마나 잘 설명되는지를 평가합니다. * 빈도주의 p-값은 "관찰된 데이터보다 극단적인 데이터가 나올 확률"을 계산하지만, Bayesian P-Value는 "모델이 실제

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non Identifiability * Non-Identifiability는 주어진 데이터와 모델에 대해 특정 파라미터를 고유하게 식별할 수 없는 상황을 의미합니다. 즉, 여러 파라미터 값들이 동일한 데이터를 생성할 수 있으며, 이로 인해 특정 파라미터 값을 확정적으로 추정하기 어렵게 됩니다. * 베이지안 추론에서 Non-Identifiability는 사후 분포가 특정 파라미터 값에 대해 명확하게 수렴하지 않고, 여러 값들에 대해 비슷한 확률을

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram * 히스토그램의 변형으로 데이터가 비정규적이거나 큰 분산을 가지는 경우, 정확한 분포를 파악하기 위해 사용됩니다. * 일반적으로 히스토그램은 데이터의 빈도를 직접적으로 나타내기 때문에, 큰 값이 빈번하게 발생하는 경우 상대적으로 작은 값을 잘 드러내지 못하는 경향이 있습니다. 반면, Rootgram은 빈도를 제곱근 형태로 변환하여, 데이터 분포의 차이를 더 잘 시각화할 수 있도록 돕습니다 * 여기서