[데이터조직]사업과 프로덕트가 시간을 이해하는 방식은 다를 수 있다.

사업이 처한 상황에 따라 다를 것이다. 다만 일반적으로 사업은 경쟁이 심해지면 기존의 업무 사이클에 덧붙여 더 많은 대안을 강구해내가기 시작한다. 이러한 상황을 여러차례 겪다보면 프로덕트와  사업은 서로 Due Date에 대해서 싱크를 못 맞추는 경우를 종종 보곤 한다.

사업은 왜 이렇게 하나의 액션을 취하려고 해도, 2주에서 한달을 기다려야 하는지 이해하지 못하고, 프로덕트는 적절한 검증 없이 너무 요구만 하는 사업을 이해하지 못한다. 리더로서 중간자에 위치해서 일을 조율하다 보면 양측의 이해관계를 조율하는데 가장 많이 심력이 소모되곤 한다.

왜 그럴까?를 생각하다 보니, 문득 사업과 프로덕트는 생각하는 시간의 단위가 다를 수 있겠다는 생각이 들었다. 일반적으로 시간을 바라볼 때 우리는 계획의 시작과 끝을 설정하기 위해서 시간을 나누어서 바라본다.

이 때 사업은 일,주,월,분기,반기,연간 등의 간격을 갖고 업무를 전개하는 편이다. 관리측면의 용이함도 있고, 일반적으로 고객과 커뮤니케이션 하기에도 적절하기 때문이다. 이에 반해서 프로덕트는 이보다 더 단위가 깊은 편이다. 프로덕트 이슈로 서비스가 정지하는 것자체가 말이 안되기 때문이다.

점차 서비스의 수준이 상향평준화되고, 고객 경험 관련 한끝 차이로 경쟁에서 이기고 지는 것이 결정되고 이는 시장점유율로 이어지는 세상이다. 자연스럽게 서비스 중단은 매우 중대한 이슈로 간주되기 때문에 MSA(MicroService Architecture) 등이 등장하게 되었다. 프로덕트를 개발하는 입장에서는 사업에서 바라보는 가장 짧은 "일"단위보다 더 깊게 들어가 매초, 매분 중단되지 않도록 모든 조건을 강구할 수 밖에 없다.

이렇게 다른 시간단위는 보다 앞서 다양한 상황을 고민할 수 밖에 없도록 프로덕트에게 요구하는데, 이런 상황을 사업에서 이해하는 경우는 그리 많이 보지 않았다. 이러한 이슈들을 단기적으로는 "기술부채" 등을 통해서 커버하면서 비즈니스 목표를 달성하고 있지만 분명 한계가 있는 법이다. 프로덕트 리더는 기술부채를 보다 사업팀이 이해할 수 있는 용어로 바꿔서 관리를 하는 것뿐만 아니라, 바라보는 시간관점에 대해서도 사업팀에게 설득해야 하는 것이다.

더 슬픈 것은 이런 상황을 사업에서 본질적으로 이해하는 경우는 그리 많이 보지 않았다. 아니, 직무 고하여부와 상관없이 이해하지 못하는 사람은 꼭 있었고, 이를 이해시키는 것은 생각보다 쉽지 않았다. 특히나 고위직로 갈수록 공감능력이 떨어진다는 연구 결과가 말하는 바(HBR Link)를 볼 때 이는 꽤나 특정한 사람들만 앓고 있는 이슈는 아닌 듯하니, 정말 생각하는 시간단위가 다르구나 라는 생각에 확신이 더해졌다.

점차 기업의 수명이 짧아지고, 살아남기 위해 더 빠른 개선을 요구하는 현실이 더 일반적이 되어질텐데, 이 상황을 대응하기 위해서 마냥, 더 빠르게 일하고, 더 많은 커뮤니케이션 비용을 들이는 것이 맞는지는 모르겠다. 이 수준보다는 리더 개개인의 능력 이상으로 무언가가 조직차원의 변화가 더 필요할 수도 있겠다는 생각이 들었다.

돌려 말하면 "사업과 프로덕트의 시간은 다르다는 것"을 인지하고 움직이는 리더의 능력은 꽤 특별할 수 도 있겠다는 역발상을 한 번 해보면서 이 글을 마무리 해본다.(깊게 들어가기에는 더 고민이 필요한 주제이니...)

Read more

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할 때 발생합니다. 즉, 한 독립 변수가 다른 독립 변수에 의해 설명될 수 있을 정도로 상관관계가 높은 상황을 의미합니다. * 이 문제는 주로 회귀 분석에서 나타나며, 변수들 간의 관계를 해석하는 데 있어 큰 장애물이 될 수 있습니다. * 일반적인 회귀식을 $Y=

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P- Value * Bayesian P-Value는 **모델의 적합도(goodness-of-fit)**를 평가하는 데 사용됩니다. * 사후 분포(posterior distribution)를 이용하여 실제 데이터와 모델이 생성한 예상 데이터를 비교함으로써, 관측된 데이터가 모델에 의해 얼마나 잘 설명되는지를 평가합니다. * 빈도주의 p-값은 "관찰된 데이터보다 극단적인 데이터가 나올 확률"을 계산하지만, Bayesian P-Value는 "모델이 실제

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non Identifiability * Non-Identifiability는 주어진 데이터와 모델에 대해 특정 파라미터를 고유하게 식별할 수 없는 상황을 의미합니다. 즉, 여러 파라미터 값들이 동일한 데이터를 생성할 수 있으며, 이로 인해 특정 파라미터 값을 확정적으로 추정하기 어렵게 됩니다. * 베이지안 추론에서 Non-Identifiability는 사후 분포가 특정 파라미터 값에 대해 명확하게 수렴하지 않고, 여러 값들에 대해 비슷한 확률을

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram * 히스토그램의 변형으로 데이터가 비정규적이거나 큰 분산을 가지는 경우, 정확한 분포를 파악하기 위해 사용됩니다. * 일반적으로 히스토그램은 데이터의 빈도를 직접적으로 나타내기 때문에, 큰 값이 빈번하게 발생하는 경우 상대적으로 작은 값을 잘 드러내지 못하는 경향이 있습니다. 반면, Rootgram은 빈도를 제곱근 형태로 변환하여, 데이터 분포의 차이를 더 잘 시각화할 수 있도록 돕습니다 * 여기서