회사의 비전부터 개인의 경력까지

최근 들어 팀장으로서 거대한 하나의 사이클을 그리고 있다. 업무계획 및 평가, 그리고 승진까지 하나의 사이클이다. 현재는 이러한 일련의 평가를 한데 묶어서 경력관리라는 이름으로 정리하고 있다.

데이터는 회사에서 흐르는 물과도 같은 것이기 때문에 중요하다고 말하지만, 반대로 말하면 물과 같기 때문에 사라지기 전에는 그 중요함을 모르고, 데이터 기반의 사업이라고 한들 데이터를 다루는 조직은 항상 가장 뒷단에 있는 경우가 흔한 편이다. 이 부분은 비단 데이터가 아니더라도 실무 조직이 모두 그렇다.

그래서 데이터 조직은 비즈니스와 거리가 있고 자연스럽게 회사의 비전과도 거리가 생긴다. 정보의 불균형에서 오는 이해도의 차이도 있고 말이다. 하지만 나는 비전을 이해하는 것이 실무로서 매우 중요하다고 생각한다.

자연스럽게 회사에서 어떤 커리어를 가져갈지 결정할 수 있고, 본인이 이 회사에서 남는게 중요한지도 판단할 수 있기 때문이다.  그래서 사회 초년생을 멘토링할 때는 회사의 비전의 중요성을 항상 이야기한다.  회사의 비전을 고객관점에서 해석해서 이해하고 그 비전에서 자신의 상위 조직이 할 수 있는 역할을 이해한 뒤, 그 역할에서 자신이 잘할 수 있는 부분을 찾아야 한다.

그리고 그 부분의  as-is와 to-be간의 간격을 확인하고, 이 부분을 채우기 위한 방안들, 그리고 그 방안의 기대결과를 세우면 자신의 업무계획이 될 것이다.  그리고 그 업무계획은 자연스럽게 자신의 평가 결과물로 이어진다. 스토리는 다음과 같은 구조를 갖출 필요가 있다.

  1. 현황
  2. 원인
  3. 해결방안
  4. 기대효과
  5. 이슈 및 요청사항

이렇게 관리할 수 있다면 회사의 거대한 스토리가 나의 스토리의 일부가 된다. 이 때 중요한 것은 회사의 거대한 스토리와 나의 스토리를 동일시하면 안된다. 내 스토리에 회사의 스토리는 일부일 뿐이다. 도구로서 계약을 맺은 것이라고 보면 되는 것이다.

이러한 흐름을 이해하지 못하면 하는 업무부터 경력관리까지 모두 따로 놀게 될 수가 있으니, 이만큼 피곤한 게 없다. 최대한 연결을 지어야 한다.

Read more

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할 때 발생합니다. 즉, 한 독립 변수가 다른 독립 변수에 의해 설명될 수 있을 정도로 상관관계가 높은 상황을 의미합니다. * 이 문제는 주로 회귀 분석에서 나타나며, 변수들 간의 관계를 해석하는 데 있어 큰 장애물이 될 수 있습니다. * 일반적인 회귀식을 $Y=

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다.

Bayesian P- Value * Bayesian P-Value는 **모델의 적합도(goodness-of-fit)**를 평가하는 데 사용됩니다. * 사후 분포(posterior distribution)를 이용하여 실제 데이터와 모델이 생성한 예상 데이터를 비교함으로써, 관측된 데이터가 모델에 의해 얼마나 잘 설명되는지를 평가합니다. * 빈도주의 p-값은 "관찰된 데이터보다 극단적인 데이터가 나올 확률"을 계산하지만, Bayesian P-Value는 "모델이 실제

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다.

Non Identifiability * Non-Identifiability는 주어진 데이터와 모델에 대해 특정 파라미터를 고유하게 식별할 수 없는 상황을 의미합니다. 즉, 여러 파라미터 값들이 동일한 데이터를 생성할 수 있으며, 이로 인해 특정 파라미터 값을 확정적으로 추정하기 어렵게 됩니다. * 베이지안 추론에서 Non-Identifiability는 사후 분포가 특정 파라미터 값에 대해 명확하게 수렴하지 않고, 여러 값들에 대해 비슷한 확률을

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram은 큰 분산을 갖거나 비정규 형태의 데이터를 위한 히스토그램입니다.

Rootgram * 히스토그램의 변형으로 데이터가 비정규적이거나 큰 분산을 가지는 경우, 정확한 분포를 파악하기 위해 사용됩니다. * 일반적으로 히스토그램은 데이터의 빈도를 직접적으로 나타내기 때문에, 큰 값이 빈번하게 발생하는 경우 상대적으로 작은 값을 잘 드러내지 못하는 경향이 있습니다. 반면, Rootgram은 빈도를 제곱근 형태로 변환하여, 데이터 분포의 차이를 더 잘 시각화할 수 있도록 돕습니다 * 여기서