Data Monotonic Constraint는 Prediction에 영향을 주지 않는 제약조건이다. * +1: when the feature increases, the prediction must be greater or equal;
Data Conformalized Quantile Regression은 예측 불확실성을 정량화한다. CQR is * **Conformalized Quantile Regression(CQR)**은 예측 불확실성을 정량화하기 위해 개발된
Statistics Zero Inflated Negative Binomial Model은 0이 과도하게 많은 데이터에 유용하다. Motivation * **Zero-Inflated Negative Binomial Model(ZINB)**은 데이터셋에서 0 값이 과도하게 나타나는
A/B Test 탐험과 활용의 균형을 맞추기 위한 알고리즘, 톰슨샘플링 톰슨 샘플링이란? * 톰슨 샘플링(Thompson Sampling)은 멀티 암드 밴딧 문제(Multi-Armed
Data SeedFinder는 실험 전 편향을 제거하기 위한 방법 중 하나입니다. SeedFinder * 편향을 최소화하기 위해 "SeedFinder" 방식에서 가장 적은 편향을 가진
Data Chi-Square Test와 T-Test는 데이터 특성에 따라 선택하여 사용합니다. Chi-Square Test가 A/B/C Test에서 사용되는 구체적인 경우 * 범주형 데이터 분석:
Data BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다. 1. BG/NBD 모델이란? * BG/NBD(Beta-Geometric/Negative Binomial Distribution) 모델은 **고객의
Data 다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다. 다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할
Data Bayesian P-Value는 불확실성을 감안하여 모델의 적합도를 평가합니다. Bayesian P- Value * Bayesian P-Value는 **모델의 적합도(goodness-of-fit)**를 평가하는 데 사용됩니다.
Data Non-Identifiability는 Model Parameter를 고유하게 식별할 수 없는 현상입니다. Non Identifiability * Non-Identifiability는 주어진 데이터와 모델에 대해 특정 파라미터를 고유하게 식별할 수