Data 두 포인트간의 유사도를 찾는데 사용되는 Kernel Function Definition * **커널 함수(Kernel Function)**는 기계 학습과 통계에서 사용되는 함수로, 두
Data Double ML과 DR Learner는 ML 기반 인과추론 방법론이다. Double ML: Residual on Residual Regression + Cross-Fitting * 통제 변수를 조정하여 잔차 회귀(
Data A/B테스트 진행시 체크해야 하는 이슈 중 하나인 SRM Definition * **Sample Ratio Mismatch(SRM)**는 실험 설계나 데이터 수집 과정에서 샘플의
Data 📦그래프의 특정 하위 그래프를 추출하는 알고리즘, K-Core Definition * K-Core 알고리즘은 그래프 이론에서 사용되는 알고리즘으로, 그래프의 특정 부분을 추출하는 데
Data Lemmatization과 Stemming은 활용목적이 다를 수 있다. Lemmatization vs. Stemming 1. 정확성 vs. 단순화 * Lemmatization: 더 정교하고 정확한 방법입니다.
Data 패널데이터 분석에서 개체와 시간을 변동하기 위한 TwoWay Fixed Effect, Interactive Fixed Effects Two-Way Fixed Effects Definition * 두 가지 고정 효과(Two-Way Fixed Effects) 모델은
Data 정규분포 분산의 사전분포로 활용되는 Inverse Chi-Square 분포 정의 * Inverse Chi-Square 분포는 주로 베이지안 통계에서 분산을 모델링하는 데 사용되는 확률
Data Author Topic Modeling, 저자 - 주제 관계를 포함한 토픽모델링 Author Topic Modeling * **Author Topic Model(ATM)**은 텍스트 데이터에서 주제와 저자
Data 다항분포의 사전분포로 사용되는 다변량 확률분포, Dirichlet 분포 정의 * Dirichlet 분포는 다항 분포의 사전 분포로서 사용되는 다변량 확률 분포입니다. * 각