Data Lemmatization과 Stemming은 활용목적이 다를 수 있다. Lemmatization vs. Stemming 1. 정확성 vs. 단순화 * Lemmatization: 더 정교하고 정확한 방법입니다.
Data 패널데이터 분석에서 개체와 시간을 변동하기 위한 TwoWay Fixed Effect, Interactive Fixed Effects Two-Way Fixed Effects Definition * 두 가지 고정 효과(Two-Way Fixed Effects) 모델은
Data 정규분포 분산의 사전분포로 활용되는 Inverse Chi-Square 분포 정의 * Inverse Chi-Square 분포는 주로 베이지안 통계에서 분산을 모델링하는 데 사용되는 확률
Data Author Topic Modeling, 저자 - 주제 관계를 포함한 토픽모델링 Author Topic Modeling * **Author Topic Model(ATM)**은 텍스트 데이터에서 주제와 저자
Data 다항분포의 사전분포로 사용되는 다변량 확률분포, Dirichlet 분포 정의 * Dirichlet 분포는 다항 분포의 사전 분포로서 사용되는 다변량 확률 분포입니다. * 각
Data Pydantic, 데이터 서빙시, Interface Data Validation 관련 라이브러리 Motivation * Pydantic은 Validation Check를 위한 라이브러리로, 잘못된 데이터가 시스템에서 유입되고 운용되는 것을
Data 여러 분포를 결합하여 데이터의 분포를 모델링하는 Mixture Model Mixture Model is * Mixture Model은 여러개의 분포를 결합하여 데이터의 전체 분포를 모델링함
Data 학습시 "존재"하는 고유범주값을 고유정수값으로 치환하는 Label Encoder Background * 가게별로 예측치를 제공할 때 가게에 대한 식별자를 어떻게 전달할 것인가에 대해서