Data

📦 AI Model에서 AI System으로의 진화

📦 AI Model에서 AI System으로의 진화

1.Compound AI System is LLM의 대중화와 함께, AI Model은 Application의 주요 요소로써 빠르게 관심을 이끌고 있다. Compound AI System은 Traditional Software와 AI Model의 결합으로써 Google의 AlphaCode 2,  AlphaGeometry 등 빅테크의 LLM 모델은 Compound AI System의 효과성을 잘 보여주고 있으며, 모델과 엔지니어링의 조합을 통해서 보다 나은 성과를 만들 수도 있음을
Bongho Lee
Quantile Loss는 Quantile Regression시 사용하는 Loss Function이다.

Quantile Loss는 Quantile Regression시 사용하는 Loss Function이다.

* Quantile Loss는 Quantile Regression처럼 Predicted Value의 Quantile을 구하고자 할 때 사용되는 Loss Function이다. * 변수의 75번째 Quantile을 예측하는 것이 목표인 문제를 예로 든다면, 이는  75%의 경우 예측 오차가 음수여야 하고 나머지 25%는 양수여야 한다는 말과 동일하다. * 기본적으로 이러한 경우 Quantile Loss 는 과소 추정된 예측에 대해 과대 추정된 것보다
Bongho Lee

Bayesian Modeling이 사회과학연구에 활용하면 좋은 6가지 이유

Coherence * 주관적 확률이 확률 계산의 일반적인 규칙/공리(이러한 규칙의 타당성은 방금 언급한 자기 일관성에 해당함)를 따르고 따라서 이러한 확률로부터 일관된 결정을 얻을 수 있다는 가정 Conditioning on Observed Data * 베이지안 통계학과 빈도주의 통계학 사이의 중요한 차이점은 관측 데이터가 매개변수 추정에서 수행하는 역할에 관한 것 * 구체적으로, 빈도주의 추론은 정확히
Bongho Lee

Attention은 가중평균을 통해서 문맥정보를 제공하는 방식이다.

이 글의 시작은 DeeprETA라는 논문에서부터였다. DeeprETA는 Uber에서 사용하는 시간예측 알고리즘으로, Post Processing에 최적화된 모델이다. 즉 Uber의 경우 배차를 하고 Routing을 하는 시점에서 기본적인 예상시간을 계산한다. 이후에 실제 상황을 감안해서 보정을 하는 과정을 거치는데 이 아키텍처 상에서 저자는 Feature간의 Interaction을 반영하기 위해 Linear Self Attention을 활용한다. 이 시점에서 나는 Linear Attention을
Bongho Lee

TimesNet - CNN Based Time Series Forecasting (Multi periodicity 활용)

Introduction * a CNN-based architecture to achieve state-of-the-art results across different tasks, Motivation * Mutli-periodicity * 예) 밤보다 낮이 덥고, 겨울보다 여름이 더 덥다. 이렇게 여러 특징이 Overlap되기도 하고 상호작용하기도 한다. → 기간만을 가지고 분리하기가 어려울 수 있다. * 저자는 2D Space로 TIme Series의 Reshape을 제안 → intraperiod-variation and interperiod-variation.를 각각 모델링 Architecture * TimesNet은 여러
Bongho Lee

수식 없이 등분산에 대한 내용을 전달해보기

빅데이터라는 키워드를 시작으로 최근에는 AI까지 회사 전반에 걸쳐 데이터를 적용해서 업무를 하기 위해서 노력하는 분위기가 형성되어 있다. 정말 이해가 되지 않는 주관적이고 정성적인 이유를 기반으로 업무하는 상황에 비해서는 확실히 좋은 세상임에는 틀림없다. 하지만 하나만 아는 사람이 정말로 무섭다고, 숫자만 쓰면 모두 데이터 기반의 효율적인 의사결정이라고 간주하면서 다양한 수식을 전제조건에 대한
Bongho Lee