Data Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention Summary Motivation * Transformer는 성능은 매우 좋으나 내부 구조의 복잡함으로 인해서 계산비용이 기하급수적으로
Data Uber Eats의 배달예상시간(ETA) 후보정 모델 DeepETANet 정리 Excerpt * Abstrct * Commonly used route planning algorithms predict an ETA conditioned on
Data Rejection Sampling in Python Summary * Rejection Sampling은 Sampling 기법의 하나로, 특정 Distribution을 따르는 수를 임의로 생성하는
Data Target Encoding에 대한 간략한 요약 Target Encoding은 해당 Category에 나타난 Target Variable의 평균을 이용해서 Categorical Values를 대체하는
Data Entropy, Cross-Entropy, KL Divergence Entropy는 Cross Entropy Loss라는 이름으로 Deep Learning에서 분류 모델을 하는 이에게는 꽤나
Data Transformer 요약 정리 * 강점 * Attention을 활용, 반복을 최소화하고, Positional Encoding을 활용해서 parallelization 지원 * Attention을 활용하여
Data Long Tail Event에서 예측시 정확도 높이기 (Doordash Case) Long Tail Event * Long Tail Event는 Right Skewed Distribution 에서 발생하는 특징