Data

First Step Analysis in Transition Matrix

Summary * First Step Analysis란 Markov Chain을 해결하기 위한 간단한 방법 * Markov Property를  이용해서 변수들의 특성을 빠르게 파악하는 방법 Prerequisite * Absorbtion, Transition  개념 이해 필요함. * Absorbtion  Status에 들어가게 되면 그 이후로는 이제 Status가 변하지 않는다. Example * 다음과 같은 전이행렬이 있따고 가정할 때 Absorbtion Status에 도달하기까지의 시간과 확률, 그리고 평균 기대시간을 구한다고
Bongho Lee

언제 데이터 과학자를 채용하고 조직을 구성해야할까?

정답은 비즈니스 목적을 달성하기 위해서 기존의 방안에서 답이 없다고 판단할 때이다. 보통 조직들은 팀을 신설하고 데이터과학자나 엔지니어를 채용한다. 그리고 바로 실적이 나오길 기대한다.  이 때 기다려줄 수 있는 관점은 철저히 비즈니스 관점에서 사업계획에 예정된 일자일 경우가 많다. 다시 말해서 기타 비즈니스 요인은 고려되지 않은 경우가 많다. 데이터 조직이 생기고 프로세스가
Bongho Lee

데이터 과학자가 AI를 비즈니스에 잘 도입하기 위한 팁 6 가지

created: 2023-05-11 19:54 modified: 2023-05-11 19:54 title: Write Here tags: (default: []) * tag1 * tag2 featured: false published: false 복잡한 모델 또는 기술이 능사는 아니다. 비즈니스는 그런걸 신경쓰지 않는다. 비즈니스 부서들은 모델의 디테일따위 관심이 없다. 당신이 Naive Bayes를 쓰던 Random Forest를 쓰던 비즈니스 목표를 달성만 해주면 된다. 우선 빠른게 좋다.
Bongho Lee

Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

Summary Motivation * Transformer는 성능은 매우 좋으나 내부 구조의 복잡함으로 인해서 계산비용이 기하급수적으로 증가하는 문제가 있다. 이 부분에 대한 개선은 Dot Product를 이용해서 지속해서 개선해왔으나, 여전히 개선이 필요한 분야이다. * 연구분야는 1)크게 메모리사용량을 줄이기 위한 방안을 찾는 부분과 2)Sequence Length를 늘려서 맥락을 최대한 이해할 수 있게 하려는 부분인데 계산량 자체를
Bongho Lee

[요약]AI기반 생성 컨텐츠에서 고려해야할 세가지 리스크

서론 * AI 생성 콘텐츠(AIGC)는 이미지, 텍스트, 오디오, 비디오 등의 콘텐츠가 포함된 몇 년간의 중요한 관심사 . * AIGC는 양날의 검이 되어 최근 책임 있는 사용과 관련하여 많은 비판을 받고 있는 상황이다. 프라이버시 * 개인정보 노출. 대규모 기반 모델은 프라이버시 위험에 취약 * 이러한 모델을 기반으로 구축된 AIGC 모델도 개인정보 노출의 위험성이 있음
Bongho Lee