5년간의 블로그 글이 모두 날아가버렸다.

오늘도습관처럼 개인블로그를 접속하였다. 그리고 블로그가 초기화된 것을 확인했다.  원인은 찾았지만, 다행스럽게 이미 백업스크립트를 운용중이었던지라,  최근 7일간 백업 데이터를 다운로드 받아서 복구를 진행하려고 하였다.

그런데 복구가 되지 않았다. 데이터베이스는 매일 덤프를 받고 있었는데, 덤프된 파일의 용량이 Zero Byte인 것이다. 즉 제대로 되고 있지 않았던 것이다. 그래서 과거 데이터까지 확인을 해보았더니 첫 백업일자부터 데이터베이스의 덤프는 제대로 이뤄지지 않고 있었다.

즉 파일로 남겨진 이미지 등의 컨텐츠를 제외하고는 모든 글이 날아가 버린 것이었다. Ghost CMS 플랫폼의 경우 글과 코멘트에 대해서는 모두 DB 형태로 보관이 되기 때문에 정말 모든 글이 날아가 버렸다.

급한 마음에 과거 워드프레스 때의 백업본은 있는지 찾아보려고 했지만, 도무지 기억이 나지 않았다.  400여편의 글이 날아갔다는 생각에 순간 화가 치밀어 올랐지만 화를 내봤자, 변하는 것이 없다는 사실에 화는 빠르게 식어버렸다.

원인은 너무 간단하였다. 데이터베이스를 덤프하는 구조에서 내부에 덤프로 떨어질 스크립트가 없다해도 파일이 생기는데, 그 파일이 생기는 것만 보고 덤프가 잘 떨어졌다고 생각한 것이다.

아는 것일 수록 돌다리도 두들겨 봐야 한다고 했는데, 돌다리도 두들겨보지 않았던 것이다.  글을 날린 것은 이미 지나가서 어떻게 할 수 없지만, 익숙한 것일 수록 너무 가볍게 생각하고 지나가는 것은 없는지 더 들여다봐야겠다. 정말 간담이 서늘한 금요일이었다.

Read more

OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

배경 * 아래 글을 DANBI에서 보다가 더 알아보게 되었습니다. OLS를 떠받치는 몇 개의 기둥이 있는데 그중 실용적으로 가장 중요한 것이 일치성(consistency)다. 쉽게 말해서 OLS를 통해 도출된 추정량이 있을 때 샘플사이즈가 커지면서 이 값이 참 값으로 접근한다는 것이다. 일치성이 충족되면 우리는 적당하게 큰 표본에 대해서 추정치가 좋은 속성을 지니고 있다고

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

사람들이 AI가 필요하다고 생각하는 시점 저 판사를 얼른 AI로 교체해야 한다. 유튜브에서 뉴스를 보다 보면 정말 많이 보이는 덧글입니다. 이러한 내용의 덧글이 달릴 때마다, 정말 많은 사람들이 공감을 표하곤 합니다. 왜 이렇게 사람들은 이러한 주장에 공감을 표하는 것일까? AI는 시킨대로 하기 때문에 공정하다는 인식 여러 이유가 있겠지만, 사람들은 아마 AI가

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

1. BG/NBD 모델이란? * BG/NBD(Beta-Geometric/Negative Binomial Distribution) 모델은 **고객의 생애 가치(Customer Lifetime Value, CLV)**를 추정하는 데 사용되는 확률적 모델입니다. * 특히 고객이 반복 구매를 할지, 아니면 더 이상 활동하지 않을지를 추정하는 데 유용합니다. 이 모델은 고객의 구매 행태를 두 가지 중요한 개념으로 나눕니다: * 고객은 활성(active)

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할 때 발생합니다. 즉, 한 독립 변수가 다른 독립 변수에 의해 설명될 수 있을 정도로 상관관계가 높은 상황을 의미합니다. * 이 문제는 주로 회귀 분석에서 나타나며, 변수들 간의 관계를 해석하는 데 있어 큰 장애물이 될 수 있습니다. * 일반적인 회귀식을 $Y=