OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

OLS

OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

배경 * 아래 글을 DANBI에서 보다가 더 알아보게 되었습니다. OLS를 떠받치는 몇 개의 기둥이 있는데 그중 실용적으로 가장 중요한 것이 일치성(consistency)다. 쉽게 말해서 OLS를 통해 도출된 추정량이 있을 때 샘플사이즈가 커지면서 이 값이 참 값으로 접근한다는 것이다. 일치성이 충족되면 우리는 적당하게 큰 표본에 대해서 추정치가 좋은 속성을 지니고 있다고

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

AI

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

사람들이 AI가 필요하다고 생각하는 시점 저 판사를 얼른 AI로 교체해야 한다. 유튜브에서 뉴스를 보다 보면 정말 많이 보이는 덧글입니다. 이러한 내용의 덧글이 달릴 때마다, 정말 많은 사람들이 공감을 표하곤 합니다. 왜 이렇게 사람들은 이러한 주장에 공감을 표하는 것일까? AI는 시킨대로 하기 때문에 공정하다는 인식 여러 이유가 있겠지만, 사람들은 아마 AI가

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

Data

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

1. BG/NBD 모델이란? * BG/NBD(Beta-Geometric/Negative Binomial Distribution) 모델은 **고객의 생애 가치(Customer Lifetime Value, CLV)**를 추정하는 데 사용되는 확률적 모델입니다. * 특히 고객이 반복 구매를 할지, 아니면 더 이상 활동하지 않을지를 추정하는 데 유용합니다. 이 모델은 고객의 구매 행태를 두 가지 중요한 개념으로 나눕니다: * 고객은 활성(active)

RE-CONSIDER-ED

데이터, 비즈니스, 그리고 책에 대한 개인적인 기록

Latest

잭나이프 샘플링은 표본의 변동성 추정 방법중 하나입니다.

잭나이프 샘플링은 표본의 변동성 추정 방법중 하나입니다.

잭나이프 샘플링이란? * 잭나이프 샘플링은 표본 데이터에서 하나의 관측치를 제거한 여러 하위 샘플을 만들어, 이들 샘플에 대해 통계량을 계산한 후 그 결과를 바탕으로 전체 표본의 변동성을 추정하는 방법입니다. 잭 * 나이프는 주로 표본의 분산을 추정하거나 통계량의 편향을 줄이기 위해 사용됩니다. 예시 * 주어진 표본이 [x1, x2, x3, x4]라면, 잭나이프 샘플링은 다음과 같은

정확한 단위로 대화를 하는 것이 중요합니다.

정확한 단위로 대화를 하는 것이 중요합니다.

자전거를 타고 약속장소로 이동하는 중이었습니다. 근처 과일 가게에 이런 문구가 적혀있었습니다. "한 상자에 X,000원" 과일을 직접 사먹지는 않는 편이기 때문에 가격은 모르지만 꽤 매력적인 가격대였습니다. 그래서 잠시 "살까?" 망설였습니다. 하지만 이내 자전거를 타고 다시 가던 길을 갔습니다. 한 상자 안에 몇개가 들어가 있을지를 몰랐기 때문입니다.

전체와 부분은 순환참조로 연결되어 있습니다.

전체와 부분은 순환참조로 연결되어 있습니다.

거실에 홈캠을 하나 설치할 일이 생겼습니다. 홈캠은 이전에 구매한 것과 동일한 구조로, 회전은 되지 않지만, 앞으로 각도를 조절하여 찍을 수 있는 구조로 되어 있었습니다. 설치 자체는 어렵지 않을 것이라고 생각했는데,문제는 장소였습니다. 거실은 부엌과 연결되어 세로로 긴 구조로 일반적인 정사각형 형태의 방 대비 화각의 한계에서 발생하는 사각지대가 존재하고 있었습니다. 이를

Model Drift Check Library, Evidently AI

Model Drift Check Library, Evidently AI

Evidently AI Evidently AI는 머신러닝 모델의 성능과 데이터 분포의 변화를 시각적으로 분석하고 모니터링할 수 있는 Python 라이브러리입니다. 이 라이브러리는 모델의 드리프트를 탐지하고, 이를 기반으로 모델의 성능 저하를 사전에 예방하는 데 유용합니다. 주요 기능 * 데이터 드리프트 감지: 현재 데이터와 과거 데이터 간의 분포 차이를 분석합니다. * 대규모 데이터 처리: 대규모 데이터에 대해

[책]어찌 보면 가장 현실적인 자기계발서인지 모른다, 더 시스템

[책]어찌 보면 가장 현실적인 자기계발서인지 모른다, 더 시스템

사실 이 책을 보게 된 것은 우연이었습니다. 어떤 다른 것보다 독특한 리뷰가 시선을 붙잡았습니다. 이 책에 남겨져 있는 리뷰는 다음과 같았습니다. 최근에 읽은 자기계발서중에서 가장 좋았습니다.   (중략) 자기계발서 중에서 가장 좋았다는 표현에서 미루어 짐작해보면, 기타 다른 자기계발서와 비교를 하여 우위를 가렸을 때, 좋았다는 표현이라고 생각해볼 수 있습니다. 그런데 가장 좋았다니.

특정 확장자의 파일명을 수정하기 위한 파이썬 코드

특정 확장자의 파일명을 수정하기 위한 파이썬 코드

배경 및 목적 * NAS로 파일을 백업하는 과정에서 파일명이 길어서 수정해야 하는 경우가 너무 많아서, 자동화 코드를 작성 감안한 부분 * 대량의 파일을 처리할 것을 감안해서, 파일 복사 대신 경로만 저장해서 컨트롤한 이후에 최종적으로 필요한 파일만 일괄적으로 처리 * Python의 concurrent.futures 모듈을 사용하여 병렬로 파일을 처리 샘플 코드 import os import shutil

화이트보드와 시각적 커뮤니케이션의 중요성

화이트보드와 시각적 커뮤니케이션의 중요성

최근에 취업준비를 하는 학생들을 코칭하고 있습니다. 처음에는 소일 거리로 이 일을 시작하였으나, 생각 외로 많은 도움을 받고 있습니다. 예를 든다면  개인적으로 가지고 있던 습관이나 행동패턴을 점검하는 시간으로 종종 활용하고 있습니다. 오늘 이야기하려는 것은 그러한 경험의 연속성으로 시각적 커뮤니케이션에 관한 것입니다. 일반적으로 문제를 정의하고 방법을 고민하다보면 문제 정의를 하던 초기 단계