[책] 자기인생의 철학자들, 인생경력자의 말말말

평균 나이 72세, 자신의 인생에 대해 말한다. 이 책의 서브타이틀이고 필자를 한순간에 사로잡은 말이었다. 이제 서른 중반에 도달하고 있는 필자에게 72세란 뜬 구름 같은 숫자이다. 저 나이가 되면 무슨 생각이 들까? 그리고 그 생각에 어떻게 믿음을 부여하며 지탱해나가고 있을까? 분명 저 연배가 되면 누구나 자신의 생각에 대한 흐름이 공고하게 잡히게 될 것이며 깊이가 생겨날 것이다.… Continue reading [책] 자기인생의 철학자들, 인생경력자의 말말말

시계열 모형의 작성

방통대 "금융 데이터의 이해"를 듣다가 간략하게 메모, 100% 이해하고 있지는 못해서, 부족한 부분은 계속 추가할 예정 시계열의 안정화 평균과 분산이 일정한지 파악하고 그렇지 않을 경우 차분 또는 로그를 통해 안정화시킨다. 모형의 식별 상관계수(ACF)와 부분상관계수(PACF)를 보고 모형이 잘 설명되는지 판단한다.상관도표에서 시차별로 기준선보다 높은 상관계수가 나오는 영역이 많다면 해당 구간의 경우 일정한 관계가 있음을 확인 대표적인 모형은… Continue reading 시계열 모형의 작성

탐색적 데이터 분석(EDA)

R을 활용한 데이터 과학(해들리위컴, 개럴 그롤문드 저)를 보면서 정리하였으며 지속 업데이트 예정.EDA는 말그대로 탐색이기 때문에 자칫하면 무한정 헤매는 상황을 겪기 쉽기 때문에 풀고자 하는 질문이 무엇인지등에 대한 명확한 정의가 선행되어야 한다. 탐색적 데이터 분석은 다음과 같은 반복적 작업으로 구성되어 있음 데이터에 대한 질문을 만든다.데이터를 시각화, 변형 및 모델링하여 질문에 대한 잡을 찾는다질문을 개선하거나, 새로운 질문을… Continue reading 탐색적 데이터 분석(EDA)

[책]마케터의 여행법, 구슬을 꿰니 보배로구나.

워낙 투심몽키라는 필명이 특이해서 눈에 잘 띄었던 분이 연초에 책을 썼다고 하셨다. 두고두고 읽어봐야지 했다가 드디어 읽게 되었다. 개인적으로 이제 영국에서 귀국한지 1년 6개월 되었지만 여전히 영국이 그리운 상황에서 유럽에서 살고 있는 마케터의 글이라니 얼른 읽어봐야지 하면서 책을 펼치게 되었다. 전반적으로 내용이 짧은 컬럼이 모여있는 형태이다. 마케터이자 투자자라고 본인을 밝히는 필자는 본인이 유럽에서 거주하면서 관찰한… Continue reading [책]마케터의 여행법, 구슬을 꿰니 보배로구나.

1월 배달업종별 통화건수[SK Data hub]

서론 아직까지는 SQL을 통해서 데이터를 핸들링하는 일이 잦다 보니 R, Python 실력이 자꾸 녹스는 듯하다. 특히 시각화 부분은 분석하다보면 분석의 즐거움 속에 자꾸 놓치고 지나가는 듯해서 꾸준히 데이터를 틈틈히 다퉈보기로 하였다. 그런 차원에서 오늘 만지는 데이터는 SK Data Hub에서 제공하는 19년 1월 서울 배달업종별 이용 통화량이다. 데이터 자체는 양이 11만건정도로 많지는 않은 편이나 서울 구,… Continue reading 1월 배달업종별 통화건수[SK Data hub]

[책]이코노크러시, 경제를 전문가에게만 맡겨놓는 것의 위험성

아주 친한 사이, 심지어 가족이라고 해도 이야기하지 말아야할 주제가 있다. 바로 정치이다. 매 명절마다 정치에 대한 이야기를 잘 못 꺼냈다가는 이분법적으로 나눠진 틀 사이에서 치열하게 싸운다. 그리고 그 때마다 각 팀(?)의 의견을 뒷받침하는 다양한 경제 현황과 수치가 오고간다. 하지만 그게 끝이었다. 수치는 오고가지만 그 수치에 대해 어떻게 계산되었는지, 그 배경에 대해서는 아무도 이야기 하지 않았다.… Continue reading [책]이코노크러시, 경제를 전문가에게만 맡겨놓는 것의 위험성

[책]인간을 탐구하는 수업(의 Overview)

한 줄평 스탠포드 경영대학원의 몇몇 중요(하다고 저자가 생각한)한 수업에 대한 개괄적인 소개서 서평 저자 사토 지에는 경영컨설턴트로서 "세계 최정상에 오른 사람들은 무엇이 어떻게 다른가?"에 관심을 갖고 수년간 연구해왔다고 한다. 그리고 이러한 연구의 일환으로 유수의 인재를 배출해낸 스탠포드 경영대학원은 어떤 수업을 제공하는지 분석해보기 시작하였다. 이 책은 그 연구에서 나온 자료들을 정리한 책이다. 저자는 스탠포드 경영대학원이 제공하는… Continue reading [책]인간을 탐구하는 수업(의 Overview)

[책] 대량살상 수학무기, 고발은 했는데 대안은?

한 줄평 데이터가 악용될 수 있는 여지를 낱낱이 드러내는 부분은 매우 공감하나 대안은 다소 부실한, 그래서 아쉬운 책 서평 데이터와 관련된 일을 업으로 하고 있기 때문에 제목만으로도 흥미가 동하는 그런 책이었다. 가뜩이나 정부가 주도하는 4차산업혁명이라는 단어 덕분에 세상이 모두 데이터의 장점만을 부르짖는 요즈음이다. 그런 분위기 속에서 데이가 가져올 사회적인 변화와 음지에 대해서 설명을 하는 책이… Continue reading [책] 대량살상 수학무기, 고발은 했는데 대안은?

[책]린 분석, 어떤 지표를 봐야 하는가?

한 줄평 서비스 지표를 처음 분석해야 하는 입장에서 무엇을 분석해야할지 잘 모르겠다면 이 책을 추천합니다. 서평 작년 하반기 서비스 지표를 관리하고 분석하는 업무를 맡게 되었다. 그리고 그 지표를 고도화하기 위해 노력하던 중에 어떤 지표를 추가적으로 봐야할지 고민하던 중에 이 책을 접하게 되었다. 정성적? & 정량적? 저자는 정성적인 관찰결과는 현상에 대한 이유(Why)를 파악하는데 도움이 되고, 이에… Continue reading [책]린 분석, 어떤 지표를 봐야 하는가?

TIL – Interaction Variable, Removing features with low or zero variance, Feature Selection with a Random Forest

Summary Feature Engineering시 파생변수 생성 방법 중의 하나인 Interaction Variable를 생성하는 방법과 Random Forest의 Feature Importance를 통해 Feature Selection을 하는 방법을 정리한다. 관련 참고 소스코드에 대한 출처는 이전 글에 정리해놓았다 Interaction Variable 보통 선형모델에서는 각 설명변수들이 반응변수에 미치는 영향은 서로 독립적이라고 가정을 한다. 하지만 그렇지 않을 수도 있다. 예를 들어 매체들을 선형변수라고 놓고 매출을 반응변수라고… Continue reading TIL – Interaction Variable, Removing features with low or zero variance, Feature Selection with a Random Forest