Python Cookbook Data Structures and Algorithms Day 1 정리

Star Expression Problem: You need to unpack N elements from an iterable, but the iterable may be longer than N elements, causing a “too many values to unpack” exception.

Deque Problem:  You want to keep a limited history of the last few items seen during iteration or during some other kind of processing. ※Deque: … Continue reading Python Cookbook Data Structures and Algorithms Day 1 정리

[SQL] Case When과 COALESCE / NullIF 번갈아 써보기

하루에 하나씩 Codewar에서 SQL 문제를 풀고 있다. 그 중 필요한 부분은 기록으로 남긴다. 1) COALESCE / NullIF 사용시 NULLIF(exp1, exp2): exp1값과 exp2값이 동일하면 NULL을 그렇지 않으면 exp1을 반환 COALESCE(expr1,expr2,expr3,…): expr1이 NULL이 아니면 expr1값을, 그렇지 않으면 COALESCE(expr2,expr3,…)값을 반환

2) Case-When 구문

3) With를 통한 임시 테이블 생성

 

[Kaggle]인스타카트(Instacart) 데이터 분석해보기(2) – 트리맵(Treemap)

지난 번 글에 이어서 Insta Cart Exploratory Anlaysis를 위해 R로 Treemap을 실습해 보았다. 참고로 department, aisle 모두 Category 형 Variable이기 때문에 Treemap을 사용할 수 있다. tmp는 Deparment 별 Aisle 이름에 대한 디멘션(Dimension) 데이터 프레임이다.  Left Join한 까닭은 혹시 상품 중에 Department, Aisle 명이 누락된 경우를 대비해서이다.

tmp2는 Product 주문 내역을 Product 별로 Grouping 후에… Continue reading [Kaggle]인스타카트(Instacart) 데이터 분석해보기(2) – 트리맵(Treemap)

[Kaggle]인스타카트(Instacart) 데이터 분석해보기(1)

Kaggle에 인스타카트(Instacart)의 개인화 서비스 관련 Competition이 등록되었다. 대략 훑어보니 e-Commerce 특성상 특별한 배경지식 없이 접근이 가능하고 데이터도 잘 정제되어 있었다. 그래서 이 기회에 R에 익숙해질 겸, 한 유저가 진행한 Exploratory Analytics를 참고해서 연습해보았다. Data Loading

Data Set Summary 총 주문 수는 342,083건으로 1인당 16.6건씩 주문을 하였고 총 39123종의 제품이 35.4번씩 주문 되었다.

 … Continue reading [Kaggle]인스타카트(Instacart) 데이터 분석해보기(1)

Python Web Crawling으로 Raw Data 수집하기 (Selenium Library)

일전에 TechNeedle에 아이들을 대상으로 한 스타트업, Kidpass에 관해 글을 쓴 적이 있다. 6월 시점으로 KidPass이 만든 플랫폼에는 900개가 넘는 업체들이 참여를 하고 있다고 한다.  그런데 어떤 업체들이 참여하고 있을까?  그래서 업체들의 리스트가 담긴 페이지를 들어가봤는데, 이게 생각보다 친절하게 제공되어 있지 않았다. Page Number의 구분 없이 일명 Infinite Scroll 형태로 934개를 모두 볼 수 있을 때까지… Continue reading Python Web Crawling으로 Raw Data 수집하기 (Selenium Library)