CNN, Convolution Neural Network 주요 개념

CNN은 Convolution Neural Network(이하)로서 합성곱을 적용한 신경망으로 신경망 중에서 가장 처음 배우는, 널리 알려진 신경망중 하나이다.

대략적인 구조는 아래와 같다. Convolution과 Pooling을 거듭하는 Feature Learning Layer와 배운 내용을 바탕으로 Classification을 진행하는 Classification Layer로 구성이 된다.

A Comprehensive Guide to Convolutional Neural Networks — the ELI5 way
Source: https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53

CNN이라는 이름이 의미하는 것처럼 이 Neural Network의 핵심아이디어는 Convolution으로 다음과 같은 방식으로 작동한다.

Image result for convolution animation

위 이미지에서 볼 수 있듯이 Kernel 또는 Filter를 거쳐서 만들어진 Output을 Feature Map이라고 한다. Actiation Map은 Input Image의 특정 패턴을 학습한 Output이다.  FCL(Fully Connected Layer)가 Input Image의 모든 패턴을 학습하는 것과는 다른 부분이다. 그리고 Convolution Layer에서는 앞서 언급한 Filter를 천천히 전체 Space에 걸쳐서 순회하면서 Feature Map을 만드는데 이 때 움직이는 간격을 Stride라고 말한다. 아래 이미지는 Stride가 1인 경우를 도식화한 것이라고 불 수 있다.

Source: https://ujwlkarn.files.wordpress.com/2016/07/convolution_schematic.gif?w=268&h=196

Feature Map을 생성한 후 Activation Function까지 적용한 결과를 Activation Map이라고 하는데  당연하게도 Activation Map의 Size는 Input Image와 Size보다 작아지는데 이 때 적절한 열과 행을 추가해서 Size를 조절할 수 있다. 이 때 사용하는 것이 Padding이다. Padding을 통해  Input Image의 외곽을 포함한 패턴을 좀 더 잘 학습할 수 있게 된다 .

Stride를 통해서 우리는 Feature Map의 Size를 조절할 수 있다.(Down Sampling) 통상 Stride를 통한 Down Sampling보다는 책들은 Pooling을 통한 Down Sampling을 자세히 소개하는 것 같다. Neural Network는 상당히 많은 Parameter(Weight)를 필요로 하는데 Pooling은 이러한 Parameter의 수를 줄이고 나아가 Image에서 Convolution을 통해서 추출된 패턴에서 한 번 더 특정 패턴만을 추출할 수가 있다. 대표적인 방식으로는 Max/Min/Average Pooling이 있고 Max Pooling이 많이 사용된다. 아무래도 특정 Pattern의 존재여부를 통해 분류를 하는 것이 조금 더 높은 분류 정확도를 보여서 그런 듯하다.

Source: https://miro.medium.com/max/396/1*uoWYsCV5vBU8SHFPAPao-w.gif
Source: https://miro.medium.com/max/596/1*KQIEqhxzICU7thjaQBfPBQ.png

참고1:  CNN, Convolutional Neural Network 요약  
참고2: A Comprehensive Guide to Convolutional Neural Networks — the ELI5 way

Read more

OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

OLS 기반 인과추론 시 오차항 관련 체크 필요 가정

배경 * 아래 글을 DANBI에서 보다가 더 알아보게 되었습니다. OLS를 떠받치는 몇 개의 기둥이 있는데 그중 실용적으로 가장 중요한 것이 일치성(consistency)다. 쉽게 말해서 OLS를 통해 도출된 추정량이 있을 때 샘플사이즈가 커지면서 이 값이 참 값으로 접근한다는 것이다. 일치성이 충족되면 우리는 적당하게 큰 표본에 대해서 추정치가 좋은 속성을 지니고 있다고

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

인공지능이 문제가 아니라 결국 사람이 문제가 될 것입니다.

사람들이 AI가 필요하다고 생각하는 시점 저 판사를 얼른 AI로 교체해야 한다. 유튜브에서 뉴스를 보다 보면 정말 많이 보이는 덧글입니다. 이러한 내용의 덧글이 달릴 때마다, 정말 많은 사람들이 공감을 표하곤 합니다. 왜 이렇게 사람들은 이러한 주장에 공감을 표하는 것일까? AI는 시킨대로 하기 때문에 공정하다는 인식 여러 이유가 있겠지만, 사람들은 아마 AI가

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

BG/NBD 모델은 고객 생애가치를 추정하는데 사용되는 확률 모델입니다.

1. BG/NBD 모델이란? * BG/NBD(Beta-Geometric/Negative Binomial Distribution) 모델은 **고객의 생애 가치(Customer Lifetime Value, CLV)**를 추정하는 데 사용되는 확률적 모델입니다. * 특히 고객이 반복 구매를 할지, 아니면 더 이상 활동하지 않을지를 추정하는 데 유용합니다. 이 모델은 고객의 구매 행태를 두 가지 중요한 개념으로 나눕니다: * 고객은 활성(active)

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성은 잘못된 인과추론 결과를 만들어낼 수 있습니다.

다중공선성(Multi Collinearity) * **Multi-Collinearity(다중공선성)**는 독립 변수들 간의 강한 상관관계가 존재할 때 발생합니다. 즉, 한 독립 변수가 다른 독립 변수에 의해 설명될 수 있을 정도로 상관관계가 높은 상황을 의미합니다. * 이 문제는 주로 회귀 분석에서 나타나며, 변수들 간의 관계를 해석하는 데 있어 큰 장애물이 될 수 있습니다. * 일반적인 회귀식을 $Y=