Model World는 Real World를 단순하게 형상화 한 것으로, 가급적 변수 수는 적을 수록 좋고, Real World의 핵심적인 현상에 대해서 표현하는데 초점을 맞춰야 한다. 이를 위해서 할 수 있는 방법은 대략 다음과 같다
Eliminating Less Relevant Variables
Clustering of Variables
Introducing Relative Variables
Phasing Variables over DIfferent Levels
Model should be built in an evolutionary way
Simple하게 시작해서 점차 Detail을 추가해 나간다.
Model should be complete on important issues
Model should be adaptive
Model should be robust
Specification of the Functional Form
Dependent, Indepedent Variable이 결정되면 이제 변수간의 관계를 어떻게 수리적으로 표현할지를 결정해야 한다. 이 때 일반적으로 쓰이는 수리적인 Form은 다음과 같다.
linear in both parameters and variables
yt=α+β1x1t+β2x2t
Additive Model로 Independent Variable 각각의 Effect 의 합은 그들의 Joint Effect와 동일하다.
단점
각 Independent Variable의 Parameter가 x배 증가하면 Depedent Variable 역시 x배 증가한다는 "constant returns to scale" 가정을 전제해두고 있음
Variable간 Interaction이 없다고 가정
nonlinear in the variables, but linear in the parameters
yt=α+β1ex1t+β2ex2t
Non Linear Additive Model
ex1t를 x1t∗로 바꾸는 식으로 해서 Linear Additive Model로 바꿀 수 있음
과포화(Supersaturation)이 발생해서 상식에 반하는 결과가 나올 수 있는 범위에 대한 이해가 충분히 있어야 한다.
qt=α+βat+ϵt이라는 식이 있다고 하자 qt는 판매량이고 at는 광고물량이라고 할 때 β를 구하기 위해서 qt를 at로 미분하면 2atβ가 나오게 되는데 이는 광고물량이 증가할 수록 Margial Sales Effect가 0에 수렴한다는 결과로 나와 상식에 반할 수 있게 된다.
nonlinear in the parameters and linearizable
yt=αx1tβ1...
Log를 취하면 Linearie할 수 있다.
필요하면 Log를 두 번 취해주는 Log-Log를 통해서 Linearize할 수 있다.
nonlinear in the parameters and not linearizable.
yt=α(1−e−βxt)ϵt,withα>0,andβ>0.
주로 계량 경제학의 추정 방법이 일반적으로 모델을 매개변수에서 선형으로 가정했기 때문 과거에는 어떻게든 선형화를 한 이후에 문제를 풀려고 했지만 지금은 크게 문제되지 않음
Modified Exponential Model로 xt가 0으로 가면 yt도 0으로 가고, xt가 무한에 가까워지면, yt는 α에 가까워진다.
You might also like...
03
2월
DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.
2 min read
02
2월
Docker 모니터링하면서 죽으면 재시작시키는 스크립트
1 min read
06
1월
Tobit Regression은 Censored Data에 적합한 Regression이다.
5 min read
16
12월
Monotonic Constraint는 Prediction에 영향을 주지 않는 제약조건이다.
Member discussion