Vector Space, Linear Independent, Basis

Vector Space

  • 집합 내 원소간 대한 덧셈과 상수곱을 했을 때 결과가 모두 해당 집합에 속하고, 다음 조건을 만족하는 집합을 Vector Space라고 정의한다
  • 합에 대하여
    • 교환법칙: $a + b = b + a$
    • 결합법칙 $(a + b) + c = a + (b + c)$
    • 항등원: $a + 0 = a$
    • 역원: $a + (-a) = 0$
  • 상수곱에 대하여
    • 분배법칙
      • $c(a + b) = ca + cb$
      • $(c + k)a = ca + ka$
    • $c(ka) = (ck)a$
    • $1a = a$
  • 좌표공간의 모든 원소나 함수의 집합도 Vector Space라고 할 수 있다

Linear Independent

  • $v_1...v_n \in W \subseteq V$라고 하고 \vec{A}와 \vec{B}가 원소일 때 여기에 덧셈을 하든 상수곱을 한 원소가 모두 $W$에 속한다고 할 때 $W$는 VectorSpace라고 할 수 있다.
  • 이 때 상수곱을 하는 것을 Span한다고 하고 선형결합이라고 한다.
  • Spanc Space가 커져서 아예 $V$와 동일해질 수 있다. 즉 $V$안의 모든 원소를 $v_1...v_n$의 모든 원소의 선형결합으로 나타낼 수도 있다.
  • 이때 특정 Vector에 대해서 $v_1$, $v_2$로 표시할 수 있는 방법이 하나만 존재한다고 할 때 $v_1$과 $v_2$는 선형독립이다라고 말한다.
  • Vecotr Sapce의 원소 $v$를 특정 Vector의 Linear Combination($v = c_1 v_1 + ... c_n v_n$)로 표현했을 때 $(c_1 + ... c_n)$이 순서쌍이 하나만 존재함을 말한다.
  • 만약 $v$를 $(c_1 + ... c_n)$외에도 $(d_1 + ... d_n)$이 있다고 가정할 때 두 선형결합간에 뺄셈을 했을 때 $c_1-d_1 = c_2-d_2 = c_n -d_n$이 0이 되어야 한다는 것을 말한다.
  • 선형독립이면 $0=c_1-d_1 = c_2-d_2 = c_n -d_n$을 만족해야 하고 즉 $0=c_1 v_1 + ... c_n v_n$을 만족해야 한다.
  • 일부 0은 아닌 순서쌍이 있다면 그 Vecotr는 다른 Vector로 표현할 수 있기 때문에 선형종속적이다.

Basis

  • Vector Space $V$의 모든 부분 집합을 $P(V)$라고 할 때 그 안에서 Span Space의 집합과 선형독립인 집합의 교집합을 Basis(기저)라고 한다. Basis는 무수히 많을 수 있다.
  • $v$를 $\vec{v} = a \hat{i} + a+ \hat{b}$라고 나타낼 수 있다면 $\hat{i}$와 {\hat{j}는 Basis가 될 수 있다.
  • 좌표는 Basis를 이용한 계수의 순서쌍이다. 따라서 Basis에서는 원소의 순서가 매우 중요하다.
  • Vector Space V의 Basis 집합 $\beta$가 될 수 있는 집합은 모두 원소의 갯수가 동일하다. 그래서 이를 하나의 특성으로 간주하고 그 원소의 갯수를 우리는 Dimension이라고 부른다.

Read more

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

Pandera: 데이터프레임 검증에 최적화된 도구 주요 장점 * Pandas와 통합: Pandas 데이터프레임에 대해 스키마 기반 검증을 수행합니다. * 유연한 검증 조건: 열 데이터 타입, 값 범위, Null 여부 등 다양한 검증 조건을 정의할 수 있습니다. * 명확한 오류 메시지: 스키마 불일치에 대한 명확한 오류 메시지를 제공합니다. 단점 * 대용량 데이터 검증에서는 속도가 느릴 수

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression * Tobit 회귀(Tobit Regression)는 종속 변수가 특정 값에서 절단(Censored)된 상황에서 데이터를 분석하기 위해 사용되는 통계 기법입니다. * James Tobin이 처음 제안한 이 모델은 경제학과 사회과학 분야에서 자주 사용되며, 일반 선형 회귀로는 설명할 수 없는 상황에서 효과적으로 적용할 수 있습니다. Tobit Regression 수식 1. 관측된 종속 변수