Representation Fine Tuning

Representation Fine Tuning
Photo by Gabriel Barletta / Unsplash

FineTuning 장점

  • Privacy
  • Reliability
  • Cost-Efficient Performance
  • More Control

FineTuning

  • Full Fine Tuning: 모든 Layer & Parameter를 업데이트
  • Parameter-Efficient Finetuning (PEFT): Parameter의 일부만 업데이트
    • Low Rank Adaptation (LoRA)
    • AdaLoRA
    • Adaption Prompt (LLaMA Adapter).
  • Alignment Raining: 사용자 선호도를 반영하기 위한 방식
  • Representation Finetuning
    • Parameter(Weight) 업데이트 대신 모델 내 Hidden Representation을 수정

Representation Finetuning

  • Feed Forward 과정에서 Internal Representation이나 Hidden State를 변경하는 식이며, 모델 Representation에 대해서 직접 개입하며 Task specific이다.
  • Paper에서는 LoRA와 유사한 LoReFT(Low-rank Linear Subspace ReFT)을 소개
    • Low Rank Approximation을 이용, 고차원을 저차원으로 근사하여 Linear Subspace에 접근하여 Representation을 수정, 이 때 Linear Subspace에 주요 Context들이 충분히 인코딩 되어 있다고 가정

  • 장점
    • Fewer Parameters: PEFT보다 더 적은 Parameter를 사용, 리소스 측면에서 더 적은 양을 요구한다.
    • Flexibility: Hugging Face 모든 언어모델에서 작동
    • Performance: PEFT와 유사하거나 비슷한 성능 제공
  • Motivation
    • Linear Representation Hypothesis
    • Interchange Interventions
    • Distributed interchange intervention

References

Read more

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

Pandera: 데이터프레임 검증에 최적화된 도구 주요 장점 * Pandas와 통합: Pandas 데이터프레임에 대해 스키마 기반 검증을 수행합니다. * 유연한 검증 조건: 열 데이터 타입, 값 범위, Null 여부 등 다양한 검증 조건을 정의할 수 있습니다. * 명확한 오류 메시지: 스키마 불일치에 대한 명확한 오류 메시지를 제공합니다. 단점 * 대용량 데이터 검증에서는 속도가 느릴 수

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression * Tobit 회귀(Tobit Regression)는 종속 변수가 특정 값에서 절단(Censored)된 상황에서 데이터를 분석하기 위해 사용되는 통계 기법입니다. * James Tobin이 처음 제안한 이 모델은 경제학과 사회과학 분야에서 자주 사용되며, 일반 선형 회귀로는 설명할 수 없는 상황에서 효과적으로 적용할 수 있습니다. Tobit Regression 수식 1. 관측된 종속 변수