๐ฆ AI Model์์ AI System์ผ๋ก์ ์งํ
1.Compound AI System is
LLM์ ๋์คํ์ ํจ๊ป, AI Model์ Application์ ์ฃผ์ ์์๋ก์จ ๋น ๋ฅด๊ฒ ๊ด์ฌ์ ์ด๋๊ณ ์๋ค. Compound AI System์ Traditional Software์ AI Model์ ๊ฒฐํฉ์ผ๋ก์จ Google์ AlphaCode 2, ย AlphaGeometry ๋ฑ ๋น ํ ํฌ์ LLM ๋ชจ๋ธ์ Compound AI System์ ํจ๊ณผ์ฑ์ ์ ๋ณด์ฌ์ฃผ๊ณ ์์ผ๋ฉฐ, ๋ชจ๋ธ๊ณผ ์์ง๋์ด๋ง์ ์กฐํฉ์ ํตํด์ ๋ณด๋ค ๋์ ์ฑ๊ณผ๋ฅผ ๋ง๋ค ์๋ ์์์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
2.Why Use Compound AI Systems?
- ์ผ๋ถ ์์ ์ ๊ตณ์ด Model๋ณด๋ค๋ ์์คํ ๊ฐ์ ์ ํตํด์ ํ๋ ๊ฒ์ด ๋ ์ฌ์ธ ์ ์๋ค.
- ๋ชจ๋ธ์ ์ ์ ๋ฐ์ดํฐ๋ก ํ๋ จ์ด ๋๊ธฐ ๋๋ฌธ์ ๋ณด๋ค ๋ค์ํ ๋์ ์์๋ฅผ ๊ฒฐํฉํ๊ธฐ ์ํด์๋ Model์ ๋์ด Traditional Software ๊ด์ ์์ ์ค๊ณ ๊ณ ๋ ค๊ฐ ํ์ํ๋ค.
- System์ ์ ํ์ฉํ๋ฉด Controllability์ ์ ๋ขฐ๋๋ฅผ ๋์ด๋๋ฐ ๋ ์ ํฉํ๋ค. AI ๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ ๊ฐ์ง๊ณ ์๋ค.
- ์ฑ๊ณผ ๋ชฉํ๋ ๋งค์ฐ ๋ค์ํ๊ณ ๊ด๋ จ ๋งค๊ฐ๋ณ์๋ฅผ ๋ณ๊ฒฝํด์ผ ํ๋ ๊ฒฝ์ฐ๋ ๋ง๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ๊ณผ ์์คํ ์ ์ ์ ํ ๊ฒฐํฉ์ด ์ด์ฉํ๊ธฐ ๋์ ์ ์๋ค.
3.Developing Compound AI Systems
- Compound AI System์ Traditional Software์ AI Model์ ๊ฒฐํฉ
- ์ด๋๊น์ง ๋ชจ๋ธ๋ก ํ๊ณ , ์ด๋๊น์ง๋ฅผ Software๊ด์ ์์ ์ปค๋ฒํด์ผํ ์ง์ ๋ํ ๊ณ ๋ฏผ ํ์
4.Key Challenges in Compound AI Systems
Design Space
- ์ฌ๋ฌ ๊ธฐ์ ๋ค์ ์ข ํฉ์ ์ผ๋ก ํ์ฉํด์ผ ํ๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฐ์ ๊ณ ๋ คํด์ผํ ์์๊ฐ ๋งค์ฐ ๋ง์
- ์ ํ๋ ๋ฆฌ์์ค ๋ด์์ Latency๋ฑ์ ์์๋ณ๋ก ์ ๋ฐฐ๋ถํด์ผ ํจ
Optimization
- ๋ค์ํ ์์๋ค์ด ๊ฒฐํฉ๋ ์์คํ ๋ด์์์ ๋ฆฌ์์ค ๋ฐ ์ฑ๋ฅ ์ต์ ํ ์ด์
- DSPyย ๋ LLMํ์ดํ๋ผ์ธ์ ์ํ Optimizer๋ฅผ ์ ๊ณต
Operation
- ๊ธฐ์กด ํ๋์ ๋ชจ๋ธ์ ์ด์ฉํ๊ณ ํธ๋ํนํ๋ ๊ฒ๋๋น ํจ์ฌ ๋ณต์กํ ์์คํ
์ ์ด์ฉํ๊ธฐ ์ํด์๋ ๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํด์ผํ ํ์๊ฐ ์์
- ๋ชจ๋ํฐ๋ง: ์์คํ ๋ณต์ก๋์ ๋ง๋ฌผ๋ ค ์ด๋ป๊ฒ ํจ๊ณผ์ ์ผ๋ก ๋ก๊น ํ๊ณ , ๋ถ์ํ๊ณ ๋๋ฒ๊น ํ ๊ฒ์ธ์ง ์ ๋ต ํ์
- DataOps: ๋ฐ์ดํฐ ์๋น์ ์ํ ๋ค์ํ ์์คํ ๊ณผ ๋ฐ์ดํฐ์ ํ์ง, ๊ทธ๋ฆฌ๊ณ ํ์ดํ๋ผ์ธ์ ์ด๋ป๊ฒ ๊ด๋ฆฌํ ๊ฒ์ธ์ธ๊ฐ์ ๋ํ ๊ณ ๋ฏผ ํ์
- ๋ณด์: ์์คํ ์ ๋ณต์ก๋์ ๋ง๋ฌผ๋ ค ๋ ๋ง์ ๋ณด์ ์ด์ ๋ ธ์ถ ๊ฐ๋ฅ์ฑ ์์
5.Emerging Paradigms
์์์ ์ธ๊ธํ Challenge๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ์๋ค์ด ํ์ฌ ๋ถ์ํ๊ณ ์์
Designing AI Systems: Composition Frameworks and Strategies
- ๊ฐ๋ฐ์๋ โlanguage model programmingโย framework์ ์ด์ฉํด์ AI Model๊ณผ ์ธ๋ถ ์์คํ ์ ๊ฒฐํฉํ๊ณ ์์
- ์ด ๋์ฌ์ฉํ๋ ์์๋ค์ย LangChainย ย LlamaIndexย ์ธ์๋ ย AutoGPT, ย BabyAGIย , ย Guardrails,ย Outlines,ย LMQLย ,SGLang๋ฑ์ด ์์
- ์ด์ธ์๋ ย chain-of-thought,ย self-consistency,ย WikiChat,ย RAGย ๋ฑ์ ์ด์ฉํด์ ๋ค์ํ AI ์์คํ ๋์์ธ ์ ๋ต์ ๊ตฌ์ฑํด๋ด๊ณ ์์
Automatically Optimizing Quality: DSPy
- DSPyย ๋ ํ๊ณ์์ ๋์จ Compound AI System ์ต์ ํ ๊ด๋ จ ์ฒ์ ๋ฑ์ฅํ framework
- LLM์ ํ์ฉํด์ ์์ฐ์ด ๊ธฐ๋ฐ์ผ๋ก ๊ฐ ๋ชจ๋์ ๊ตฌ์ฒดํํ๊ณ ์ฃ์ ํํ ์ ์๋๋ก ์ ๊ณต
Optimizing Cost: FrugalGPT and AI Gateways
- FrugalGPTย ์ต์ ๋น์ฉ์ผ๋ก ์ต์ ์ ํจ๊ณผ๋ฅผ ๋ผ ์ ์๋ ๋ชจ๋ธ ์กฐํฉ์ ์ฐพ์๋ด๊ธฐ ์ํ Framework ํ์ฉ
- Frugal GPT๋ ย Databricks AI Gateway,ย OpenRouter, ย Martian ์๋ฃจ์ ์ AI ์ดํ๋ฆฌ์ผ์ด์ ์ ๊ฐ ๊ตฌ์ฑ์์๋ฅผ ์ต์ ํํ๊ธฐ ์ํ ๋ชฉ์ ์ผ๋ก ํ์ฉ ๋จ
Operation: LLMOps and DataOps
- ๋ชจ๋ ๋จ๊ณ ๋ณ ์ถ๋ ฅ์ ๋ํ ๋ชจ๋ํฐ๋ง ํ์
- LangSmith,ย Phoenix Traces, Databricks Inference Table๋ฑ์ ์๋ฃจ์ ์ด ํ์ํ ์ ์์
- ํ๊ณ์์๋ DSPy Assertions์ ์ฉ ๋ฑ์ ๊ณ ๋ คํด๋ณผ ์ ์์
- MT-Bench,ย FAVAย ,ย ARES๋ฑ์ AI ๊ธฐ๋ฐ ํ์ง ํ๊ฐ ๋ฐฉ๋ฒ๋ก ๋ฑ์ ํตํด์ ํ์ง ๋ชจ๋ํฐ๋ง ์๋ํ ์ ์ฉ ๊ฐ๋ฅ