SLM(소형 언어 모델)이란?

SLM(Small Language Model)은 플래그십 LLM보다 훨씬 적은 파라미터를 가진 언어 모델로, 일반적으로 수십억수백억 파라미터 수준입니다(반면 프런티어 LLM은 수천억조 단위). 장점은 저렴한 비용, 빠른 속도, 온디바이스 배포 가능성, 좁은 작업에 대한 파인튜닝 용이성입니다. 대표 모델: Claude Haiku, Microsoft Phi 시리즈, Gemini Nano, Llama 3B/8B, Mistral 7B.

실전 응용: 저희 팀의 단순 Agent 작업 90%(분류, 요약, Linear 카드 생성, TG 메시지 라우팅)는 Claude Haiku 4.5에서 돌립니다. 같은 작업을 Opus로 옮기면 비용은 12배, 속도는 3배 느려지지만 품질 차이는 10% 정도입니다. SLM의 확산은 AI를 “OpenAI에 API 비용을 내는” 방식에서 “자체 GPU로 돌리는” 방식으로 전환시켰으며, Edge AI 부상의 핵심 동인입니다.