什麼是模型部署? 把訓練好的 AI 模型部署成可接受 API 請求的服務。選擇很多:用 Ollama 在本機跑、用 vLLM 做高效能推論、或直接用 Claude/GPT 的雲端 API。關鍵考量:延遲、吞吐量、成本。