首頁 » AI 詞彙庫

模型部署

模型部署是什麼？把訓練好的 AI 模型部署成可接受 API 請求的服務。選擇很多：用 Ollama 在本機跑、用 vLLM 做高效能推論、或直接用 Claude/GPT 的雲端 API。關鍵考量：延遲、吞吐量、成本。 — Judy AI Lab AI 詞彙庫

infrastructure intermediate

什麼是模型部署？

把訓練好的 AI 模型部署成可接受 API 請求的服務。選擇很多：用 Ollama 在本機跑、用 vLLM 做高效能推論、或直接用 Claude/GPT 的雲端 API。關鍵考量：延遲、吞吐量、成本。