Test-time Compute（推理時運算）

Test-time Compute 指「模型回答時花更多算力換更好答案」的策略，是 2026 年 AI 領域顯學。傳統思路是把錢花在訓練更大模型，新思路是讓既有模型在推理時多想一會兒。Reasoning Model 的 Chain-of-thought、Best-of-N 採樣、Self-consistency 都屬於此。實戰：Claude Extended Thinking 就是經典 test-time compute 範例 — Judy AI Lab AI 詞彙庫

core beginner

什麼是 Test-time Compute（推理時運算）？

Test-time Compute 指「讓模型在回答問題時花更多算力，換取更好答案」的策略，是 2026 年 AI 領域最熱門的方向之一。

傳統 scaling law 認為要更聰明的模型就要訓練更大、餵更多資料；OpenAI o1 之後業界發現第二條路：模型大小固定，但讓它「思考更久」也能大幅提升表現。具體做法包括 Chain-of-thought 思考鏈、Best-of-N 採樣（生成多個答案再選最好）、Self-consistency、Tree-of-thoughts 等。

實戰：Claude Extended Thinking 就是經典 test-time compute 範例——同一個 Opus 模型，開了 thinking budget 後在複雜推理任務正確率明顯提升，代價是 token 用量翻數倍。實務上要根據任務難度動態調整 thinking budget，不是越多越好。

什麼是 Test-time Compute（推理時運算）？#

相關術語

訂閱 AI 週報，每週精選新知：

什麼是 Test-time Compute（推理時運算）？