什麼是 Test-time Compute(推理時運算)?
Test-time Compute 指「讓模型在回答問題時花更多算力,換取更好答案」的策略,是 2026 年 AI 領域最熱門的方向之一。
傳統 scaling law 認為要更聰明的模型就要訓練更大、餵更多資料;OpenAI o1 之後業界發現第二條路:模型大小固定,但讓它「思考更久」也能大幅提升表現。具體做法包括 Chain-of-thought 思考鏈、Best-of-N 採樣(生成多個答案再選最好)、Self-consistency、Tree-of-thoughts 等。
實戰:Claude Extended Thinking 就是經典 test-time compute 範例——同一個 Opus 模型,開了 thinking budget 後在複雜推理任務正確率明顯提升,代價是 token 用量翻數倍。實務上要根據任務難度動態調整 thinking budget,不是越多越好。