什麼是 Reasoning Model(推理模型)?
Reasoning Model 是會「先思考再回答」的 LLM。傳統 LLM 收到問題後直接逐 token 吐答案;Reasoning Model 會先在內部產生一長串思考鏈(Chain-of-thought),把問題拆解、嘗試、回溯、驗證,最後才給使用者最終答案。OpenAI o1/o3、Claude Opus Extended Thinking、Gemini Thinking、DeepSeek R1 都屬於這類。
實戰經驗:複雜交易策略推導、多步驟 debug、數學證明、需要規劃的 Agent 任務,用 Reasoning Model 比一般 LLM 準很多。代價是回應更慢、token 用量更高、API 更貴,所以我們在 J 主管和交易研究用 Opus + Extended Thinking,日常聊天和摘要用 Sonnet 或 Haiku。