OpenAI 與 Broadcom 聯手推出專為大型語言模型推論優化的自研晶片

📰 重點摘要

OpenAI 與博通（Broadcom）攜手推出名為 Jalapeño 的客製化 AI 晶片，專門針對大型語言模型（LLM）的推理階段（inference）而設計。與通用 GPU 不同，Jalapeño 從架構層面就針對 LLM 推理的運算特性進行優化，目標是在同等或更低的硬體成本下，顯著提升推理效能與能源效率，同時支援更大規模的 AI 系統部署。這次合作代表 OpenAI 在自研晶片路線上邁出重要一步，不再完全依賴第三方通用晶片供應商，而是透過與博通的深度合作，將推理工作負載的硬體需求內化為客製設計。目前原文摘要未揭露具體的效能數字、製程節點或量產時程，詳細技術規格與部署計畫請見原文連結。

💬 JudyAI Lab 觀點

OpenAI選擇與博通合作打造專屬推理晶片Jalapeño，代表AI頭部公司正式從「用現成GPU」轉向「為推理場景定製硬體」的路線切換，這個訊號值得整個AI產業認真看待。

長期以來，LLM推理成本是商業落地的隱形天花板。通用GPU的設計初衷是圖形計算，拿來跑推理工作負載，資源浪費集中在記憶體頻寬與計算模式的不匹配。Jalapeño的切入點就是針對這個問題從架構層面重新設計——根據原文摘要，目標是以同等甚至更低的硬體成本，顯著提升推理效能與能源效率。對我們這些透過API呼叫模型的AI builder來說，這個趨勢有一個重要的結構性啟示：推理成本的下降不只靠軟體最佳化，硬體這一層正在被主力玩家重塑。OpenAI選擇「內化硬體需求」而非繼續依賴第三方通用晶片，說明推理成本已經大到讓自研變得合理。

現在可以思考的是：你的產品對推理成本的敏感度有多高？若成本結構性下降，你的競爭優勢會變強，還是被稀釋？

📅 原文資訊

發布時間：2026-06-24T06:00
來源原文：https://openai.com/index/openai-broadcom-jalapeno-inference-chip

📰 重點摘要#

💬 JudyAI Lab 觀點#

📅 原文資訊#

🔗 延伸閱讀#

訂閱 AI 週報，每週精選新知：

📰 重點摘要

💬 JudyAI Lab 觀點

📅 原文資訊

🔗 延伸閱讀