過去這一週,我這邊追的AI硬體新聞加起來,全球一週砸進去的資金超過6100億美元。

不是估值,不是市值,是實打實的資本支出承諾。南韓5500億、日本60億、加上高通新加速器、川崎重工10億美元AI基建發債,這一輪動作規模已經超過2000年dot-com泡沫最瘋那半年。但這次錢不是流向網頁,是流向晶片、記憶體、電力。我這幾天邊看邊想,對投資者、對我們這種在AI上做產品的構築師,這場豪賭到底代表什麼。

AI訓練瓶頸真相:從GPU荒→記憶體荒→電力荒

說實話,大家看AI都盯著模型,但真正卡脖子的一直不是模型,是硬體。

從2023到2025,瓶頸從GPU荒轉到記憶體荒,現在正往電力荒推。GPU吃緊,大家搶H100,NVIDIA賺爆,但H100真正卡住的零件不是GPU核心,是HBM高頻寬記憶體。B200上面貼的HBM3E,SK海力士產能被NVIDIA全鎖走,三星拚命追但良率跟不上。

這就是為什麼南韓一次砸5180億美元建4座記憶體晶圓廠+520億中部,總計5500億美元(TechCrunch)。這不只是補上游產能,關鍵是三星+SK海力士要把自己從NVIDIA的下游供應商,反手變成AI硬體的主導方。

為什麼下游硬體投資這麼晚才啟動?因為前兩年大家還在觀望「這輪AI熱是不是又要退燒」。到了2026年,GPT-6、Claude 4、Gemini 3全上,推理成本壓下來、使用者量真的起來,才有人敢押10年+產能。日本也砸60億美元支援軟銀主導的AI模型開發(Nikkei),川崎重工發債10億切AI基建。東亞是把「AI主權」當國家層級議題在推。

高通的挑戰:繞開HBM意味什麼

然後,高通這一步很有意思。

高通7月初發布的新AI加速器系列,主打「不依賴HBM」(Qualcomm),走LPDDR+片上SRAM組合,聽起來像妥協,實際是一條完全不同的路。

如果這條路走通,對整個生態的意義有三層。

第一層,NVIDIA的技術壁壘被繞開一段。H100/B200靠的不只是CUDA,是CUDA+HBM+NVLink這整套鎖死的組合,HBM被繞開,「AI推理必買NVIDIA」的邏輯就鬆掉一角。

第二層,對臺積電更微妙。NVIDIA的B200在臺積電4nm,高通新加速器也在臺積電,三星、SK海力士的HBM封裝要送臺積電做CoWoS。不管誰贏,臺積電這輪都吃到單,這是我覺得它比NVIDIA更適閤中長期押注的原因。

第三層,對做AI應用的人影響最實在。高通若能把推理成本壓到NVIDIA同級的三分之一,搞不好我們現在用OpenAI/Anthropic API的成本半年後直接掉一半,今天所有「因為API太貴不敢做」的產品構想,都會被翻出來重做一次。

4個投資+構築師實務判斷

所以我整理成4個判斷。

第一,別追NVIDIA短期高點。上一輪一天蒸發600B+市值的教訓還沒消化完,估值已經price in未來3年的完美執行,任何節點沒達到,回撤都不會小。

第二,臺積電雙邊受惠。幫韓國做HBM封裝、幫NVIDIA做B200、幫高通做新加速器,誰打誰它都在收單。

第三,AI應用開發者不用等硬體洗牌。你現在用OpenAI/Anthropic API做的產品,底層硬體換誰對你都是透明的,遷移成本接近零,等的人才會錯過視窗。

第四,接下來6個月盯兩個訊號:電力(美國各州資料中心用電許可、日韓核電重啟進度)+HBM4量產時程(2027 Q2是關鍵)。

結尾:資金會流出泡沫,基礎建設會留下

這是dot-com破掉之後,單一sector最大的一次全球資金投入。有些泡沫成分,但底層需求真的在。錢會流出泡沫,但流出來的時候,基礎建設會真的留下,不像2000年那時候光留下光纖沒人用。這輪留下來的,是往後10年AI跑的地基。我在做的所有產品,都是在這個假設上下注。