GPT-5.5漲價翻倍,Gemini暴漲三倍:當前AI漲價潮還能持續(xù)多久?
AI前沿大模型的這場漲價博弈,究竟還能走多遠?
從今年一月開始,全球GPU租賃價格漲幅已經(jīng)超過兩倍。

根據(jù)Counterpoint在今年2月推出的《內(nèi)存價格追蹤報告》數(shù)據(jù),2026年第一季度至今,內(nèi)存價格環(huán)比上漲幅度已經(jīng)達到80%-90%,創(chuàng)下了歷史最大漲幅記錄。

上游成本的暴漲,已經(jīng)直接傳導(dǎo)到了AI行業(yè)的下游終端。
AI研究機構(gòu)Epoch AI最新發(fā)布的《梯度更新》報告做了一個直白測算:把全球所有Blackwell芯片的算力加總,算出能處理的Token總量,再和當前市場的實際需求做比對。
最終結(jié)論很殘酷——供給完全跟不上需求。
暴漲的Token需求已經(jīng)吞噬了算力供給
先看供給端的情況。
Epoch AI的測算以Kimi K2.6大模型為基準,該模型是擁有萬億總參數(shù)、320億活躍參數(shù)的MoE架構(gòu)。

在輸入輸出比為8000:1000的標準場景下,全球所有Blackwell芯片集群的理論吞吐量極限,是每秒約200億輸出Token。
這個數(shù)字聽起來很大?換算一下,相當于全球每個人每月能分到700萬Token。

但這只是理想場景下的理論值。如果把上下文窗口拉長到現(xiàn)在常用的128k,Blackwell的吞吐量會直接暴跌50倍,降到每秒僅約5億輸出Token。
再來看需求端。
Google不久前披露,自家產(chǎn)品現(xiàn)在每秒就要處理約12億Token(包含輸入+輸出)。
按照行業(yè)常見的8k輸入對應(yīng)1k輸出的請求比例換算,Google每秒的輸出Token需求約為1.3億。Exponential View估算,Google的需求大約占全球總Token需求的25%。

也就是說,以現(xiàn)在的需求來看,把全球所有Blackwell芯片全產(chǎn)能拉滿,全部用來跑大模型,也只是剛好能勉強撐住。
那需求現(xiàn)在的增長速度是多少呢?
每年10倍。
從2024年開始,Google處理的Token量每年增長10倍,其他AI服務(wù)商的增長速度也基本和這個水平一致。
反觀供給側(cè)呢?全球AI算力每年只增長3.4倍,芯片內(nèi)存帶寬的年增速也只有4.1倍。

供給年增3.4倍對上需求年增10倍,供需缺口每年都在被越拉越大。
Meta員工日均消耗百萬Token,企業(yè)端需求已經(jīng)爆炸
算力緊缺從來不是抽象的數(shù)字,已經(jīng)真實發(fā)生在企業(yè)日常運營中。
看看頭部科技公司內(nèi)部的情況就知道了。
The Information報道顯示,Meta的8.5萬名員工,每個月就要消耗掉60萬億Token。

換算下來,Meta每一位員工平均每天就要燒掉約100萬輸出Token。

Apple的消耗規(guī)模更驚人。
Apple部分工程團隊,每天的Token使用預(yù)算就高達300美元——按照Kimi K2.6的定價計算,這筆錢足夠一個人生成2500萬輸出Token。

這還只是兩家頭部公司的消耗。
現(xiàn)在全球大約有1400萬軟件工程師每天都在使用AI工具。
如果所有工程師的使用強度都達到Meta或者Apple員工的水平,全球Token吞吐需求將會直接飆升到每秒2億到40億Token。
40億的需求,對比Blackwell在長上下文場景下5億每秒的極限供給,差了整整一個數(shù)量級。
漲價持續(xù),但增長開始放緩
更值得玩味的變化已經(jīng)出現(xiàn)。
METR最新研究結(jié)果顯示,Claude Code在實際開發(fā)測試中,反而讓資深開發(fā)者的任務(wù)完成速度變慢了19%。
同時,VS Code相關(guān)AI編碼插件的安裝增速,從今年年初開始就已經(jīng)明顯放緩。

編碼AI工具增長放緩,背后其實是兩個因素的疊加:一方面是算力資源本身已經(jīng)捉襟見肘,另一方面很多企業(yè)今年的AI預(yù)算已經(jīng)提前花完。

和增長放緩形成鮮明對比的,是前沿大模型的一輪接一輪漲價:ChatGPT Pro上調(diào)訂閱價格,Claude API價格持續(xù)上漲,Gemini的漲幅最夸張,部分場景價格直接暴漲3倍,GPT-5.5的定價更是直接翻倍。

現(xiàn)在企業(yè)用AI,用量越來越大、花費越來越高,但獲得的效果卻不一定能跟上成本漲幅,這筆賬企業(yè)很快就算明白了。
高性價比替代方案成新選擇,前沿模型定價權(quán)動搖
市場已經(jīng)出現(xiàn)了新的分流路線,很多企業(yè)開始轉(zhuǎn)向高性價比的替代方案。
DeepSeek V3的訓練成本只有頭部前沿模型的1/10到1/20,API價格更是低到同類前沿產(chǎn)品的1/16。

那性能呢?DeepSeek V3的實際表現(xiàn)已經(jīng)逼近GPT-5的水平。
國外技術(shù)社區(qū)Hacker News上有一個熱門帖子,創(chuàng)作者做了一個11個月回本的投資回報模型,幫企業(yè)算清楚:從GPT-5.5切換到DeepSeek,每年能省下多少成本。

評論區(qū)的開發(fā)者和企業(yè)管理者形成了一個共識:前沿大模型的定價權(quán)正在逐步崩塌。
當一個高性價比模型只用1/16的價格,就能跑出頭部模型90%的效果,漲價對頭部模型來說就不再是利潤增長的手段,反而會變成加速客戶流失的推手。
本來,「企業(yè)不斷增加Token用量榨取AI價值」是前沿大模型廠商的核心增長邏輯,但現(xiàn)在The Information的報道顯示,這種增長邏輯已經(jīng)開始反噬AI廠商自身的利潤空間。
用戶越多,虧損越多;靠漲價止血,用戶就會流向替代方案。這已經(jīng)形成了典型的死亡螺旋。

AI行業(yè)走到算力經(jīng)濟懸崖邊,格局正在重塑
把視角拉遠來看整個行業(yè)。
當前全球的AI算力里,OpenAI、Anthropic、Google DeepMind這些頂級前沿實驗室,只占據(jù)了20%-30%的份額。
剩下70%-80%的算力,都掌握在企業(yè)自用算力、云服務(wù)商、推理服務(wù)商手里。
這也就意味著,哪怕是最頂級的AI實驗室,也沒辦法靠自建算力填滿供需缺口,它們和所有參與者一樣,都在搶同一批芯片產(chǎn)能。
算力年增3.4倍,需求年增10倍,這個供需剪刀差不會自動消失。
確實,小模型已經(jīng)在替代一部分市場需求,蒸餾模型生態(tài)的崛起就能證明這一點,但模型能力提升又在不斷催生新的更大需求,缺口依然無法填補。
現(xiàn)在整個AI行業(yè)其實已經(jīng)站在了懸崖邊上,這不是技術(shù)能力的懸崖——大模型的能力還在不斷變強,這是經(jīng)濟模型的懸崖,現(xiàn)在的商業(yè)邏輯已經(jīng)算不通了。
當GPU租金翻倍上漲、API價格接連暴漲、開源高性價比替代品性能逼近頭部、企業(yè)開始質(zhì)疑AI編碼工具的投資回報,一個核心問題已經(jīng)被拋到了行業(yè)面前:
前沿大模型的核心護城河,到底是模型本身的智能,還是堆出來的算力?
如果答案是算力,那么控制芯片產(chǎn)能的玩家,就能掌控AI的未來;如果答案是模型智能,那么DeepSeek用1/16的成本就能逼近同等效果,已經(jīng)動搖了這個結(jié)論。
參考資料:
https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025
https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610
本文來自微信公眾號“新智元”,作者:ASI啟示錄;編輯:大衛(wèi),36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





