欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

AI算力需求激增 云廠商與AI企業(yè)集體開(kāi)啟漲價(jià)模式

03-24 06:42
智能體AI對(duì)算力的消耗呈爆發(fā)式增長(zhǎng)。

曾有人調(diào)侃:“要搞垮一家AI公司,只需上調(diào)其調(diào)用的API接口價(jià)格。”盡管這種極端情況尚未發(fā)生,但作為AI領(lǐng)域“賣鏟人”的云計(jì)算巨頭與大模型廠商,已紛紛啟動(dòng)漲價(jià)策略。


近期,阿里云與百度智能云兩大行業(yè)巨頭同步宣布漲價(jià),針對(duì)AI算力、存儲(chǔ)等相關(guān)產(chǎn)品上調(diào)價(jià)格,最高漲幅超30%。促使這兩家曾深陷“價(jià)格戰(zhàn)”的云廠商逆勢(shì)提價(jià)的核心原因,是持續(xù)攀升的算力需求給核心硬件及相關(guān)基礎(chǔ)設(shè)施成本帶來(lái)了巨大壓力。


這并非個(gè)例。在此之前,騰訊云智能體開(kāi)發(fā)平臺(tái)已宣布優(yōu)化部分模型的計(jì)費(fèi)策略,大模型廠商智譜也上調(diào)了旗下大模型的API調(diào)用價(jià)格。更早之前,今年亞馬遜云、谷歌等國(guó)際巨頭已悄然漲價(jià)。


追根溯源,AI市場(chǎng)中活躍的“小龍蝦們”(以O(shè)penClaw為代表的智能體應(yīng)用)難辭其咎。


2026年被稱為“AI應(yīng)用元年”。自今年年初起,一款可本地部署的AI智能體OpenClaw,讓用戶見(jiàn)識(shí)到AI在工作場(chǎng)景中的強(qiáng)大能力,普通用戶爭(zhēng)相嘗試,大廠也紛紛跟進(jìn),其帶來(lái)的沖擊不亞于幾年前的ChatGPT。


AI應(yīng)用爆發(fā)的背后,是對(duì)云服務(wù)器與大模型調(diào)用的高度依賴。指數(shù)級(jí)增長(zhǎng)的Token產(chǎn)生的成本賬單,讓此前靠免費(fèi)或低價(jià)維系用戶的大模型廠商最先感受到壓力,這種壓力隨后傳導(dǎo)至AI算力核心的云服務(wù)廠商和大模型服務(wù)商。


當(dāng)前的漲價(jià)主要源于短期算力缺口,而表象之下,是AI正逐漸成為剛需生產(chǎn)力。未來(lái),不僅企業(yè)用戶,專業(yè)個(gè)人用戶也需為T(mén)oken付費(fèi)。


云廠商與AI廠商開(kāi)啟漲價(jià)周期


3月18日,百度智能云官網(wǎng)發(fā)布AI算力、存儲(chǔ)等產(chǎn)品調(diào)價(jià)公告。公告稱,自4月18日起,AI算力相關(guān)產(chǎn)品服務(wù)價(jià)格上調(diào)約5%-30%,并行文件存儲(chǔ)等價(jià)格上調(diào)約30%。


調(diào)價(jià)原因是受全球人工智能應(yīng)用快速發(fā)展影響,算力需求持續(xù)攀升,核心硬件及相關(guān)基礎(chǔ)設(shè)施成本顯著上漲。為保障平臺(tái)長(zhǎng)期穩(wěn)定運(yùn)行與服務(wù)質(zhì)量,百度智能云對(duì)部分產(chǎn)品價(jià)格進(jìn)行結(jié)構(gòu)性優(yōu)化。


同日,阿里云官網(wǎng)也發(fā)布漲價(jià)公告,平頭哥真武810E等算力卡產(chǎn)品價(jià)格上漲5%—34%,文件存儲(chǔ)CPFS(智算版)上漲30%。原因是全球AI需求爆發(fā)、供應(yīng)鏈漲價(jià),導(dǎo)致行業(yè)核心硬件采購(gòu)成本顯著上升。


感受到算力成本壓力的還有騰訊云。


騰訊云此前宣布自3月13日起調(diào)整智能體開(kāi)發(fā)平臺(tái)部分AI模型的計(jì)費(fèi)策略,本次調(diào)整主要涉及兩類變更:模型價(jià)格調(diào)整與公測(cè)模型結(jié)束免費(fèi)。


根據(jù)公告,具體安排為:一是公測(cè)模型結(jié)束免費(fèi),GLM 5、MiniMax 2.5、Kimi 2.5模型將于3月13日結(jié)束免費(fèi)公測(cè),轉(zhuǎn)為正式商用服務(wù);二是對(duì)混元系列模型Tencent HY2.0 Instruct與Tencent HY2.0 Think服務(wù)進(jìn)行漲價(jià),部分模型漲幅超4倍。



此外,騰訊云還宣布將于3月18日起,對(duì)視頻處理、視頻轉(zhuǎn)碼、綜藝視頻片段拆分等3款插件啟動(dòng)商業(yè)化計(jì)費(fèi),從免費(fèi)提供轉(zhuǎn)為套餐付費(fèi)模式。


顯然,在小龍蝦智能體爆火后,Token消耗翻了四倍多,騰訊云也難以承受成本壓力,此舉是為了將價(jià)格拉回合理區(qū)間。


至此,國(guó)內(nèi)三大云巨頭均已啟動(dòng)漲價(jià)策略。今年1月,亞馬遜AWS宣布對(duì)用于大模型訓(xùn)練的EC2機(jī)器學(xué)習(xí)容量塊實(shí)施15%的價(jià)格上調(diào)。同月,谷歌云對(duì)CDN Interconnect、Direct Peering等數(shù)據(jù)傳輸服務(wù)價(jià)格進(jìn)行了大幅調(diào)整。這與云廠商“價(jià)格戰(zhàn)”的市場(chǎng)印象形成了一定反差。


與此同時(shí),大模型廠商也已上調(diào)大模型API調(diào)用費(fèi)用。3月16日,智譜在發(fā)布最新大模型的同時(shí),將GLM-5-Turbo的API價(jià)格上調(diào)20%。而在一個(gè)月前,智譜在正式推出新一代旗艦?zāi)P虶LM-5的第二天,就上調(diào)了GLM Coding Plan套餐價(jià)格,其中中國(guó)區(qū)漲價(jià)30%,海外版漲價(jià)超100%。一個(gè)月內(nèi)兩次漲價(jià),使得智譜新一代大模型較上一代產(chǎn)品的漲價(jià)幅度達(dá)到83%。


自云計(jì)算商用以來(lái),持續(xù)降價(jià)在用戶看來(lái)是物理規(guī)律和邊際成本等因素共同作用的必然結(jié)果。大模型也類似,早期憑借低價(jià)甚至免費(fèi)吸引用戶,隨著算力效率提升來(lái)降低邊際成本。


兩年前,包括阿里云、百度云以及騰訊云等國(guó)內(nèi)主要云廠商紛紛卷入價(jià)格戰(zhàn),行業(yè)進(jìn)入“以價(jià)換量”階段。尤其是在大模型爆發(fā)前期,云廠商需要通過(guò)價(jià)格戰(zhàn)吸引開(kāi)發(fā)者及企業(yè)用戶入駐。


但云廠商的這種默契,被智能體應(yīng)用的突然爆發(fā)打破。


AI應(yīng)用爆發(fā) 算力消耗猛增


這一切的“元兇”,正是那只“小龍蝦”(OpenClaw)掀起的AI應(yīng)用普及浪潮。


過(guò)去幾年,AI的能力升級(jí)有目共睹。從ChatGPT開(kāi)始,市場(chǎng)對(duì)人工智能的想象力逐漸釋放。國(guó)內(nèi)科技產(chǎn)業(yè)界也卷入大模型開(kāi)發(fā),試圖從聊天機(jī)器人中發(fā)掘更多可能,機(jī)器人、工作助手、智能搜索等行業(yè)都開(kāi)啟了變革。如今OpenClaw的出現(xiàn),再次拓展了人類對(duì)AI的認(rèn)知,AI正真正開(kāi)始介入普通人的工作。


據(jù)了解,OpenClaw可部署在本地設(shè)備(如電腦、服務(wù)器),支持通過(guò)通訊軟件(如微信、Telegram)下達(dá)指令,實(shí)現(xiàn)文件管理、郵件發(fā)送、網(wǎng)頁(yè)操作等自動(dòng)化任務(wù)。用戶可自定義技能模塊(Skills),賦予AI數(shù)據(jù)分析、內(nèi)容創(chuàng)作等特定能力。


從技術(shù)原理來(lái)看,OpenClaw本身不依賴特定大模型,需接入外部大模型完成指令理解和任務(wù)執(zhí)行。它通過(guò)“規(guī)劃-執(zhí)行-觀察”循環(huán)模式,結(jié)合大模型能力實(shí)現(xiàn)復(fù)雜任務(wù)自動(dòng)化。


這意味著,以O(shè)penClaw為代表的智能體和眾多AI應(yīng)用,將大模型帶入了推理時(shí)代。


與之前的對(duì)話式通用大模型不同,OpenClaw以任務(wù)為導(dǎo)向,通常涉及多輪理解、任務(wù)拆解、工具調(diào)用、狀態(tài)銜接、時(shí)間觸發(fā)和持續(xù)執(zhí)行的長(zhǎng)鏈路工作流。這使得智能體在實(shí)際場(chǎng)景中會(huì)反復(fù)消耗Token。


數(shù)據(jù)顯示,OpenClaw用戶的單日人均Token消耗量是傳統(tǒng)聊天用戶的20-50倍。“小龍蝦”爆火后,國(guó)內(nèi)AI模型調(diào)用量自春節(jié)后持續(xù)飆升,阿里云百煉平臺(tái)在1-3月創(chuàng)下歷史最高增速。目前中國(guó)主流大模型日均Token從2024年初的1000億飆升至2026年的180萬(wàn)億,谷歌月處理超1300萬(wàn)億,字節(jié)、阿里等平臺(tái)調(diào)用量同比增長(zhǎng)10倍以上。


因此,以“開(kāi)源免費(fèi)”吸引用戶的OpenClaw,實(shí)際使用成本遠(yuǎn)比想象中復(fù)雜,AI應(yīng)用的運(yùn)轉(zhuǎn)也開(kāi)啟了Token時(shí)代的新格局。


AI全民化普及 推動(dòng)巨頭策略轉(zhuǎn)向


在AI應(yīng)用引發(fā)的暫時(shí)性算力缺口影響下,云廠商與大模型廠商被迫轉(zhuǎn)變策略。


Token在新一輪AI潮流中占據(jù)了重要地位。Token即詞元,是大語(yǔ)言模型處理信息的基本單位,指數(shù)據(jù)進(jìn)入模型前,經(jīng)切分、編碼或量化得到的基本處理單元,如文本子詞和圖片像素方塊。AI每一次接收和處理人類信息,背后都是Token的“燃燒”。


如今,AI產(chǎn)業(yè)已將Token置于前所未有的重要位置。


3月16日下午,阿里巴巴宣布成立Token事業(yè)群,由CEO吳泳銘直接負(fù)責(zé),阿里將全面進(jìn)軍智能體AI時(shí)代。該事業(yè)群的核心目標(biāo)是“創(chuàng)造Token、輸送Token、應(yīng)用Token”。


數(shù)小時(shí)后,英偉達(dá)CEO黃仁勛在GTC 2026上也提出了一套Token經(jīng)濟(jì)學(xué),他指出在AI產(chǎn)業(yè)中,數(shù)據(jù)中心正從訓(xùn)練模型的場(chǎng)所,轉(zhuǎn)變?yōu)樯a(chǎn)Token的工廠。


如果說(shuō)移動(dòng)互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)流量是行業(yè)晴雨表,那么在AI時(shí)代,Token就是風(fēng)向標(biāo)。


“小龍蝦”爆火的背后,是專業(yè)人士看到了智能體“干活”的新奇之處以及對(duì)高效率的渴望。OpenClaw也在中國(guó)帶火了一個(gè)“蝦圈”,云端、移動(dòng)端各類“蝦”層出不窮,騰訊甚至在半個(gè)月內(nèi)將旗下QQ、微信、企微和元寶都作為“龍蝦”部署渠道,打造了智能體矩陣。


由智能體普及帶來(lái)的算力供不應(yīng)求開(kāi)啟了漲價(jià)周期,這似乎成為云廠商新一波紅利的開(kāi)始。但實(shí)際上,這只是云廠商暫時(shí)性的供需錯(cuò)配。早期大模型產(chǎn)品不斷推新,“訓(xùn)練”成為云廠商最主要的業(yè)務(wù)。而到了AI應(yīng)用階段,推理成為主角,云廠商早期因部署大量訓(xùn)練芯片而在推理環(huán)節(jié)面臨冗余挑戰(zhàn),才導(dǎo)致“小龍蝦們”的算力需求“不夠吃”。


當(dāng)Token效率問(wèn)題暴露后,接下來(lái)需要從大模型底層進(jìn)行進(jìn)化升級(jí),并探索新時(shí)代Token經(jīng)濟(jì)的新商業(yè)模式。


此前,智譜推出基于GLM-5-Turbo的“龍蝦Claw套餐”,包含個(gè)人版和Team版。企業(yè)可通過(guò)Team版,根據(jù)實(shí)際員工規(guī)模靈活訂閱,以可預(yù)期的成本實(shí)現(xiàn)Token的充分保障以及AI員工的穩(wěn)定在線。


隨著智能體應(yīng)用的真正落地,成熟的AI生態(tài)正在形成。未來(lái),當(dāng)上游云廠商看到下游活躍的無(wú)數(shù)只“龍蝦”,或許會(huì)重新定義自己的角色。


本文來(lái)自微信公眾號(hào)“獵云精選”,作者:邵延港,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com