DeepSeek開(kāi)啟價(jià)格戰(zhàn),小米火速跟進(jìn)降價(jià):國(guó)產(chǎn)大模型洗牌開(kāi)始了
昨日凌晨,小米MiMo大模型發(fā)布的一則公告,在開(kāi)發(fā)者群體里掀起了不小的波瀾。
公告的核心內(nèi)容十分明確:降價(jià),而且是力度極大的降價(jià)。

MiMo-V2.5系列的API價(jià)格做出永久調(diào)整,最高降幅達(dá)到了99%,同時(shí)不再對(duì)不同上下文窗口長(zhǎng)度區(qū)分定價(jià)。此前沿用的Credits積分計(jì)費(fèi)制度保留不變,同價(jià)位套餐的可用量提升了大約5到8倍。
如果站在行業(yè)全局的視角來(lái)看,這件事遠(yuǎn)不止一次普通促銷(xiāo)這么簡(jiǎn)單:這是DeepSeek V4刷新行業(yè)價(jià)格底價(jià)僅僅四天后,國(guó)產(chǎn)大模型賽道里出現(xiàn)的第一次“閃電式”跟進(jìn)降價(jià)。
在這場(chǎng)以“普惠”為名的行業(yè)變局背后,藏著國(guó)產(chǎn)大模型生存現(xiàn)狀的殘酷現(xiàn)實(shí),也暴露出行業(yè)對(duì)token價(jià)值的普遍認(rèn)知誤區(qū)。
01
DeepSeek定調(diào)價(jià)格,小米快速跟進(jìn)
不少AI行業(yè)觀(guān)察者都對(duì)小米的響應(yīng)速度感到驚訝。DeepSeek剛剛靠激進(jìn)定價(jià)擊穿了API價(jià)格底線(xiàn),小米就立刻跟進(jìn),把自家兩款對(duì)應(yīng)模型的價(jià)格調(diào)到和DeepSeek V4 Pro、V4 Flash完全一致。
這釋放出一個(gè)非常清晰的信號(hào):我此前一直判斷的國(guó)產(chǎn)AI行業(yè)第二次價(jià)格戰(zhàn),其實(shí)早已打響,而且已經(jīng)悄悄進(jìn)入了貼身肉搏的紅海階段。
客觀(guān)來(lái)看,所有人都必須承認(rèn)一個(gè)現(xiàn)實(shí):當(dāng)前國(guó)產(chǎn)大模型,和GPT-5.5、Opus 4.7這類(lèi)海外頂尖模型相比,依然存在短時(shí)間內(nèi)難以追趕的代差,而且這個(gè)差距未來(lái)還有可能進(jìn)一步拉大。
在“頂級(jí)通用智能”這個(gè)賽道,國(guó)產(chǎn)模型還在埋頭追趕;但在處理非復(fù)雜任務(wù)的規(guī)?;涞貓?chǎng)景里,不同國(guó)產(chǎn)模型的能力其實(shí)拉不開(kāi)絕對(duì)差距。
當(dāng)模型能力無(wú)法形成代差優(yōu)勢(shì)時(shí),投入產(chǎn)出比(ROI)就成了唯一的核心競(jìng)爭(zhēng)力。
DeepSeek已經(jīng)用接連幾次的大幅降價(jià)證明,在保持國(guó)內(nèi)第一梯隊(duì)性能的前提下,低價(jià)就是獲取流量、培養(yǎng)用戶(hù)替代習(xí)慣最有效的方式。
而小米的快速跟進(jìn),也坐實(shí)了另一個(gè)行業(yè)邏輯:在這場(chǎng)價(jià)格競(jìng)賽里,不跟進(jìn)降價(jià)的玩家只能眼睜睜看著用戶(hù)流失。國(guó)內(nèi)兩家頭部性能模型都做出了如此大力度的降價(jià),足以說(shuō)明過(guò)去不少?gòu)S商的API和訂閱定價(jià)水分很大。這已經(jīng)不是愿不愿意降價(jià)的選擇,而是不降價(jià)就會(huì)被淘汰的生存問(wèn)題。
02
高額度Credits數(shù)字背后的商業(yè)邏輯
雖然API價(jià)格出現(xiàn)了翻天覆地的調(diào)整,但小米此前推出訂閱服務(wù)時(shí)采用的Credits計(jì)費(fèi)單位,這次并沒(méi)有改動(dòng)。
從營(yíng)銷(xiāo)角度看,這確實(shí)是一個(gè)簡(jiǎn)單聰明的設(shè)計(jì):99元買(mǎi)5億token已經(jīng)很有吸引力,換成99元對(duì)應(yīng)110億Credits,聽(tīng)上去更是堪比福利的力度。
這種大額數(shù)字帶來(lái)的感知沖擊,能很大程度緩解用戶(hù)對(duì)“降價(jià)會(huì)不會(huì)縮水服務(wù)”的擔(dān)憂(yōu)。不過(guò)用戶(hù)還是應(yīng)該靜下心算一算,看清這套設(shè)計(jì)背后的商業(yè)思路。
小米能喊出最高降幅99%的說(shuō)法,很大程度是因?yàn)樵瓉?lái)的定價(jià)在DeepSeek的沖擊下顯得過(guò)于傳統(tǒng)偏高,為了對(duì)標(biāo)對(duì)手、留住用戶(hù),必須做出這種幅度的降價(jià)調(diào)整。

在訂閱服務(wù)方面,小米首創(chuàng)了國(guó)內(nèi)的Token Plan計(jì)費(fèi)模式,這種模式透明度和可解釋性更強(qiáng),現(xiàn)在已經(jīng)逐漸成為全球行業(yè)主流,官方稱(chēng)同價(jià)位套餐的token可用量提升了5-8倍。
以用戶(hù)訂閱最多、價(jià)格最低的Lite檔位為例,token可用量從原來(lái)的60M提升到了500M,折算下來(lái)單位成本降幅大約是88%,比API的降價(jià)幅度略低,檔位越高,成本下降的幅度也就越小。
這種差異其實(shí)很好理解,訂閱服務(wù)本身就是“批發(fā)價(jià)”,本來(lái)就比單獨(dú)調(diào)用API更劃算,不管?chē)?guó)內(nèi)外,有長(zhǎng)期使用需求的用戶(hù)都會(huì)優(yōu)先選擇訂閱。
所以小米這一套操作的目的已經(jīng)很清晰:通過(guò)把API價(jià)格降到和DeepSeek同一水平吸引流量,再用訂閱服務(wù)鎖定高頻使用的用戶(hù)。哪怕訂閱服務(wù)的折扣沒(méi)有API那么大,但DeepSeek目前沒(méi)有推出訂閱服務(wù),作為第二個(gè)推出Token Plan的廠(chǎng)商,小米的算力包已經(jīng)是當(dāng)前市面上性?xún)r(jià)比最高的選擇。
這種差異化的設(shè)計(jì),其實(shí)也是在引導(dǎo)用戶(hù)行為:它鼓勵(lì)用戶(hù)進(jìn)行高頻、重復(fù)的智能體調(diào)用,因?yàn)檫@類(lèi)場(chǎng)景下,小米的單位成本最低,用戶(hù)也能感受到最明顯的價(jià)格優(yōu)勢(shì)。
03
價(jià)格拉平后,token含金量才是勝負(fù)關(guān)鍵
當(dāng)不同模型的價(jià)格被拉到同一水平線(xiàn)之后,決定競(jìng)爭(zhēng)力的唯一指標(biāo),就變成了token實(shí)際能創(chuàng)造的生產(chǎn)力價(jià)值。
結(jié)合第三方機(jī)構(gòu)Artificial Analysis的測(cè)評(píng)和實(shí)際使用反饋來(lái)看,小米MiMo V2.5 Pro和DeepSeek V4 Pro有著完全不同的方向側(cè)重。

DeepSeek更偏向?qū)m?xiàng)優(yōu)勢(shì)選手:編程和邏輯推理能力要略微領(lǐng)先,而且占據(jù)用戶(hù)心智更早,現(xiàn)在是很多個(gè)人開(kāi)發(fā)者和小型創(chuàng)業(yè)團(tuán)隊(duì)的首選。但它的短板也很明顯,多模態(tài)能力的缺失,嚴(yán)重限制了應(yīng)用場(chǎng)景的拓展,目前僅有的識(shí)圖功能也只能滿(mǎn)足基礎(chǔ)需求,實(shí)際作用十分有限。
小米MiMo走的是全場(chǎng)景均衡路線(xiàn),模型發(fā)布時(shí)就明確標(biāo)注了全模態(tài)能力。在API定價(jià)相同的情況下,小米的token可以處理圖像、音頻、視頻這類(lèi)多模態(tài)交互任務(wù),對(duì)比只能處理文本的DeepSeek,在開(kāi)發(fā)智能體應(yīng)用上會(huì)有明顯優(yōu)勢(shì)。
這也是我之前反復(fù)強(qiáng)調(diào)的觀(guān)點(diǎn):多模態(tài)能力在智能體時(shí)代絕對(duì)不能忽視,反而應(yīng)該得到更高的重視。
那么小米敢大幅降價(jià)的底氣從哪里來(lái)?公告里提到的技術(shù)細(xì)節(jié),其實(shí)已經(jīng)透露出小米是怎么壓低單位token的推理成本。
SGLang HiCache和SWA(滑動(dòng)窗口注意力)這兩項(xiàng)技術(shù)最值得關(guān)注。簡(jiǎn)單來(lái)說(shuō),小米認(rèn)為大模型推理過(guò)程中,成本最高的環(huán)節(jié)就是GPU顯存里的KV緩存。
SWA技術(shù)讓模型不需要為了存儲(chǔ)幾萬(wàn)字前文的信息占用大量顯存,這也就能解釋為什么小米這次敢取消上下文窗口長(zhǎng)度的階梯定價(jià)。再加上多級(jí)存儲(chǔ)優(yōu)化,把數(shù)據(jù)在顯存、內(nèi)存、SSD之間的搬運(yùn)量降低到了原來(lái)的七分之一。
技術(shù)優(yōu)勢(shì)最終轉(zhuǎn)化成了定價(jià)的靈活空間。
當(dāng)小米能把緩存命中的開(kāi)銷(xiāo)降低到上一代模型的十分之一甚至百分之一時(shí),降價(jià)99%就不是賠本做慈善,也不只是營(yíng)銷(xiāo)操作,而是釋放技術(shù)紅利,同時(shí)淘汰那些技術(shù)架構(gòu)陳舊、降不下成本的競(jìng)爭(zhēng)對(duì)手。
04
別把token當(dāng)貨幣,智能本身才是價(jià)值
最后,不管是DeepSeek還是小米降價(jià),所有AI行業(yè)從業(yè)者都應(yīng)該注意到一個(gè)深層次的行業(yè)亂象。
現(xiàn)在的AI市場(chǎng)里,token好像被異化成了一種“計(jì)價(jià)貨幣”。過(guò)去兩個(gè)月里,已經(jīng)有企業(yè)開(kāi)始考核員工“每月消耗了多少token”,開(kāi)發(fā)者之間也開(kāi)始比拼token使用量。
但這本身就是一個(gè)錯(cuò)誤的認(rèn)知:token不是通用貨幣,不同模型的token價(jià)值完全不一樣。
比如GPT-5.5和Opus 4.7這類(lèi)頂級(jí)模型,它們的token價(jià)值更高,是因?yàn)樯倭縯oken就能完成復(fù)雜任務(wù),生產(chǎn)力密度非常高。
而能力不足的模型,哪怕給你按億算token,要是解決不了實(shí)際問(wèn)題,它的生產(chǎn)力價(jià)值也接近零。
前段時(shí)間,國(guó)內(nèi)外不少?gòu)S商趁著編程代理工具的熱潮漲價(jià),本質(zhì)上就是利用token概念的模糊性渾水摸魚(yú),讓不熟悉AI的用戶(hù)誤以為所有模型的token都是同價(jià)值的生產(chǎn)材料。
現(xiàn)在DeepSeek掀翻了原來(lái)的價(jià)格桌子,小米進(jìn)一步鎖死了價(jià)格空間。兩家企業(yè)動(dòng)作的本質(zhì),是讓token回歸了它本來(lái)的定位:作為一種廉價(jià)的“數(shù)字工業(yè)耗材”,它必須足夠便宜,才能支撐AI應(yīng)用的大規(guī)模落地。
大模型的第二次價(jià)格戰(zhàn)已經(jīng)悄然開(kāi)啟,這次價(jià)格被打下來(lái)之后,絕不會(huì)像上一次價(jià)格戰(zhàn)結(jié)束那樣輕易漲回去。對(duì)于那些還抱著高價(jià)不放、又拿不出頂尖能力的廠(chǎng)商來(lái)說(shuō),行業(yè)寒冬可能比預(yù)想中來(lái)的更快。

最后,小米公告里的結(jié)尾值得分享給每一個(gè)人:技術(shù)的價(jià)值,最終要體現(xiàn)在被使用的廣度上。
當(dāng)token不再昂貴,國(guó)產(chǎn)大模型才能真正從實(shí)驗(yàn)室的測(cè)試樣本,變成每個(gè)人都能隨時(shí)取用的數(shù)字基礎(chǔ)設(shè)施,就像水和電一樣。
而這場(chǎng)圍繞智能價(jià)值的行業(yè)洗牌,才剛剛拉開(kāi)序幕。
本文來(lái)自微信公眾號(hào)“硅基星芒”,作者:思齊,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀(guān)點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





