小米MiMo跟進(jìn)DeepSeek降價(jià)99%,國(guó)產(chǎn)大模型正式踏入成本競(jìng)爭(zhēng)新階段
本文來(lái)自微信公眾號(hào):觀網(wǎng)財(cái)經(jīng) ,作者:陳濟(jì)深
5月27日,小米創(chuàng)始人雷軍在微博轉(zhuǎn)發(fā)了小米MiMo-V2.5系列API降價(jià)的官方消息。
根據(jù)小米MiMo發(fā)布的官方公告,從5月27日零時(shí)開(kāi)始,MiMo-V2.5系列API正式開(kāi)啟永久降價(jià),最高降幅達(dá)到99%,同時(shí)官方取消了過(guò)去按照上下文窗口長(zhǎng)度分檔計(jì)價(jià)的規(guī)則。配套的Token Plan計(jì)費(fèi)體系也同步完成調(diào)整,同等價(jià)格下用戶(hù)可獲得的token用量提升至原來(lái)的5到8倍,目前仍在有效期內(nèi)的用戶(hù)額度也做了統(tǒng)一重置。
雷軍在轉(zhuǎn)發(fā)微博時(shí)特意強(qiáng)調(diào),本次價(jià)格調(diào)整“最高降幅達(dá)到99%,不再區(qū)分上下文窗口”。

99%的降價(jià)幅度足夠吸引眼球,但更值得行業(yè)關(guān)注的是調(diào)價(jià)后MiMo-V2.5-Pro的三項(xiàng)核心定價(jià):輸入緩存命中價(jià)格為0.025元/百萬(wàn)tokens,輸入緩存未命中為3元/百萬(wàn)tokens,輸出價(jià)格為6元/百萬(wàn)tokens。
這三組定價(jià)數(shù)字,和五天前DeepSeek敲定的V4-Pro長(zhǎng)期價(jià)格完全一致。

DeepSeek V4系列在4月25日正式上線(xiàn),當(dāng)時(shí)V4-Pro的首發(fā)定價(jià)為輸入緩存命中1元/百萬(wàn)tokens。上線(xiàn)僅僅一天后,DeepSeek就宣布將全系A(chǔ)PI的輸入緩存命中價(jià)格下調(diào)至首發(fā)價(jià)的十分之一,同時(shí)V4-Pro還疊加了2.5折的限時(shí)優(yōu)惠,優(yōu)惠后緩存命中價(jià)格降到了0.025元/百萬(wàn)tokens。原本這項(xiàng)優(yōu)惠計(jì)劃在5月5日結(jié)束,之后被延期到了5月31日。到5月22日晚間,DeepSeek直接宣布這項(xiàng)2.5折優(yōu)惠不再設(shè)時(shí)限,改為永久生效。一個(gè)月內(nèi)連續(xù)調(diào)整價(jià)格,也讓DeepSeek V4-Pro的初始“原價(jià)”更像是一個(gè)只短暫存在的定價(jià)參考。
DeepSeek官方價(jià)格頁(yè)面顯示,5月31日優(yōu)惠活動(dòng)結(jié)束后,V4-Pro將正式把定價(jià)調(diào)整為原定價(jià)的四分之一。調(diào)價(jià)完成后,V4-Pro的定價(jià)就是輸入緩存命中0.025元/百萬(wàn)tokens,輸入緩存未命中3元/百萬(wàn)tokens,輸出6元/百萬(wàn)tokens,和小米本次調(diào)價(jià)后的定價(jià)完全相同。
也就是說(shuō),小米MiMo這次并不是單純的常規(guī)降價(jià),而是直接把自家Pro檔模型的定價(jià),對(duì)齊到了DeepSeek剛剛定下的行業(yè)價(jià)格基準(zhǔn)上。
這個(gè)動(dòng)作也讓本次降價(jià)超出了普通品牌促銷(xiāo)的范疇,引發(fā)了行業(yè)更多聯(lián)想。
值得注意的是,小米本次降價(jià)剛好發(fā)生在上一輪MiMo開(kāi)發(fā)者激勵(lì)結(jié)束之后。根據(jù)官方公告,從4月28日啟動(dòng)的100T Token創(chuàng)作者激勵(lì)計(jì)劃,已經(jīng)在5月26日提前發(fā)放完畢。對(duì)MiMo來(lái)說(shuō),推出永久降價(jià)同時(shí)重置Token Plan額度,不只是降低開(kāi)發(fā)者的嘗試門(mén)檻,更是打算在免費(fèi)Token的紅利結(jié)束后,繼續(xù)承接Agent框架和應(yīng)用開(kāi)發(fā)者的生態(tài)需求。
過(guò)去大模型API的定價(jià)邏輯更多是“能力溢價(jià)”:模型能力越接近閉源前沿水平,越能在代碼生成、邏輯推理、長(zhǎng)上下文處理、Agent搭建這類(lèi)場(chǎng)景中證明自身能力,廠商就越有理由維持更高的定價(jià)。
但DeepSeek和小米MiMo的這兩輪降價(jià),透露出新的定價(jià)邏輯正在成型:模型服務(wù)不再只按照“能力強(qiáng)弱”定價(jià),也開(kāi)始受到“單次推理成本能壓縮到多低”的約束。
成本能壓到這么低,背后是推理系統(tǒng)效率的持續(xù)優(yōu)化。小米MiMo在公告中解釋?zhuān)夹g(shù)團(tuán)隊(duì)基于SGLang HiCache完整支持SWA,把KV Cache在GPU顯存、CPU內(nèi)存、SSD多級(jí)存儲(chǔ)之間的數(shù)據(jù)搬運(yùn)量降到了優(yōu)化前的近七分之一,可緩存的token數(shù)量提升到了原來(lái)的近5倍,同時(shí)還通過(guò)專(zhuān)家并行、輸入長(zhǎng)度分桶等方式提升了集群吞吐能力。
正是這些發(fā)生在后臺(tái)的工程優(yōu)化,決定了廠商有沒(méi)有能力長(zhǎng)期維持低價(jià)?,F(xiàn)在大模型API的價(jià)格戰(zhàn)已經(jīng)不只是模型參數(shù)和榜單能力的競(jìng)爭(zhēng),而是延伸到了推理框架、緩存系統(tǒng)和集群資源調(diào)度能力的底層競(jìng)爭(zhēng)。能不能在高并發(fā)、長(zhǎng)上下文和多輪調(diào)用的場(chǎng)景下持續(xù)壓低單token的服務(wù)成本,已經(jīng)成為大模型廠商基礎(chǔ)設(shè)施能力的核心考核項(xiàng)。
其中最關(guān)鍵的就是緩存命中價(jià)。
0.025元/百萬(wàn)tokens并不是所有輸入的統(tǒng)一價(jià)格,而是請(qǐng)求前綴命中Prompt Cache之后的優(yōu)惠價(jià)格。但對(duì)代碼助手、企業(yè)知識(shí)庫(kù)、智能客服系統(tǒng)、文檔審核和Agent工作流來(lái)說(shuō),大量調(diào)用都會(huì)包含重復(fù)的上下文內(nèi)容:系統(tǒng)提示詞、工具說(shuō)明、對(duì)話(huà)歷史軌跡、檢索片段、代碼倉(cāng)庫(kù)背景,都會(huì)在多輪任務(wù)中反復(fù)出現(xiàn)。
過(guò)去,長(zhǎng)上下文處理和多步Agent之所以很難實(shí)現(xiàn)大規(guī)模部署,一個(gè)核心原因就是持續(xù)調(diào)用的成本太高。當(dāng)緩存命中價(jià)格被壓縮到0.025元/百萬(wàn)tokens之后,被重估的不只是單次問(wèn)答的成本,更是復(fù)雜任務(wù)連續(xù)運(yùn)行的整體成本,這直接打開(kāi)了更多落地場(chǎng)景的可能性。
這也是小米取消上下文長(zhǎng)度分檔計(jì)價(jià)的核心意義。
在此之前,MiMo-V2系列是按照256K以?xún)?nèi)、256K至1M兩個(gè)檔位給上下文窗口分檔計(jì)價(jià),長(zhǎng)窗口輸入的成本明顯更高。這次V2.5系列降價(jià)后,MiMo不再區(qū)分上下文窗口長(zhǎng)度,相當(dāng)于直接降低了長(zhǎng)上下文任務(wù)的使用門(mén)檻。
對(duì)開(kāi)發(fā)者來(lái)說(shuō),這比單純降價(jià)一點(diǎn)要關(guān)鍵得多。Agent、代碼助手和企業(yè)知識(shí)庫(kù)真正消耗成本的部分,恰恰不是短問(wèn)短答,而是長(zhǎng)上下文處理、連續(xù)調(diào)用和多輪任務(wù)。
放到全球大模型的價(jià)格體系中對(duì)比,這個(gè)定價(jià)的差異會(huì)更加明顯。OpenAI此前披露,GPT-5.5 Pro API的定價(jià)是輸入30美元/百萬(wàn)tokens、輸出180美元/百萬(wàn)tokens。對(duì)比下來(lái),DeepSeek V4-Pro和MiMo-V2.5-Pro調(diào)價(jià)后,哪怕不算0.025元的緩存命中價(jià),只按照緩存未命中輸入3元、輸出6元計(jì)算,價(jià)格也已經(jīng)低了不止一個(gè)數(shù)量級(jí)。
這意味著,國(guó)產(chǎn)大模型的低價(jià)不再只是“平價(jià)替代”的營(yíng)銷(xiāo)敘事,而是開(kāi)始對(duì)全球大模型API的價(jià)格體系形成實(shí)實(shí)在在的壓力。
這種壓力最終會(huì)傳導(dǎo)改變企業(yè)的大模型采購(gòu)方式。
未來(lái)企業(yè)選擇大模型的時(shí)候,不會(huì)只問(wèn)“哪個(gè)模型最強(qiáng)”,而是會(huì)更關(guān)注“什么任務(wù)該用什么模型”。高風(fēng)險(xiǎn)的法律文書(shū)審核、金融分析、關(guān)鍵代碼審查和重大經(jīng)營(yíng)決策類(lèi)任務(wù),仍然可能交給價(jià)格更高、性能更穩(wěn)定、合規(guī)保障更完善的模型;但客服初篩、批量文本摘要、內(nèi)部知識(shí)庫(kù)問(wèn)答、代碼初稿生成、文檔整理這類(lèi)高頻、重復(fù)、低風(fēng)險(xiǎn)任務(wù),就會(huì)更多被分配給低價(jià)模型。
換句話(huà)說(shuō),未來(lái)企業(yè)采購(gòu)的可能不再是單個(gè)大模型,而是一套多模型路由調(diào)度系統(tǒng)。
這種趨勢(shì)其實(shí)已經(jīng)在海外企業(yè)的實(shí)踐中出現(xiàn)。Airbnb CEO Brian Chesky此前就公開(kāi)表示,其客服AI系統(tǒng)由13個(gè)不同模型組成,并且在很大程度上依賴(lài)通義千問(wèn),原因就是“效果更好,價(jià)格更便宜”。當(dāng)企業(yè)開(kāi)始把不同模型放進(jìn)同一套生產(chǎn)系統(tǒng),模型之間的競(jìng)爭(zhēng)就不再只是榜單分?jǐn)?shù)的競(jìng)爭(zhēng),而是單位任務(wù)成本、服務(wù)穩(wěn)定性、集群吞吐能力、響應(yīng)延遲和合規(guī)能力的綜合競(jìng)爭(zhēng)。
當(dāng)然,標(biāo)價(jià)低并不代表企業(yè)實(shí)際使用的總成本一定低。
0.025元只對(duì)應(yīng)緩存命中輸入的價(jià)格。實(shí)際部署過(guò)程中,企業(yè)還要綜合考慮緩存命中率、首token延遲、并發(fā)限制、服務(wù)穩(wěn)定性、長(zhǎng)上下文吞吐、第三方平臺(tái)加價(jià)以及數(shù)據(jù)合規(guī)成本。如果企業(yè)的業(yè)務(wù)場(chǎng)景高度動(dòng)態(tài)、上下文頻繁變化,或者服務(wù)在高峰期無(wú)法穩(wěn)定承載,價(jià)格表上的低價(jià)未必能完全轉(zhuǎn)化為生產(chǎn)環(huán)境里的實(shí)際低成本。
因此,這輪價(jià)格戰(zhàn)的關(guān)鍵不只是“誰(shuí)的標(biāo)價(jià)更便宜”,而是大模型廠商能不能在低價(jià)的前提下,依然保持服務(wù)可用、穩(wěn)定,并且支持規(guī)?;渴?。
更值得玩味的是,據(jù)彭博社等海外媒體報(bào)道,DeepSeek近期正在推進(jìn)規(guī)模約700億元人民幣的融資,潛在投前估值約為450億美元,創(chuàng)始人梁文鋒向投資者強(qiáng)調(diào)的核心方向仍然是開(kāi)源模型和AGI目標(biāo),而非短期商業(yè)化盈利。如果這一輪融資最終落地,那么V4-Pro的永久降價(jià)就更像是一種長(zhǎng)期生態(tài)布局策略,而不是階段性的促銷(xiāo)活動(dòng)。
DeepSeek先把限時(shí)優(yōu)惠轉(zhuǎn)為長(zhǎng)期價(jià)格,小米MiMo隨后直接對(duì)齊Pro檔價(jià)格,兩家廠商共同釋放的信號(hào)非常清晰:國(guó)產(chǎn)大模型API正在從能力溢價(jià)的階段,正式進(jìn)入成本約束的競(jìng)爭(zhēng)階段。
接下來(lái),價(jià)格壓力會(huì)逐步傳導(dǎo)給更多國(guó)內(nèi)大模型廠商。
既然同等能力區(qū)間的模型已經(jīng)可以把緩存命中輸入價(jià)格壓到0.025元/百萬(wàn)tokens,那么定價(jià)更高的模型就必須回答一個(gè)更直接的問(wèn)題:價(jià)格更高的部分,究竟是來(lái)自更強(qiáng)的能力、更高的穩(wěn)定性、更好的合規(guī)保障,還是僅僅延續(xù)了過(guò)去的定價(jià)慣性?
從更大的產(chǎn)業(yè)格局來(lái)看,這也是中國(guó)大模型發(fā)展路線(xiàn)的一個(gè)典型切面:國(guó)產(chǎn)大模型不只是追求單點(diǎn)最強(qiáng)的模型,而是通過(guò)低成本、高頻迭代和開(kāi)放調(diào)用,把模型能力盡快落地到真實(shí)的應(yīng)用場(chǎng)景中。
當(dāng)海外前沿模型仍然維持高價(jià)策略的時(shí)候,中國(guó)廠商正在把大模型推理服務(wù)打造成更接近通用基礎(chǔ)設(shè)施的產(chǎn)品。價(jià)格戰(zhàn)只是表面現(xiàn)象,真正比拼的是哪家廠商能用更低的成本支撐起更大規(guī)模的應(yīng)用生態(tài)。
大模型的價(jià)格戰(zhàn)還沒(méi)有結(jié)束。它只是從“誰(shuí)敢率先降價(jià)”的階段,進(jìn)入了“誰(shuí)能用真實(shí)成本支撐低價(jià)”的全新競(jìng)爭(zhēng)階段。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





