欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

小米MiMo跟進(jìn)DeepSeek降價(jià)99%，國(guó)產(chǎn)大模型正式踏入成本競(jìng)爭(zhēng)新階段

2天前

本文來(lái)自微信公眾號(hào)：觀網(wǎng)財(cái)經(jīng) ，作者：陳濟(jì)深

5月27日，小米創(chuàng)始人雷軍在微博轉(zhuǎn)發(fā)了小米MiMo-V2.5系列API降價(jià)的官方消息。

根據(jù)小米MiMo發(fā)布的官方公告，從5月27日零時(shí)開(kāi)始，MiMo-V2.5系列API正式開(kāi)啟永久降價(jià)，最高降幅達(dá)到99%，同時(shí)官方取消了過(guò)去按照上下文窗口長(zhǎng)度分檔計(jì)價(jià)的規(guī)則。配套的Token Plan計(jì)費(fèi)體系也同步完成調(diào)整，同等價(jià)格下用戶(hù)可獲得的token用量提升至原來(lái)的5到8倍，目前仍在有效期內(nèi)的用戶(hù)額度也做了統(tǒng)一重置。

雷軍在轉(zhuǎn)發(fā)微博時(shí)特意強(qiáng)調(diào)，本次價(jià)格調(diào)整“最高降幅達(dá)到99%，不再區(qū)分上下文窗口”。

99%的降價(jià)幅度足夠吸引眼球，但更值得行業(yè)關(guān)注的是調(diào)價(jià)后MiMo-V2.5-Pro的三項(xiàng)核心定價(jià)：輸入緩存命中價(jià)格為0.025元/百萬(wàn)tokens，輸入緩存未命中為3元/百萬(wàn)tokens，輸出價(jià)格為6元/百萬(wàn)tokens。

這三組定價(jià)數(shù)字，和五天前DeepSeek敲定的V4-Pro長(zhǎng)期價(jià)格完全一致。

DeepSeek V4系列在4月25日正式上線(xiàn)，當(dāng)時(shí)V4-Pro的首發(fā)定價(jià)為輸入緩存命中1元/百萬(wàn)tokens。上線(xiàn)僅僅一天后，DeepSeek就宣布將全系A(chǔ)PI的輸入緩存命中價(jià)格下調(diào)至首發(fā)價(jià)的十分之一，同時(shí)V4-Pro還疊加了2.5折的限時(shí)優(yōu)惠，優(yōu)惠后緩存命中價(jià)格降到了0.025元/百萬(wàn)tokens。原本這項(xiàng)優(yōu)惠計(jì)劃在5月5日結(jié)束，之后被延期到了5月31日。到5月22日晚間，DeepSeek直接宣布這項(xiàng)2.5折優(yōu)惠不再設(shè)時(shí)限，改為永久生效。一個(gè)月內(nèi)連續(xù)調(diào)整價(jià)格，也讓DeepSeek V4-Pro的初始“原價(jià)”更像是一個(gè)只短暫存在的定價(jià)參考。

DeepSeek官方價(jià)格頁(yè)面顯示，5月31日優(yōu)惠活動(dòng)結(jié)束后，V4-Pro將正式把定價(jià)調(diào)整為原定價(jià)的四分之一。調(diào)價(jià)完成后，V4-Pro的定價(jià)就是輸入緩存命中0.025元/百萬(wàn)tokens，輸入緩存未命中3元/百萬(wàn)tokens，輸出6元/百萬(wàn)tokens，和小米本次調(diào)價(jià)后的定價(jià)完全相同。

也就是說(shuō)，小米MiMo這次并不是單純的常規(guī)降價(jià)，而是直接把自家Pro檔模型的定價(jià)，對(duì)齊到了DeepSeek剛剛定下的行業(yè)價(jià)格基準(zhǔn)上。

這個(gè)動(dòng)作也讓本次降價(jià)超出了普通品牌促銷(xiāo)的范疇，引發(fā)了行業(yè)更多聯(lián)想。

值得注意的是，小米本次降價(jià)剛好發(fā)生在上一輪MiMo開(kāi)發(fā)者激勵(lì)結(jié)束之后。根據(jù)官方公告，從4月28日啟動(dòng)的100T Token創(chuàng)作者激勵(lì)計(jì)劃，已經(jīng)在5月26日提前發(fā)放完畢。對(duì)MiMo來(lái)說(shuō)，推出永久降價(jià)同時(shí)重置Token Plan額度，不只是降低開(kāi)發(fā)者的嘗試門(mén)檻，更是打算在免費(fèi)Token的紅利結(jié)束后，繼續(xù)承接Agent框架和應(yīng)用開(kāi)發(fā)者的生態(tài)需求。

過(guò)去大模型API的定價(jià)邏輯更多是“能力溢價(jià)”：模型能力越接近閉源前沿水平，越能在代碼生成、邏輯推理、長(zhǎng)上下文處理、Agent搭建這類(lèi)場(chǎng)景中證明自身能力，廠商就越有理由維持更高的定價(jià)。

但DeepSeek和小米MiMo的這兩輪降價(jià)，透露出新的定價(jià)邏輯正在成型：模型服務(wù)不再只按照“能力強(qiáng)弱”定價(jià)，也開(kāi)始受到“單次推理成本能壓縮到多低”的約束。

成本能壓到這么低，背后是推理系統(tǒng)效率的持續(xù)優(yōu)化。小米MiMo在公告中解釋?zhuān)夹g(shù)團(tuán)隊(duì)基于SGLang HiCache完整支持SWA，把KV Cache在GPU顯存、CPU內(nèi)存、SSD多級(jí)存儲(chǔ)之間的數(shù)據(jù)搬運(yùn)量降到了優(yōu)化前的近七分之一，可緩存的token數(shù)量提升到了原來(lái)的近5倍，同時(shí)還通過(guò)專(zhuān)家并行、輸入長(zhǎng)度分桶等方式提升了集群吞吐能力。

正是這些發(fā)生在后臺(tái)的工程優(yōu)化，決定了廠商有沒(méi)有能力長(zhǎng)期維持低價(jià)?，F(xiàn)在大模型API的價(jià)格戰(zhàn)已經(jīng)不只是模型參數(shù)和榜單能力的競(jìng)爭(zhēng)，而是延伸到了推理框架、緩存系統(tǒng)和集群資源調(diào)度能力的底層競(jìng)爭(zhēng)。能不能在高并發(fā)、長(zhǎng)上下文和多輪調(diào)用的場(chǎng)景下持續(xù)壓低單token的服務(wù)成本，已經(jīng)成為大模型廠商基礎(chǔ)設(shè)施能力的核心考核項(xiàng)。

其中最關(guān)鍵的就是緩存命中價(jià)。

0.025元/百萬(wàn)tokens并不是所有輸入的統(tǒng)一價(jià)格，而是請(qǐng)求前綴命中Prompt Cache之后的優(yōu)惠價(jià)格。但對(duì)代碼助手、企業(yè)知識(shí)庫(kù)、智能客服系統(tǒng)、文檔審核和Agent工作流來(lái)說(shuō)，大量調(diào)用都會(huì)包含重復(fù)的上下文內(nèi)容：系統(tǒng)提示詞、工具說(shuō)明、對(duì)話(huà)歷史軌跡、檢索片段、代碼倉(cāng)庫(kù)背景，都會(huì)在多輪任務(wù)中反復(fù)出現(xiàn)。

過(guò)去，長(zhǎng)上下文處理和多步Agent之所以很難實(shí)現(xiàn)大規(guī)模部署，一個(gè)核心原因就是持續(xù)調(diào)用的成本太高。當(dāng)緩存命中價(jià)格被壓縮到0.025元/百萬(wàn)tokens之后，被重估的不只是單次問(wèn)答的成本，更是復(fù)雜任務(wù)連續(xù)運(yùn)行的整體成本，這直接打開(kāi)了更多落地場(chǎng)景的可能性。

這也是小米取消上下文長(zhǎng)度分檔計(jì)價(jià)的核心意義。

在此之前，MiMo-V2系列是按照256K以?xún)?nèi)、256K至1M兩個(gè)檔位給上下文窗口分檔計(jì)價(jià)，長(zhǎng)窗口輸入的成本明顯更高。這次V2.5系列降價(jià)后，MiMo不再區(qū)分上下文窗口長(zhǎng)度，相當(dāng)于直接降低了長(zhǎng)上下文任務(wù)的使用門(mén)檻。

對(duì)開(kāi)發(fā)者來(lái)說(shuō)，這比單純降價(jià)一點(diǎn)要關(guān)鍵得多。Agent、代碼助手和企業(yè)知識(shí)庫(kù)真正消耗成本的部分，恰恰不是短問(wèn)短答，而是長(zhǎng)上下文處理、連續(xù)調(diào)用和多輪任務(wù)。

放到全球大模型的價(jià)格體系中對(duì)比，這個(gè)定價(jià)的差異會(huì)更加明顯。OpenAI此前披露，GPT-5.5 Pro API的定價(jià)是輸入30美元/百萬(wàn)tokens、輸出180美元/百萬(wàn)tokens。對(duì)比下來(lái)，DeepSeek V4-Pro和MiMo-V2.5-Pro調(diào)價(jià)后，哪怕不算0.025元的緩存命中價(jià)，只按照緩存未命中輸入3元、輸出6元計(jì)算，價(jià)格也已經(jīng)低了不止一個(gè)數(shù)量級(jí)。

這意味著，國(guó)產(chǎn)大模型的低價(jià)不再只是“平價(jià)替代”的營(yíng)銷(xiāo)敘事，而是開(kāi)始對(duì)全球大模型API的價(jià)格體系形成實(shí)實(shí)在在的壓力。

這種壓力最終會(huì)傳導(dǎo)改變企業(yè)的大模型采購(gòu)方式。

未來(lái)企業(yè)選擇大模型的時(shí)候，不會(huì)只問(wèn)“哪個(gè)模型最強(qiáng)”，而是會(huì)更關(guān)注“什么任務(wù)該用什么模型”。高風(fēng)險(xiǎn)的法律文書(shū)審核、金融分析、關(guān)鍵代碼審查和重大經(jīng)營(yíng)決策類(lèi)任務(wù)，仍然可能交給價(jià)格更高、性能更穩(wěn)定、合規(guī)保障更完善的模型；但客服初篩、批量文本摘要、內(nèi)部知識(shí)庫(kù)問(wèn)答、代碼初稿生成、文檔整理這類(lèi)高頻、重復(fù)、低風(fēng)險(xiǎn)任務(wù)，就會(huì)更多被分配給低價(jià)模型。

換句話(huà)說(shuō)，未來(lái)企業(yè)采購(gòu)的可能不再是單個(gè)大模型，而是一套多模型路由調(diào)度系統(tǒng)。

這種趨勢(shì)其實(shí)已經(jīng)在海外企業(yè)的實(shí)踐中出現(xiàn)。Airbnb CEO Brian Chesky此前就公開(kāi)表示，其客服AI系統(tǒng)由13個(gè)不同模型組成，并且在很大程度上依賴(lài)通義千問(wèn)，原因就是“效果更好，價(jià)格更便宜”。當(dāng)企業(yè)開(kāi)始把不同模型放進(jìn)同一套生產(chǎn)系統(tǒng)，模型之間的競(jìng)爭(zhēng)就不再只是榜單分?jǐn)?shù)的競(jìng)爭(zhēng)，而是單位任務(wù)成本、服務(wù)穩(wěn)定性、集群吞吐能力、響應(yīng)延遲和合規(guī)能力的綜合競(jìng)爭(zhēng)。

當(dāng)然，標(biāo)價(jià)低并不代表企業(yè)實(shí)際使用的總成本一定低。

0.025元只對(duì)應(yīng)緩存命中輸入的價(jià)格。實(shí)際部署過(guò)程中，企業(yè)還要綜合考慮緩存命中率、首token延遲、并發(fā)限制、服務(wù)穩(wěn)定性、長(zhǎng)上下文吞吐、第三方平臺(tái)加價(jià)以及數(shù)據(jù)合規(guī)成本。如果企業(yè)的業(yè)務(wù)場(chǎng)景高度動(dòng)態(tài)、上下文頻繁變化，或者服務(wù)在高峰期無(wú)法穩(wěn)定承載，價(jià)格表上的低價(jià)未必能完全轉(zhuǎn)化為生產(chǎn)環(huán)境里的實(shí)際低成本。

因此，這輪價(jià)格戰(zhàn)的關(guān)鍵不只是“誰(shuí)的標(biāo)價(jià)更便宜”，而是大模型廠商能不能在低價(jià)的前提下，依然保持服務(wù)可用、穩(wěn)定，并且支持規(guī)?；渴?。

更值得玩味的是，據(jù)彭博社等海外媒體報(bào)道，DeepSeek近期正在推進(jìn)規(guī)模約700億元人民幣的融資，潛在投前估值約為450億美元，創(chuàng)始人梁文鋒向投資者強(qiáng)調(diào)的核心方向仍然是開(kāi)源模型和AGI目標(biāo)，而非短期商業(yè)化盈利。如果這一輪融資最終落地，那么V4-Pro的永久降價(jià)就更像是一種長(zhǎng)期生態(tài)布局策略，而不是階段性的促銷(xiāo)活動(dòng)。

DeepSeek先把限時(shí)優(yōu)惠轉(zhuǎn)為長(zhǎng)期價(jià)格，小米MiMo隨后直接對(duì)齊Pro檔價(jià)格，兩家廠商共同釋放的信號(hào)非常清晰：國(guó)產(chǎn)大模型API正在從能力溢價(jià)的階段，正式進(jìn)入成本約束的競(jìng)爭(zhēng)階段。

接下來(lái)，價(jià)格壓力會(huì)逐步傳導(dǎo)給更多國(guó)內(nèi)大模型廠商。

既然同等能力區(qū)間的模型已經(jīng)可以把緩存命中輸入價(jià)格壓到0.025元/百萬(wàn)tokens，那么定價(jià)更高的模型就必須回答一個(gè)更直接的問(wèn)題：價(jià)格更高的部分，究竟是來(lái)自更強(qiáng)的能力、更高的穩(wěn)定性、更好的合規(guī)保障，還是僅僅延續(xù)了過(guò)去的定價(jià)慣性？

從更大的產(chǎn)業(yè)格局來(lái)看，這也是中國(guó)大模型發(fā)展路線(xiàn)的一個(gè)典型切面：國(guó)產(chǎn)大模型不只是追求單點(diǎn)最強(qiáng)的模型，而是通過(guò)低成本、高頻迭代和開(kāi)放調(diào)用，把模型能力盡快落地到真實(shí)的應(yīng)用場(chǎng)景中。

當(dāng)海外前沿模型仍然維持高價(jià)策略的時(shí)候，中國(guó)廠商正在把大模型推理服務(wù)打造成更接近通用基礎(chǔ)設(shè)施的產(chǎn)品。價(jià)格戰(zhàn)只是表面現(xiàn)象，真正比拼的是哪家廠商能用更低的成本支撐起更大規(guī)模的應(yīng)用生態(tài)。

大模型的價(jià)格戰(zhàn)還沒(méi)有結(jié)束。它只是從“誰(shuí)敢率先降價(jià)”的階段，進(jìn)入了“誰(shuí)能用真實(shí)成本支撐低價(jià)”的全新競(jìng)爭(zhēng)階段。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

文章開(kāi)的面館實(shí)地探訪：被直言沒(méi)多少粉絲打卡，明星餐飲終于回歸務(wù)實(shí)？

FSD入華攪動(dòng)市場(chǎng)？熱議話(huà)題其實(shí)都是偽命題

提前體驗(yàn)Android 17：手機(jī)端不再是升級(jí)核心，這一布局才是關(guān)鍵

推出含始祖鳥(niǎo)同款沖鋒衣盲盒，老牌戶(hù)外龍頭探路者要回歸主業(yè)了？

縣域教育發(fā)展困局：癥結(jié)究竟在何處？

項(xiàng)目推薦

迪瓜租機(jī)

康老板 · 氧療堂

<thead id="nbod4"><small id="nbod4"></small></thead>

<em id="nbod4"></em>

<thead id="nbod4"><small id="nbod4"><pre id="nbod4"></pre></small></thead>

<span id="nbod4"></span>