DeepSeek V4發(fā)布前夕:這些關(guān)鍵問題需提前梳理
4月10日,據(jù)多位知情人士向《創(chuàng)智記》透露,DeepSeek創(chuàng)始人梁文鋒在內(nèi)部溝通中首次明確了V4的發(fā)布安排——備受期待的新一代旗艦大模型DeepSeek V4計劃于4月下旬正式與公眾見面。

鳳凰網(wǎng)科技就該消息向DeepSeek方面求證,截至發(fā)稿未獲得回應(yīng)。
此前,DeepSeek剛完成版本更新,首次在模式上進(jìn)行分層,推出快速模式和專家模式。在點擊開始的入口處,原本“體驗DeepSeekV3.2”的字樣也已消失。
“優(yōu)等生”DeepSeek的困擾
DeepSeekV4的未知性,建立在復(fù)雜的背景之上。
2025年初,R1的發(fā)布曾是國內(nèi)大模型創(chuàng)企難以擺脫的“陰影”。這些曾經(jīng)的明星企業(yè)用了半年時間,才憑借新的旗艦?zāi)P椭鼗毓娨曇埃械倪x擇上市,有的開啟新一輪融資。
在成名之前,梁文鋒曾與少數(shù)VC有過會談,但據(jù)當(dāng)時接觸過他的人士向鳳凰網(wǎng)科技表示,梁文鋒的本意并非融資,而是了解機構(gòu)的風(fēng)格。
《晚點LatePost》的報道也提到,梁文鋒曾在會面中提出類似OpenAI與微軟投資協(xié)議的回報上限條款,但沒有機構(gòu)接受,此后便再無投資人會面。
2025年成名后,DeepSeek變得更加內(nèi)斂,一些原本在社交媒體更新的員工賬號開始停更。
據(jù)《晚點LatePost》報道,DeepSeek沒有加班文化,員工不打卡、沒有明確的績效考核,平日多數(shù)成員會在下午6點至7點左右離開公司。
但隨著智譜、MiniMax等公司上市后市值大幅增長,DeepSeek的估值問題逐漸成為內(nèi)部壓力點。DeepSeek員工對手中未定價的期權(quán)產(chǎn)生了更多疑問,梁文鋒近期也開始考慮公司估值的問題。
除此之外,從2025年秋天起,梁文鋒開始更多提及“產(chǎn)品化和商業(yè)化”。在公開的招聘信息中,官方HR表示有產(chǎn)品、設(shè)計、數(shù)據(jù)百曉生等崗位開放。甚至職能崗也在擴充,早在2025年11月,DeepSeek還開放過行政招聘,據(jù)相關(guān)人士稱“是因為團(tuán)隊規(guī)模擴大,需要更多行政人員”。
在這些變化之下,拖延數(shù)月的V4可能存在諸多變數(shù),但其引發(fā)的關(guān)注熱度不會消減。
OpenRouter平臺數(shù)據(jù)顯示,2026年2月,中國大模型在OpenRouter上的周調(diào)用量首次超過美國模型,這一趨勢持續(xù)到3月。本周,排名前五的模型中,仍有三個來自中國,分別是排名第一的DeepSeekV3.2、排名第二的MiniMaxM2.7和第四的MiniMaxM2.5。
毫無疑問,DeepSeekV4的推出有望延續(xù)這一優(yōu)勢。
V4能否成為DeepSeek的分水嶺?
將R1和V4放在一起分析,變化的脈絡(luò)會更清晰。
R1的突破具有范式意義——它在學(xué)術(shù)層面開創(chuàng)了“純強化學(xué)習(xí)激發(fā)推理能力”的新路徑,相關(guān)論文登上Nature封面,以586萬美元的成本實現(xiàn)了對標(biāo)GPT-4的性能,徹底改變了全球?qū)χ袊鳤I模型的認(rèn)知。
Hugging Face在“DeepSeek時刻一周年”回顧中指出,R1“降低了技術(shù)與應(yīng)用門檻,不僅是中國AI發(fā)展的轉(zhuǎn)折點,更在全球范圍內(nèi)引發(fā)了開源模式的深刻變革”。
V4的戰(zhàn)略意義則完全不同。它不再回答“中國能否做出世界級模型”,而是聚焦兩個更具體的問題:“中國AI能否在算力封鎖下持續(xù)進(jìn)化”,以及“大模型能否成為可盈利的企業(yè)級產(chǎn)品”。
那么,V4能否成為DeepSeek的分水嶺?
如果說R1是DeepSeek在“純推理”路線上站穩(wěn)腳跟、打響全球知名度的第一槍,那么V4就是DeepSeek證明自己不僅是“技術(shù)奇才”,還能在中國AI產(chǎn)業(yè)生態(tài)中找到不可替代位置的標(biāo)志性產(chǎn)品。
R1的意義在于“完成了別人認(rèn)為中國公司做不到的事”。V4的意義則在于“在被封鎖的環(huán)境中,為自己鋪就了一條可持續(xù)發(fā)展的道路”。
與此同時,學(xué)術(shù)界也出現(xiàn)了新的趨勢。DeepSeek的使命曾是探索未知,追求通用人工智能(AGI)。
去年底,姚順雨、林俊旸、楊植麟、唐杰等人在清華同臺,探討底層范式話題。在海外,Yann LeCun稱大語言模型(LLM)是“死胡同”,Jim Fan表示“視覺是連接大腦、運動系統(tǒng)和物理世界的最高帶寬通道”。甚至有觀點認(rèn)為,追求AGI的重任或許應(yīng)落在世界模型身上。
敏感的VC最早察覺到市場風(fēng)向的變化。巧合的是,代表世界模型陣營的李飛飛和楊立昆均剛完成10億美元級別的新融資,國內(nèi)代表企業(yè)生數(shù)科技也于4月10日官宣獲得近20億人民幣的A++輪融資。

繪圖|DeepSeek
從目前披露的信息來看,DeepSeek仍選擇基于LLM架構(gòu)進(jìn)行優(yōu)化和工程化落地。V4最核心的突破集中在三方面:萬億參數(shù)MoE架構(gòu)、原生多模態(tài)能力和國產(chǎn)芯片適配。
對于DeepSeek而言,在算力和資金都有限的情況下,將資源投入架構(gòu)效率提升和國產(chǎn)化適配,比追逐距離產(chǎn)品化尚遠(yuǎn)的范式革命更務(wù)實,也更符合其“少花錢辦大事”的特點。
值得注意的是,DeepSeek并非完全沒有多模態(tài)積累。此前開源的DeepSeek-OCR系列已展示了將視覺作為文本壓縮媒介的探索,通過將文本以圖片形式輸入,大幅減少token消耗。
但這些探索的方向仍是“優(yōu)化文本模型的效率和成本”,而非“構(gòu)建對物理世界的理解和預(yù)測”。
若拉長時間線來看,DeepSeek的這條“分水嶺”可能還有更深層的含義——它不是一條岔路,而是一道選擇題:在中國AI產(chǎn)業(yè)的現(xiàn)實環(huán)境中,是追隨“世界模型”的范式革命,還是在現(xiàn)有架構(gòu)基礎(chǔ)上把工程優(yōu)化和自主可控做到極致?
當(dāng)然,如果DeepSeek未來在視覺和空間推理上投入更多資源,憑借其架構(gòu)創(chuàng)新能力,切入“輕量級世界模型”領(lǐng)域并非不可能。但就當(dāng)下而言,V4的任務(wù)很明確:在中國AI產(chǎn)業(yè)最需要的方向上,交出一份有競爭力的答卷。
這個選擇是否正確,無需等待太久。4月下旬V4正式發(fā)布后,市場反饋會給出最真實的答案。
本文來自微信公眾號“鳳凰網(wǎng)科技”,作者:鳳凰網(wǎng)科技,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



