突破英偉達壟斷:AI產(chǎn)業(yè)的另一條突圍之路
本文來自微信公眾號: 01Founder ,作者:一直在路上的Max
2006年冬天,黃仁勛做了一個被華爾街 deemed 極其荒唐的決策:要求英偉達全系列產(chǎn)品必須支持全新的CUDA技術(shù)。
為了這個在當(dāng)時看不到任何盈利前景的項目,這家以顯卡銷售為核心業(yè)務(wù)的公司,年研發(fā)投入直接飆升至5億美元,利潤常年徘徊在盈虧線附近。
股東怒斥,媒體嘲諷,說這是對不存在的市場盲目砸錢,可黃仁勛始終沒有停下腳步——他骨子里本就帶著賭徒的偏執(zhí)。
后續(xù)的發(fā)展所有人都耳熟能詳:如今硅谷科技巨頭搶英偉達顯卡,幾乎要擠破頭。
馬斯克一口氣往得州機房塞了十萬張英偉達顯卡,轉(zhuǎn)頭就能以每月12.5億美元的價格把算力租給Anthropic;扎克伯格甚至?xí)贛eta財報里主動炫耀,公司已經(jīng)囤了三十萬張H100。
大模型行業(yè)如今奉信一條簡單粗暴的“規(guī)模法則”:模型越大性能越好,能拿到的算力越多越有優(yōu)勢。
在這套規(guī)則下,英偉達拿走了AI產(chǎn)業(yè)絕大多數(shù)利潤:云廠商高價買下顯卡,再把算力切割成小塊,按Token向創(chuàng)業(yè)者和普通用戶收費;每一次AI生成內(nèi)容,本質(zhì)上都是在消耗英偉達的算力,都是給硅谷的這座AI王座上供。越來越多從業(yè)者開始感嘆:整個行業(yè)都被英偉達卡了脖子。
這樣的壟斷看似是死局,但已經(jīng)有一批人站出來,想要打破現(xiàn)狀。
PART.01
算力突圍:啃下生態(tài)這塊硬骨頭
要反抗英偉達的壟斷,第一槍必須打在最核心的算力芯片上。
前段時間華為發(fā)布的芯片論文刷遍全網(wǎng),國產(chǎn)芯片領(lǐng)域也不斷傳出突破消息,資本市場反應(yīng)熱烈。但如果問問真正在大模型一線開發(fā)的工程師,大多會得到一個殘酷的答案:黃仁勛腳下,還藏著一條深不見底的護城河——那就是CUDA生態(tài)。
英偉達用了整整15年時間,吸引全球數(shù)百萬開發(fā)者在這個生態(tài)里開發(fā)、調(diào)試,終于打磨出了一套流暢成熟的開發(fā)環(huán)境,成為AI行業(yè)默認的基礎(chǔ)設(shè)施。
平心而論,如今華為昇騰和其他國產(chǎn)芯片已經(jīng)在硬件參數(shù)上追上了國際水平,但因為缺少成熟的軟件生態(tài),模型部署后經(jīng)常出現(xiàn)運行中斷、崩潰的問題,哪怕算力參數(shù)達標(biāo),實際體驗也差強人意。很多手握資金的國內(nèi)大廠,最終還是只能通過特殊渠道高價求購英偉達顯卡。
但再硬的骨頭,總得有人啃。在這場擺脫英偉達依賴的算力突圍中,已經(jīng)有少數(shù)中國企業(yè)選了最艱難的那條路。比如在硅谷都聲名遠揚的DeepSeek,為了讓大模型穩(wěn)定跑在華為等國產(chǎn)芯片上,直接抽調(diào)了核心工程團隊,逐行重寫底層算子。
這種在技術(shù)細節(jié)里死磕的代價,就是整個模型的發(fā)布進度被大幅推遲。這當(dāng)然稱得上是“孤勇者”的故事,但也暴露出一個現(xiàn)實問題:如果國產(chǎn)大模型只能靠頂尖工程師拼時間、拼體力,去填英偉達15年攢下的生態(tài)坑,我們要多久才能真正實現(xiàn)翻盤?或許,我們需要換一條賽道。
PART.02
換道端側(cè):把智能裝進終端設(shè)備
硬件端的突破固然重要,但如果只盯著算力硬件,還不足以徹底打破英偉達的壟斷。翻一翻科技巨頭的財報就能發(fā)現(xiàn)一個荒誕的現(xiàn)狀:無數(shù)產(chǎn)品經(jīng)理和高管天天絞盡腦汁,想著怎么讓用戶多對話、多生成內(nèi)容,怎么多賣API、多賣會員,大廠為了搶市場打起了近乎賠本的API價格戰(zhàn),可最后大部分利潤,還是流進了英偉達和云廠商的口袋。說白了,整個AI行業(yè)都在給黃仁勛打工。
黃仁勛和云廠商構(gòu)想的終極商業(yè)模式,就是把所有大模型都鎖在云端數(shù)據(jù)中心,讓用戶永遠為Token付費、為算力付費——只要模型還在云端運行,計費表就會一直轉(zhuǎn)下去。哪怕API價格戰(zhàn)打得再激烈,只要英偉達顯卡還需要供電,AI服務(wù)的邊際成本就永遠不可能降到零。
要徹底終結(jié)這種壟斷,必須換一個戰(zhàn)場,換到英偉達顯卡觸及不到的地方:那就是端側(cè)模型。
所謂端側(cè)模型,就是直接在用戶自己的設(shè)備上運行大模型,把AI智能直接放進你口袋里的手機、桌上的筆記本,甚至是手腕上的智能手表。

端側(cè)模型能帶來兩個顛覆性的優(yōu)勢:
第一就是徹底降低成本。一旦模型在本地設(shè)備運行,云端按Token計費的模式就直接被淘汰了。用戶不需要每次提問都算著成本控制內(nèi)容長度,哪怕讓AI讀幾十萬字的研報、寫一整夜的代碼,邊際成本都是零,沒有中間商賺算力差價,更不需要給任何廠商交算力過路費。
第二是徹底解決隱私問題。AI巨頭再也沒辦法通過云端收集用戶數(shù)據(jù),企業(yè)的機密報表、個人的私密內(nèi)容,全都牢牢鎖在用戶自己的設(shè)備里,物理隔絕外人訪問;哪怕你在沒有信號的高鐵隧道里,AI依然可以正常運行。
但這條路走起來格外艱難。過去兩年,行業(yè)里曾經(jīng)涌出一大批喊著要做端側(cè)大模型、把AI裝進手機的團隊,可資本是極度現(xiàn)實的:摸爬滾打之后大家發(fā)現(xiàn),做端側(cè)大模型不僅要和硬件的性能極限死磕,而且利潤空間極薄,更重要的是,它直接打碎了云端按API收租的完美商業(yè)模式,所以很快大部分團隊就散去了,大家又轉(zhuǎn)頭擠回云端,繼續(xù)卷千億、萬億參數(shù)的云端大模型。潮水退去之后,端側(cè)賽道變得格外冷清,全球范圍內(nèi)還在堅持做端側(cè)大模型的團隊寥寥無幾。
目前來看,谷歌Gemma團隊、微軟Phi團隊、阿里通義千問Qwen團隊都在布局端側(cè)模型。有意思的是,連賣顯卡的英偉達,自家研究院都曾發(fā)論文公開表示“小語言模型才是未來方向”。但對這些巨頭來說,端側(cè)模型更像是完善產(chǎn)品布局的防御性布局,要讓他們親手砸碎自己躺著賺錢的云端收租盤,難度實在太大。
PART.03
換道超車:自己修出一條新路
前段時間華為的芯片論文讓整個行業(yè)沸騰,很多人都覺得我們終于看到了掀翻英偉達帝國的曙光。但直到今天,黃仁勛依然穿著他標(biāo)志性的黑皮衣,站在硅谷AI產(chǎn)業(yè)的頂端。
很多人都在問,中國大模型什么時候才能真正實現(xiàn)超越?答案或許從來都不是誰能買到更多顯卡、誰能砸更多錢堆出參數(shù)更大的模型。真正的超越,從來都是發(fā)生在游戲規(guī)則被改寫的時候。
大模型的上半場,本質(zhì)上是靠工程師堆代碼的手工作坊時代,是比拼買卡囤卡實力的“冷兵器時代”,大家比的是誰家底厚、能從黃仁勛手里拿到更多芯片。但到了下半場,游戲規(guī)則已經(jīng)變了。
在這場擺脫英偉達壟斷的突圍戰(zhàn)里,華為在最底層的芯片硬件上破冰,DeepSeek在算法層面挖潛國產(chǎn)算力,這些玩家沒有盲從巨頭們“越大越好”的邏輯,沒有在舊規(guī)則里瘋狂內(nèi)卷,而是選擇直接掀掉舊牌桌,開一條新賽道。
多年以后回頭看,現(xiàn)在發(fā)生的這一切,很可能會成為AI產(chǎn)業(yè)靜水流深的分水嶺?,F(xiàn)在硅谷依舊熱鬧,納斯達克的指數(shù)依然在上漲,黃仁勛的飯局上還是坐滿了求購芯片的科技大佬,那個穿皮衣的男人依然站在產(chǎn)業(yè)頂端受萬人膜拜,巨頭們還是在為云端算力殺得不可開交。但在他們看不到的地方,舊秩序的基石已經(jīng)被悄悄撬動。
在那條擁擠、昂貴還隨時可能被卡脖子的英偉達高速路旁邊,一群想要突破壟斷的創(chuàng)業(yè)者已經(jīng)不再排隊等待,他們轉(zhuǎn)過身,開始自己鋪一條全新的路。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





