180天,蘇中小城的國(guó)產(chǎn)算力破局之路
本文來自微信公眾號(hào):觀網(wǎng)財(cái)經(jīng),作者:陳濟(jì)深
春節(jié)前夕,江蘇興化,一條148米長(zhǎng)的生產(chǎn)線正進(jìn)行最后的試運(yùn)行調(diào)試。
這是國(guó)內(nèi)目前最長(zhǎng)的直通式算力服務(wù)器產(chǎn)線——從裸板上線到整機(jī)下線,一臺(tái)4U 8卡算力服務(wù)器走完全程,滿產(chǎn)時(shí)僅需5分鐘。服務(wù)器下線后,要經(jīng)歷連續(xù)三天三夜?jié)M負(fù)荷運(yùn)行、模擬真實(shí)算力中心極端工況的老化測(cè)試,之后發(fā)往承德、石家莊、興化等地的萬卡集群項(xiàng)目,成為國(guó)產(chǎn)智算中心的基石。

算力服務(wù)器組裝生產(chǎn)線
“生產(chǎn)一臺(tái)服務(wù)器的時(shí)間,和釀一瓶醬油差不多,”漢騰科技董事長(zhǎng)王皓霆對(duì)觀察者網(wǎng)說,“以前講深圳速度,現(xiàn)在我們叫漢興速度。”
興化是座以不銹鋼和健康食品聞名的蘇中小城,歷史上沒有算力和AI產(chǎn)業(yè)基礎(chǔ),但王皓霆看中的正是這種“白紙”狀態(tài)——無歷史包袱,地方政府全力配合,基建到投產(chǎn)的速度被壓縮到極致。這條投資11億元、預(yù)計(jì)年產(chǎn)10萬臺(tái)的算力服務(wù)器產(chǎn)線,從簽約到投產(chǎn)僅用180天。
產(chǎn)線投產(chǎn)的時(shí)間,恰好趕上國(guó)產(chǎn)算力需求爆發(fā)的臨界點(diǎn)。
工信部數(shù)據(jù)顯示,隨著我國(guó)AI行業(yè)快速發(fā)展,智算規(guī)模已達(dá)1590 EFLOPS。2026年被產(chǎn)業(yè)界視為國(guó)產(chǎn)算力規(guī)模部署元年,字節(jié)跳動(dòng)、騰訊、百度對(duì)國(guó)產(chǎn)算力服務(wù)器的導(dǎo)入目標(biāo)普遍較上一年翻倍。在國(guó)際地緣復(fù)雜的背景下,國(guó)產(chǎn)算力自主可控的緊迫性更顯突出。
在此背景下,觀察者網(wǎng)春節(jié)前走訪了江蘇興化漢騰科技產(chǎn)線現(xiàn)場(chǎng)和無錫太初元碁硬件研發(fā)中心實(shí)驗(yàn)室。興化這條148米產(chǎn)線上的故事,不只是一家企業(yè)的投產(chǎn)事,更是中國(guó)國(guó)產(chǎn)算力產(chǎn)業(yè)鏈從“能用”邁向“規(guī)?;渴稹钡目s影。
“拖拉機(jī)先開路,路好車自優(yōu)”
在產(chǎn)線上,觀察者網(wǎng)提出一個(gè)常被討論的問題:國(guó)產(chǎn)算力制程并非全球頂尖,面對(duì)行業(yè)快速迭代,市場(chǎng)會(huì)買單嗎?
王皓霆打了個(gè)比方:“國(guó)家修了國(guó)道,沒必要只跑法拉利?!?/p>
全球最先進(jìn)制程的芯片是“法拉利”,但國(guó)道不是為法拉利單獨(dú)修的。王皓霆認(rèn)為,目前8到12納米制程的芯片,足以覆蓋未來兩到三年的主流算力需求——真正可能閑置的,反而是那些遠(yuǎn)超當(dāng)前應(yīng)用場(chǎng)景的過高制程產(chǎn)品。
“不是說先進(jìn)制程不重要,而是現(xiàn)階段我們的‘路’——應(yīng)用場(chǎng)景和基礎(chǔ)設(shè)施——還沒到需要跑法拉利的程度。先讓拖拉機(jī)跑起來,把路跑通,車自然會(huì)升級(jí)?!蓖躔忉?。
事實(shí)上,“拖拉機(jī)”已跑出成績(jī)。
監(jiān)控全球大模型實(shí)際調(diào)用的平臺(tái)OpenRouter最新數(shù)據(jù)就是明證,春節(jié)期間全球Token調(diào)用量前十中,中國(guó)模型占四席、份額過半,支撐這些模型運(yùn)行的,相當(dāng)一部分是基于國(guó)產(chǎn)算力的推理集群。市場(chǎng)并未因制程不最先進(jìn)而拒絕國(guó)產(chǎn)算力,相反,當(dāng)模型運(yùn)行良好,用戶根本不關(guān)心底層芯片是幾納米——他們?cè)谝獾氖琼憫?yīng)速度和調(diào)用成本。
這種務(wù)實(shí)邏輯在興化產(chǎn)線得到體現(xiàn)。這里生產(chǎn)的服務(wù)器搭載龍芯3C6000處理器和太初元碁自研的T100 AI加速卡——對(duì)當(dāng)前算力需求來說夠用、管用,完全自主可控,供應(yīng)鏈穩(wěn)定,性價(jià)比合理。用王皓霆的話說,現(xiàn)在要做的不是造法拉利,而是讓足夠多的拖拉機(jī)上路。
在距興化約200公里的無錫惠山,太初元碁硬件研發(fā)中心實(shí)驗(yàn)室里,科研人員正進(jìn)行關(guān)鍵工序:將國(guó)產(chǎn)AI芯片測(cè)試、封裝成AI加速卡,再插裝到對(duì)應(yīng)服務(wù)器中,進(jìn)行大規(guī)模軟硬件協(xié)同調(diào)試。至此,服務(wù)器初步具備為大模型提供AI算力的能力。
太初元碁的技術(shù)路線與國(guó)內(nèi)主流GPGPU架構(gòu)廠商不同。它脫胎于國(guó)家超級(jí)計(jì)算無錫中心和清華大學(xué)團(tuán)隊(duì),采用異構(gòu)眾核架構(gòu)——簡(jiǎn)單說,不追求單一芯片的絕對(duì)性能,而是通過集成不同類型計(jì)算單元,讓系統(tǒng)整體算力最大化。
太初元碁首席產(chǎn)品官洪源對(duì)觀察者網(wǎng)表示:“異構(gòu)的核心是將不同類型、不同特長(zhǎng)的算力有機(jī)系統(tǒng)化結(jié)合”,而非“簡(jiǎn)單堆積不同處理器”。
這種思路呼應(yīng)了王皓霆的“拖拉機(jī)論”:不追求單點(diǎn)最強(qiáng),而是系統(tǒng)最優(yōu)。
這條路已開始跑通。2026年初,基于國(guó)產(chǎn)芯片訓(xùn)練的AI大模型密集落地:智譜聯(lián)合華為開源的GLM-Image成為首個(gè)依托國(guó)產(chǎn)芯片實(shí)現(xiàn)全程訓(xùn)練的SOTA多模態(tài)模型;中國(guó)電信開源的千億級(jí)星辰大模型也在上海臨港國(guó)產(chǎn)萬卡算力池完成全流程訓(xùn)練。
國(guó)產(chǎn)算力不再是實(shí)驗(yàn)室樣品,而是在承擔(dān)真實(shí)訓(xùn)練任務(wù)。
“算力服務(wù)器不是拼積木,是系統(tǒng)工程題”
很多人認(rèn)為算力服務(wù)器像拼積木一樣把芯片插進(jìn)機(jī)箱,實(shí)際并非如此。
在產(chǎn)線上,王皓霆指著一臺(tái)正在組裝的4U服務(wù)器解釋:“算力服務(wù)器的核心技術(shù)在適配。一是CPU和GPU之間的適配,二是內(nèi)部線路、冷卻方案的適配。不同芯片用不同元器件適配,性能會(huì)有差異?!?/p>
他打了個(gè)更形象的比方:“四缸汽車和八缸汽車,不是互換發(fā)動(dòng)機(jī)就能無縫運(yùn)行?!?/p>
這意味著,算力服務(wù)器內(nèi)部,CPU負(fù)責(zé)調(diào)度,GPU負(fù)責(zé)加速計(jì)算,供電方案影響算力釋放效率,冷卻方案決定芯片能否長(zhǎng)期穩(wěn)定運(yùn)行——都不是簡(jiǎn)單拼裝,而是深度耦合的系統(tǒng)工程?!耙材芡ㄟ^電和冷卻方案提升算力,這和大家以為的‘芯片決定一切’不一樣?!?/p>
這也是漢騰選擇聯(lián)合龍芯、太初元碁、臺(tái)達(dá)組成“國(guó)產(chǎn)夢(mèng)之隊(duì)”的原因。龍芯3C6000提供完全自主可控的CPU,王皓霆稱它為“全漢字字典”,從指令集到微架構(gòu)全自主研發(fā);太初T100提供AI加速卡;臺(tái)達(dá)提供電源和冷卻方案——三者需大量適配和調(diào)試,才能讓服務(wù)器釋放最大算力。
這也說明,國(guó)產(chǎn)算力服務(wù)器的壁壘不僅在單一高精尖技術(shù),更在打通產(chǎn)業(yè)鏈各環(huán)節(jié)、協(xié)同起來的系統(tǒng)集成能力。除了部件突破,各環(huán)節(jié)的適配磨合,也需要“系統(tǒng)集成者”。
這道系統(tǒng)工程題,放大到集群層面,難度再上一個(gè)量級(jí)。
“外界常說萬卡萬卡,好像一萬張卡就是數(shù)量。其實(shí)萬卡是難度標(biāo)準(zhǔn),不是體量標(biāo)準(zhǔn)。”王皓霆對(duì)觀察者網(wǎng)說。
一萬張卡意味著數(shù)千臺(tái)服務(wù)器、數(shù)萬條高速互聯(lián)線路、龐大的供電和冷卻系統(tǒng),以及復(fù)雜的軟件調(diào)度——單臺(tái)服務(wù)器的適配難題,在集群層面被放大數(shù)千倍。
王皓霆透露,漢騰已簽署五大萬卡集群建設(shè)合作協(xié)議,分布在承德、石家莊、興化等地,面向金融、醫(yī)療、物流等行業(yè)場(chǎng)景?!跋茸屪约旱哪P陀米约旱目ㄅ芷饋恚私鈱?shí)際流程才能最終實(shí)現(xiàn)國(guó)產(chǎn)替代。”
“電沒增,算力就增了”
當(dāng)外界目光聚焦芯片廠的“納米之戰(zhàn)”時(shí),算力產(chǎn)業(yè)在物理世界撞上另一堵墻——電力。
王皓霆算了筆賬:傳統(tǒng)通用服務(wù)器時(shí)代,單機(jī)柜功率超12千瓦的很少。現(xiàn)在,一臺(tái)4U 8卡智算服務(wù)器滿載功耗近5.4千瓦,一個(gè)機(jī)柜塞8臺(tái),輕松突破40千瓦。這意味著,過去數(shù)據(jù)中心的配電網(wǎng)絡(luò)、變壓器乃至整體能耗指標(biāo)(PUE),都面臨“超載”癱瘓風(fēng)險(xiǎn)。
因數(shù)據(jù)中心高能耗,各地政府對(duì)其電網(wǎng)容量管控趨嚴(yán)——智算中心能拿到的總電量幾乎是固定的。
芯片制程短期內(nèi)按節(jié)奏推進(jìn),總電量也加不上。怎么辦?
漢騰聯(lián)合全球電源管理巨頭臺(tái)達(dá),研發(fā)了SST技術(shù)(800V直流直供)。傳統(tǒng)機(jī)房里,電從市電到芯片,要多次交直流轉(zhuǎn)換,每次轉(zhuǎn)換都有熱損耗——這些熱量不產(chǎn)生算力,卻消耗電費(fèi)和冷卻資源。800V直流直供的邏輯很簡(jiǎn)單:減少轉(zhuǎn)換環(huán)節(jié),讓電更“直”地到芯片。
在太初元碁的方案中,這項(xiàng)供電技術(shù)與自研AI芯片、高效液冷整合為“三位一體”系統(tǒng):互聯(lián)、供電、冷卻的高密度集成。結(jié)果是,設(shè)備空間利用率較傳統(tǒng)方案提升一倍,單機(jī)架可容納128顆芯片,系統(tǒng)PUE降至1.15。
相比傳統(tǒng)數(shù)據(jù)中心1.3到1.5的PUE,每降低0.1,萬卡級(jí)智算中心一年省下的電費(fèi)可達(dá)數(shù)百萬元——更重要的是,省下來的每一度電、減少的每一分熱損耗,都能轉(zhuǎn)化為芯片開機(jī)時(shí)間。
在走訪現(xiàn)場(chǎng),王皓霆用樸素的話道出參數(shù)背后的邏輯:“你使勁算的時(shí)候,電沒增加,算力肯定就增加了。”
在總電量固定的前提下,省下來的每一瓦,就是多賺的算力。當(dāng)所有人討論芯片晶體管數(shù)量和制程工藝時(shí),一場(chǎng)藏在變壓器和冷卻液管路里的較量,正悄然重塑算力競(jìng)賽的底層規(guī)則。
“中國(guó)AI的優(yōu)勢(shì)在數(shù)據(jù)”
談及中國(guó)算力產(chǎn)業(yè)如何走出自己的路,王皓霆給出了判斷框架。
“美國(guó)是先有算力,再有大模型。我們拿到大模型,適配的是英偉達(dá)算力,現(xiàn)在要反過來——用自己的算力適配自己的模型?!?/p>
這是重要的認(rèn)知差異。美國(guó)路徑是“算力先行”:先有英偉達(dá)GPU集群,再有OpenAI的GPT系列。中國(guó)路徑相反:先在英偉達(dá)算力上訓(xùn)練出有競(jìng)爭(zhēng)力的大模型,現(xiàn)在要把底座換成國(guó)產(chǎn)算力——相當(dāng)于在飛機(jī)飛行中換引擎,難度很大。
但王皓霆認(rèn)為,中國(guó)有美國(guó)不具備的結(jié)構(gòu)性優(yōu)勢(shì)。
“中美產(chǎn)業(yè)有個(gè)明顯差異——美國(guó)優(yōu)勢(shì)在技術(shù),我們優(yōu)勢(shì)在數(shù)據(jù)。12億人每天產(chǎn)生的數(shù)據(jù)量,是美國(guó)人眼紅的?!?/p>
數(shù)據(jù)是AI大模型的“燃料”。中國(guó)有全球最大規(guī)模的互聯(lián)網(wǎng)用戶群體,在電商、社交、出行、支付等場(chǎng)景每天產(chǎn)生海量數(shù)據(jù),為大模型訓(xùn)練和優(yōu)化提供天然素材。OpenRouter上中國(guó)模型Token調(diào)用量超六成的數(shù)據(jù),從另一維度印證了這一點(diǎn):龐大用戶基數(shù)和豐富應(yīng)用場(chǎng)景,不僅為模型訓(xùn)練提供素材,更在推理側(cè)形成持續(xù)“飛輪效應(yīng)”——用的人越多,模型迭代越快,調(diào)用量越大,對(duì)底層算力需求越旺盛。
中國(guó)可能暫時(shí)造不出最好的“發(fā)動(dòng)機(jī)”(芯片),但有最豐富的“燃料”(數(shù)據(jù))和最密集的“公路網(wǎng)”(應(yīng)用場(chǎng)景)——路上已跑滿“拖拉機(jī)”。
太初元碁首席產(chǎn)品官洪源也持類似觀點(diǎn)。他對(duì)觀察者網(wǎng)表示,目前初代AI加速卡內(nèi),單顆芯片算力可支持AI大模型同時(shí)處理100至500個(gè)并發(fā)問答任務(wù)。面對(duì)AI大模型爆發(fā)式增長(zhǎng)的算力需求,實(shí)驗(yàn)室近期研發(fā)重點(diǎn)聚焦在算力性能突破、系統(tǒng)架構(gòu)升級(jí)、實(shí)際場(chǎng)景深度融合三個(gè)方向。
“有需求、有數(shù)據(jù)、有場(chǎng)景,缺的就是時(shí)間,”王皓霆說,“給我們兩到三年窗口期,中國(guó)算力市場(chǎng)不會(huì)比美國(guó)差。”
“決定未來的,除了算力,還有定力”
在全球數(shù)字經(jīng)濟(jì)發(fā)展大潮下,算力是核心生產(chǎn)力,也是驅(qū)動(dòng)千行百業(yè)智能化升級(jí)的關(guān)鍵支撐。
除了算力,興化當(dāng)?shù)匾晃还賳T對(duì)觀察者網(wǎng)說:“決定AI發(fā)展未來的,一個(gè)是算力,一個(gè)是定力?!?/p>
他說的定力,不只是興化這樣的地方政府,愿意在產(chǎn)業(yè)空白上用180天建算力服務(wù)器產(chǎn)線的決心;也不局限于漢騰這樣的民營(yíng)企業(yè),在華為、浪潮、中科曙光等巨頭林立的市場(chǎng)中,從算法起家、逐步向算力上游延伸的耐心。而是整個(gè)國(guó)產(chǎn)算力產(chǎn)業(yè)鏈,在芯片被“卡脖子”的壓力下,沒有急于求成追最高制程,而是選擇先把路跑通的務(wù)實(shí)路徑。
王皓霆對(duì)未來的信心基于簡(jiǎn)單邏輯:“錢進(jìn)來了,技術(shù)就會(huì)進(jìn)來。技術(shù)進(jìn)來了,所有問題都能解決?!彼J(rèn)為,算力產(chǎn)業(yè)的核心驅(qū)動(dòng)力終究是市場(chǎng)需求,而中國(guó)需求端正在爆發(fā)。
產(chǎn)業(yè)端數(shù)據(jù)佐證了這一判斷。當(dāng)前算力租賃市場(chǎng)基本供不應(yīng)求,服務(wù)器價(jià)格較上一年上漲約30%。行業(yè)預(yù)測(cè)國(guó)產(chǎn)算力服務(wù)器將迎來井噴式增長(zhǎng),國(guó)產(chǎn)AI芯片正從推理側(cè)的“單點(diǎn)突破”邁向訓(xùn)練側(cè)的“體系化崛起”。
下午四點(diǎn),興化冬日天色漸暗。148米的產(chǎn)線完成當(dāng)天最后一輪試產(chǎn)調(diào)試,車間燈光次第熄滅。春節(jié)后,這條線將正式量產(chǎn),每臺(tái)下線服務(wù)器經(jīng)老化測(cè)試后隨即裝車,沿高速公路駛向承德、石家莊——在那里,它們將與數(shù)千臺(tái)同伴組成萬卡級(jí)國(guó)產(chǎn)算力集群。
沒人會(huì)記住一臺(tái)臺(tái)拖拉機(jī)的名字,但所有人會(huì)記住它壓出的路,興化這條148米的算力產(chǎn)線,只是國(guó)產(chǎn)算力突圍的起點(diǎn)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com


