180天,蘇中小城的國產(chǎn)算力破局之路
本文來自微信公眾號:觀網(wǎng)財經(jīng),作者:陳濟深
春節(jié)前夕,江蘇興化,一條148米長的生產(chǎn)線正進行最后的試運行調(diào)試。
這是國內(nèi)目前最長的直通式算力服務器產(chǎn)線——從裸板上線到整機下線,一臺4U 8卡算力服務器走完全程,滿產(chǎn)時僅需5分鐘。服務器下線后,要經(jīng)歷連續(xù)三天三夜?jié)M負荷運行、模擬真實算力中心極端工況的老化測試,之后發(fā)往承德、石家莊、興化等地的萬卡集群項目,成為國產(chǎn)智算中心的基石。

算力服務器組裝生產(chǎn)線
“生產(chǎn)一臺服務器的時間,和釀一瓶醬油差不多,”漢騰科技董事長王皓霆對觀察者網(wǎng)說,“以前講深圳速度,現(xiàn)在我們叫漢興速度。”
興化是座以不銹鋼和健康食品聞名的蘇中小城,歷史上沒有算力和AI產(chǎn)業(yè)基礎,但王皓霆看中的正是這種“白紙”狀態(tài)——無歷史包袱,地方政府全力配合,基建到投產(chǎn)的速度被壓縮到極致。這條投資11億元、預計年產(chǎn)10萬臺的算力服務器產(chǎn)線,從簽約到投產(chǎn)僅用180天。
產(chǎn)線投產(chǎn)的時間,恰好趕上國產(chǎn)算力需求爆發(fā)的臨界點。
工信部數(shù)據(jù)顯示,隨著我國AI行業(yè)快速發(fā)展,智算規(guī)模已達1590 EFLOPS。2026年被產(chǎn)業(yè)界視為國產(chǎn)算力規(guī)模部署元年,字節(jié)跳動、騰訊、百度對國產(chǎn)算力服務器的導入目標普遍較上一年翻倍。在國際地緣復雜的背景下,國產(chǎn)算力自主可控的緊迫性更顯突出。
在此背景下,觀察者網(wǎng)春節(jié)前走訪了江蘇興化漢騰科技產(chǎn)線現(xiàn)場和無錫太初元碁硬件研發(fā)中心實驗室。興化這條148米產(chǎn)線上的故事,不只是一家企業(yè)的投產(chǎn)事,更是中國國產(chǎn)算力產(chǎn)業(yè)鏈從“能用”邁向“規(guī)?;渴稹钡目s影。
“拖拉機先開路,路好車自優(yōu)”
在產(chǎn)線上,觀察者網(wǎng)提出一個常被討論的問題:國產(chǎn)算力制程并非全球頂尖,面對行業(yè)快速迭代,市場會買單嗎?
王皓霆打了個比方:“國家修了國道,沒必要只跑法拉利?!?/p>
全球最先進制程的芯片是“法拉利”,但國道不是為法拉利單獨修的。王皓霆認為,目前8到12納米制程的芯片,足以覆蓋未來兩到三年的主流算力需求——真正可能閑置的,反而是那些遠超當前應用場景的過高制程產(chǎn)品。
“不是說先進制程不重要,而是現(xiàn)階段我們的‘路’——應用場景和基礎設施——還沒到需要跑法拉利的程度。先讓拖拉機跑起來,把路跑通,車自然會升級。”王皓霆解釋。
事實上,“拖拉機”已跑出成績。
監(jiān)控全球大模型實際調(diào)用的平臺OpenRouter最新數(shù)據(jù)就是明證,春節(jié)期間全球Token調(diào)用量前十中,中國模型占四席、份額過半,支撐這些模型運行的,相當一部分是基于國產(chǎn)算力的推理集群。市場并未因制程不最先進而拒絕國產(chǎn)算力,相反,當模型運行良好,用戶根本不關心底層芯片是幾納米——他們在意的是響應速度和調(diào)用成本。
這種務實邏輯在興化產(chǎn)線得到體現(xiàn)。這里生產(chǎn)的服務器搭載龍芯3C6000處理器和太初元碁自研的T100 AI加速卡——對當前算力需求來說夠用、管用,完全自主可控,供應鏈穩(wěn)定,性價比合理。用王皓霆的話說,現(xiàn)在要做的不是造法拉利,而是讓足夠多的拖拉機上路。
在距興化約200公里的無錫惠山,太初元碁硬件研發(fā)中心實驗室里,科研人員正進行關鍵工序:將國產(chǎn)AI芯片測試、封裝成AI加速卡,再插裝到對應服務器中,進行大規(guī)模軟硬件協(xié)同調(diào)試。至此,服務器初步具備為大模型提供AI算力的能力。
太初元碁的技術路線與國內(nèi)主流GPGPU架構(gòu)廠商不同。它脫胎于國家超級計算無錫中心和清華大學團隊,采用異構(gòu)眾核架構(gòu)——簡單說,不追求單一芯片的絕對性能,而是通過集成不同類型計算單元,讓系統(tǒng)整體算力最大化。
太初元碁首席產(chǎn)品官洪源對觀察者網(wǎng)表示:“異構(gòu)的核心是將不同類型、不同特長的算力有機系統(tǒng)化結(jié)合”,而非“簡單堆積不同處理器”。
這種思路呼應了王皓霆的“拖拉機論”:不追求單點最強,而是系統(tǒng)最優(yōu)。
這條路已開始跑通。2026年初,基于國產(chǎn)芯片訓練的AI大模型密集落地:智譜聯(lián)合華為開源的GLM-Image成為首個依托國產(chǎn)芯片實現(xiàn)全程訓練的SOTA多模態(tài)模型;中國電信開源的千億級星辰大模型也在上海臨港國產(chǎn)萬卡算力池完成全流程訓練。
國產(chǎn)算力不再是實驗室樣品,而是在承擔真實訓練任務。
“算力服務器不是拼積木,是系統(tǒng)工程題”
很多人認為算力服務器像拼積木一樣把芯片插進機箱,實際并非如此。
在產(chǎn)線上,王皓霆指著一臺正在組裝的4U服務器解釋:“算力服務器的核心技術在適配。一是CPU和GPU之間的適配,二是內(nèi)部線路、冷卻方案的適配。不同芯片用不同元器件適配,性能會有差異?!?/p>
他打了個更形象的比方:“四缸汽車和八缸汽車,不是互換發(fā)動機就能無縫運行?!?/p>
這意味著,算力服務器內(nèi)部,CPU負責調(diào)度,GPU負責加速計算,供電方案影響算力釋放效率,冷卻方案決定芯片能否長期穩(wěn)定運行——都不是簡單拼裝,而是深度耦合的系統(tǒng)工程?!耙材芡ㄟ^電和冷卻方案提升算力,這和大家以為的‘芯片決定一切’不一樣?!?/p>
這也是漢騰選擇聯(lián)合龍芯、太初元碁、臺達組成“國產(chǎn)夢之隊”的原因。龍芯3C6000提供完全自主可控的CPU,王皓霆稱它為“全漢字字典”,從指令集到微架構(gòu)全自主研發(fā);太初T100提供AI加速卡;臺達提供電源和冷卻方案——三者需大量適配和調(diào)試,才能讓服務器釋放最大算力。
這也說明,國產(chǎn)算力服務器的壁壘不僅在單一高精尖技術,更在打通產(chǎn)業(yè)鏈各環(huán)節(jié)、協(xié)同起來的系統(tǒng)集成能力。除了部件突破,各環(huán)節(jié)的適配磨合,也需要“系統(tǒng)集成者”。
這道系統(tǒng)工程題,放大到集群層面,難度再上一個量級。
“外界常說萬卡萬卡,好像一萬張卡就是數(shù)量。其實萬卡是難度標準,不是體量標準?!蓖躔獙τ^察者網(wǎng)說。
一萬張卡意味著數(shù)千臺服務器、數(shù)萬條高速互聯(lián)線路、龐大的供電和冷卻系統(tǒng),以及復雜的軟件調(diào)度——單臺服務器的適配難題,在集群層面被放大數(shù)千倍。
王皓霆透露,漢騰已簽署五大萬卡集群建設合作協(xié)議,分布在承德、石家莊、興化等地,面向金融、醫(yī)療、物流等行業(yè)場景?!跋茸屪约旱哪P陀米约旱目ㄅ芷饋?,了解實際流程才能最終實現(xiàn)國產(chǎn)替代?!?/p>
“電沒增,算力就增了”
當外界目光聚焦芯片廠的“納米之戰(zhàn)”時,算力產(chǎn)業(yè)在物理世界撞上另一堵墻——電力。
王皓霆算了筆賬:傳統(tǒng)通用服務器時代,單機柜功率超12千瓦的很少?,F(xiàn)在,一臺4U 8卡智算服務器滿載功耗近5.4千瓦,一個機柜塞8臺,輕松突破40千瓦。這意味著,過去數(shù)據(jù)中心的配電網(wǎng)絡、變壓器乃至整體能耗指標(PUE),都面臨“超載”癱瘓風險。
因數(shù)據(jù)中心高能耗,各地政府對其電網(wǎng)容量管控趨嚴——智算中心能拿到的總電量幾乎是固定的。
芯片制程短期內(nèi)按節(jié)奏推進,總電量也加不上。怎么辦?
漢騰聯(lián)合全球電源管理巨頭臺達,研發(fā)了SST技術(800V直流直供)。傳統(tǒng)機房里,電從市電到芯片,要多次交直流轉(zhuǎn)換,每次轉(zhuǎn)換都有熱損耗——這些熱量不產(chǎn)生算力,卻消耗電費和冷卻資源。800V直流直供的邏輯很簡單:減少轉(zhuǎn)換環(huán)節(jié),讓電更“直”地到芯片。
在太初元碁的方案中,這項供電技術與自研AI芯片、高效液冷整合為“三位一體”系統(tǒng):互聯(lián)、供電、冷卻的高密度集成。結(jié)果是,設備空間利用率較傳統(tǒng)方案提升一倍,單機架可容納128顆芯片,系統(tǒng)PUE降至1.15。
相比傳統(tǒng)數(shù)據(jù)中心1.3到1.5的PUE,每降低0.1,萬卡級智算中心一年省下的電費可達數(shù)百萬元——更重要的是,省下來的每一度電、減少的每一分熱損耗,都能轉(zhuǎn)化為芯片開機時間。
在走訪現(xiàn)場,王皓霆用樸素的話道出參數(shù)背后的邏輯:“你使勁算的時候,電沒增加,算力肯定就增加了?!?/p>
在總電量固定的前提下,省下來的每一瓦,就是多賺的算力。當所有人討論芯片晶體管數(shù)量和制程工藝時,一場藏在變壓器和冷卻液管路里的較量,正悄然重塑算力競賽的底層規(guī)則。
“中國AI的優(yōu)勢在數(shù)據(jù)”
談及中國算力產(chǎn)業(yè)如何走出自己的路,王皓霆給出了判斷框架。
“美國是先有算力,再有大模型。我們拿到大模型,適配的是英偉達算力,現(xiàn)在要反過來——用自己的算力適配自己的模型?!?/p>
這是重要的認知差異。美國路徑是“算力先行”:先有英偉達GPU集群,再有OpenAI的GPT系列。中國路徑相反:先在英偉達算力上訓練出有競爭力的大模型,現(xiàn)在要把底座換成國產(chǎn)算力——相當于在飛機飛行中換引擎,難度很大。
但王皓霆認為,中國有美國不具備的結(jié)構(gòu)性優(yōu)勢。
“中美產(chǎn)業(yè)有個明顯差異——美國優(yōu)勢在技術,我們優(yōu)勢在數(shù)據(jù)。12億人每天產(chǎn)生的數(shù)據(jù)量,是美國人眼紅的?!?/p>
數(shù)據(jù)是AI大模型的“燃料”。中國有全球最大規(guī)模的互聯(lián)網(wǎng)用戶群體,在電商、社交、出行、支付等場景每天產(chǎn)生海量數(shù)據(jù),為大模型訓練和優(yōu)化提供天然素材。OpenRouter上中國模型Token調(diào)用量超六成的數(shù)據(jù),從另一維度印證了這一點:龐大用戶基數(shù)和豐富應用場景,不僅為模型訓練提供素材,更在推理側(cè)形成持續(xù)“飛輪效應”——用的人越多,模型迭代越快,調(diào)用量越大,對底層算力需求越旺盛。
中國可能暫時造不出最好的“發(fā)動機”(芯片),但有最豐富的“燃料”(數(shù)據(jù))和最密集的“公路網(wǎng)”(應用場景)——路上已跑滿“拖拉機”。
太初元碁首席產(chǎn)品官洪源也持類似觀點。他對觀察者網(wǎng)表示,目前初代AI加速卡內(nèi),單顆芯片算力可支持AI大模型同時處理100至500個并發(fā)問答任務。面對AI大模型爆發(fā)式增長的算力需求,實驗室近期研發(fā)重點聚焦在算力性能突破、系統(tǒng)架構(gòu)升級、實際場景深度融合三個方向。
“有需求、有數(shù)據(jù)、有場景,缺的就是時間,”王皓霆說,“給我們兩到三年窗口期,中國算力市場不會比美國差。”
“決定未來的,除了算力,還有定力”
在全球數(shù)字經(jīng)濟發(fā)展大潮下,算力是核心生產(chǎn)力,也是驅(qū)動千行百業(yè)智能化升級的關鍵支撐。
除了算力,興化當?shù)匾晃还賳T對觀察者網(wǎng)說:“決定AI發(fā)展未來的,一個是算力,一個是定力?!?/p>
他說的定力,不只是興化這樣的地方政府,愿意在產(chǎn)業(yè)空白上用180天建算力服務器產(chǎn)線的決心;也不局限于漢騰這樣的民營企業(yè),在華為、浪潮、中科曙光等巨頭林立的市場中,從算法起家、逐步向算力上游延伸的耐心。而是整個國產(chǎn)算力產(chǎn)業(yè)鏈,在芯片被“卡脖子”的壓力下,沒有急于求成追最高制程,而是選擇先把路跑通的務實路徑。
王皓霆對未來的信心基于簡單邏輯:“錢進來了,技術就會進來。技術進來了,所有問題都能解決?!彼J為,算力產(chǎn)業(yè)的核心驅(qū)動力終究是市場需求,而中國需求端正在爆發(fā)。
產(chǎn)業(yè)端數(shù)據(jù)佐證了這一判斷。當前算力租賃市場基本供不應求,服務器價格較上一年上漲約30%。行業(yè)預測國產(chǎn)算力服務器將迎來井噴式增長,國產(chǎn)AI芯片正從推理側(cè)的“單點突破”邁向訓練側(cè)的“體系化崛起”。
下午四點,興化冬日天色漸暗。148米的產(chǎn)線完成當天最后一輪試產(chǎn)調(diào)試,車間燈光次第熄滅。春節(jié)后,這條線將正式量產(chǎn),每臺下線服務器經(jīng)老化測試后隨即裝車,沿高速公路駛向承德、石家莊——在那里,它們將與數(shù)千臺同伴組成萬卡級國產(chǎn)算力集群。
沒人會記住一臺臺拖拉機的名字,但所有人會記住它壓出的路,興化這條148米的算力產(chǎn)線,只是國產(chǎn)算力突圍的起點。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



