機器人專用芯片是偽命題?英特爾宋繼強:市場規(guī)模有限,當(dāng)前難實現(xiàn)盈利 讓“天才少年”蛻變?yōu)椤翱煽抗そ场?,具身智能需跨越三道關(guān)鍵關(guān)卡
在英特爾研究院副總裁宋繼強看來,具身智能若要真正走進工廠、融入家庭,必須跨越“可靠性”這道巨大的障礙——而實現(xiàn)這一目標的方法,是為機器人配備三套系統(tǒng)。
1月20日,英特爾研究院副總裁、英特爾中國研究院院長宋繼強接受了包括鳳凰網(wǎng)在內(nèi)的多家媒體的采訪。
“如今的具身智能機器人,就像一個‘天才兒童’:在理想環(huán)境下表現(xiàn)出色,但一旦遭遇意外情況,就可能變得手足無措?!彼卫^強這樣描述當(dāng)前行業(yè)面臨的共同挑戰(zhàn)。
在他身后的屏幕上,展示著一個三層架構(gòu)的系統(tǒng)框圖——這正是英特爾為應(yīng)對上述挑戰(zhàn)提出的“三重系統(tǒng)”解決方案。
隨著ChatGPT引發(fā)的大模型浪潮逐漸延伸到物理世界,具身智能(Embodied AI)已成為全球科技競爭的下一個焦點領(lǐng)域。從特斯拉的Optimus到小鵬汽車推出的Iron,機器人正被賦予前所未有的理解和決策能力。

然而,從演示視頻走向?qū)嶋H應(yīng)用場景,一道關(guān)乎“可靠性”的鴻溝橫在眼前。宋繼強指出,當(dāng)前基于視覺語言模型(VLA)的機器人,其動作生成的準確率“大約在百分之六七十左右”,幻覺、環(huán)境適應(yīng)性差、長任務(wù)規(guī)劃能力弱等問題仍未得到解決。
“如果我們希望它能在3年左右真正實現(xiàn)落地,并且不出現(xiàn)因安全問題導(dǎo)致的重大事故,就需要盡早建立相關(guān)框架,凝聚行業(yè)共識?!彼卫^強表示。
系統(tǒng)架構(gòu):為機器人裝上“三重安全保障”
根據(jù)宋繼強的闡述,一套可信賴的具身智能系統(tǒng)應(yīng)由三個層次組成:主系統(tǒng)(Primary System)、安全系統(tǒng)(Safety System)和后備系統(tǒng)(Fallback System)。
主系統(tǒng)承載著機器人的“智能”功能,負責(zé)決策、規(guī)劃和行動生成。英特爾大力推廣的“神經(jīng)符號AI”方法是其核心,旨在結(jié)合神經(jīng)網(wǎng)絡(luò)的泛化能力與符號邏輯的可靠性和可解釋性。
“它既運用了神經(jīng)網(wǎng)絡(luò)的泛化能力,避免機器人局限于單一的場景和方案,又能融合傳統(tǒng)基于符號、規(guī)則和知識的方法?!彼卫^強解釋道,這相當(dāng)于“提高機器人的下限”,確保其不會因幻覺等問題產(chǎn)生災(zāi)難性的后果。
但現(xiàn)實世界充滿了意外情況。執(zhí)行器故障、傳感器錯誤、未知障礙物、地面打滑……這些都超出了主系統(tǒng)的認知范圍。因此,需要引入更底層的保障機制。
安全系統(tǒng)是一個輕量、高可靠的監(jiān)控層,持續(xù)對比機器人的執(zhí)行狀態(tài)與預(yù)設(shè)的安全規(guī)則(如“不得碰撞人類”“持有尖銳物體時需保持安全距離”),一旦發(fā)現(xiàn)偏離就立即發(fā)出告警或進行干預(yù)。
如果安全系統(tǒng)也無法處理,例如機器人即將摔倒,后備系統(tǒng)就會被激活。它的目標不是讓機器人“緊急停止”,而是引導(dǎo)其進入一個可靠的降級狀態(tài)。
“比如,機器人可以像汽車一樣緩慢地靠邊???;如果即將摔倒,可以選擇無人區(qū)域,通過鎖定部分關(guān)節(jié)來實現(xiàn)緩慢摔倒?!彼卫^強說。
這套“PMDF”框架(分別對應(yīng)具身智能主控系統(tǒng)、監(jiān)控系統(tǒng)、安全決策以及故障處理和恢復(fù)),已被寫入英特爾聯(lián)合多家合作伙伴發(fā)布的《具身機器人智能安全子系統(tǒng)白皮書》中。宋繼強透露,白皮書發(fā)布后反響良好,不少學(xué)術(shù)界和業(yè)界單位都希望參與到推進工作中來。
專用芯片尚未到來,英特爾押注“傳統(tǒng)優(yōu)勢領(lǐng)域”
當(dāng)話題轉(zhuǎn)向硬件時,鳳凰網(wǎng)科技提出了一個問題:未來機器人領(lǐng)域是否會出現(xiàn)專用芯片?面對特斯拉、小鵬等車企自研芯片的趨勢,英特爾的機會在哪里?
宋繼強的回答坦誠且務(wù)實。他明確判斷,目前機器人市場規(guī)模還比較小,專用芯片在經(jīng)濟上是不可行的?!昂诵脑蛟谟跈C器人市場的規(guī)模目前還很小,對于芯片廠商來說,專門為機器人定制芯片很難實現(xiàn)盈利。”
當(dāng)前行業(yè)普遍復(fù)用手機、汽車、PC等領(lǐng)域的成熟芯片,并進行改造適配。更深層次的原因在于,機器人的“工作負載”尚未定型?!拔覀儫o法確定,芯片是應(yīng)該針對VLA的工作負載進行優(yōu)化,還是為后續(xù)的世界模型工作負載提供支持?!?/p>
在這種情況下,通用芯片是更穩(wěn)妥的選擇。宋繼強預(yù)計,只有當(dāng)行業(yè)形成標準化的工作負載后,專用芯片(ASIC)才會出現(xiàn),其研發(fā)周期可能在10到18個月之間。
那么,英特爾的機會在哪里呢?宋繼強將答案指向了英特爾在工業(yè)控制領(lǐng)域長期被忽視的“隱形冠軍”地位。

“在傳統(tǒng)工業(yè)自動化領(lǐng)域,英特爾的市場地位可以用‘絕對優(yōu)勢’來形容……在工業(yè)場景的高精度、高頻率運動控制領(lǐng)域,大部分工控產(chǎn)品和工控板都是基于英特爾的CPU開發(fā)的?!?/p>
他總結(jié)了三大優(yōu)勢:一是技術(shù)遷移,將工業(yè)運動控制的經(jīng)驗遷移到機器人的動作控制層;二是資源調(diào)度優(yōu)化,確保運動控制等毫秒級任務(wù)不被其他任務(wù)干擾;三是多系統(tǒng)融合能力,實現(xiàn)隔離監(jiān)控和快速安全響應(yīng)。
對于當(dāng)下備受關(guān)注的酷睿Ultra等集成AI算力的芯片,宋繼強將其視為“穩(wěn)定的硬件基礎(chǔ)”。如果算力不足,可以額外配置AI算力卡。他預(yù)判,未來的主流部署模式將是“機器人終端+邊緣服務(wù)器”,在低延遲的前提下,將大模型部署在邊緣,形成跨網(wǎng)絡(luò)的異構(gòu)計算資源池。
現(xiàn)實瓶頸:數(shù)據(jù)孤島、VLA幻覺與成本懸崖
盡管藍圖清晰,但通往可靠具身智能的道路上充滿了困難。宋繼強在回答多個問題時,描繪出了當(dāng)前最主要的幾大瓶頸。
首先面臨的是VLA(視覺語言模型)的能力上限問題。宋繼強直言,當(dāng)前VLA的準確率僅在百分之六七十,存在明顯的幻覺問題,而且對視覺環(huán)境變化敏感,泛化能力較弱。“它并沒有真正理解場景的本質(zhì),不具備對場景中物體三維關(guān)系、因果關(guān)系的認知能力。”
這也是行業(yè)轉(zhuǎn)而關(guān)注“世界模型”的原因——為其補充物理定律和因果關(guān)系認知。但世界模型自身也面臨著與真實場景融合的挑戰(zhàn)。
更深層次、更根本的挑戰(zhàn)來自于數(shù)據(jù)。宋繼強指出,數(shù)據(jù)問題是行業(yè)的核心痛點。具身智能需要場景理解、任務(wù)規(guī)劃和機器人本體三類數(shù)據(jù),但目前的現(xiàn)狀是“數(shù)據(jù)孤島”現(xiàn)象嚴重。
“不同行業(yè)場景、不同機器人本體、不同任務(wù)類型所需的數(shù)據(jù)差異很大?!彼信e了建立統(tǒng)一數(shù)據(jù)標準的四個難點:數(shù)據(jù)完整性的定義不明確(是否需要觸覺等數(shù)據(jù));操作精度和頻率沒有統(tǒng)一要求;機器人本體沒有公認的最優(yōu)方案;數(shù)據(jù)采集視角尚未確定。
“因此,當(dāng)前行業(yè)仍處于各自探索的階段,短期內(nèi)會保持‘百花齊放’的狀態(tài)?!?/p>
最后一個關(guān)卡是量產(chǎn)與成本問題。宋繼強提醒,目前展會上的機器人大多是“手工制作的原型機”,零部件未達到車規(guī)級或工業(yè)級標準,一致性較差。“機器人整體價格的下降也依賴于大廠的進入?!?/p>
他以特斯拉為例,指出行業(yè)看好特斯拉的核心原因之一就是其強大的量產(chǎn)能力。只有通過工業(yè)化量產(chǎn)降低硬件成本,同時使智能能力達到標準,機器人才有可能走向更廣闊的商用乃至消費場景。
未來三年:從“展示天才”到“成為可靠工匠”
面對如此多的挑戰(zhàn),具身智能的落地時間表究竟是怎樣的呢?宋繼強給出了一個謹慎的預(yù)測。
“要將這些能力整合為一套可靠的解決方案,把VLA的準確率從目前的百分之六七十,提升到工業(yè)級應(yīng)用要求的99%以上,預(yù)計還需要兩三年的時間?!?/p>
他描繪了一條清晰的落地路徑:
短期內(nèi)(1-2年),在物流分揀、工廠搬運、標準件組裝等半結(jié)構(gòu)化場景實現(xiàn)小規(guī)模部署。這些場景用工成本高、環(huán)境相對可控,能夠容忍機器人初期的高成本。
中期(3年左右),隨著智能能力可靠性的提升、行業(yè)安全框架形成共識,在上述場景中擴大應(yīng)用規(guī)模。
長期來看,則取決于量產(chǎn)一致性和成本控制的突破,需要大型車企等具備工業(yè)化生產(chǎn)能力的企業(yè)進入行業(yè)來推動。
“這一發(fā)展路徑符合Gartner成長曲線的規(guī)律。”宋繼強總結(jié)道,先以技術(shù)預(yù)期吸引投入,快速提升能力;然后在部署過程中解決問題,在早期場景中驗證商業(yè)化;最終大廠進入,推動規(guī)?;l(fā)展。
在采訪的最后,宋繼強反復(fù)強調(diào)“融合”與“解耦”這一對看似矛盾的關(guān)鍵詞。
融合,是新老技術(shù)的融合——將前沿的AI模型與經(jīng)過驗證的傳統(tǒng)控制技術(shù)、安全工程相結(jié)合。解耦,是軟硬件在能力層面的解耦——讓上層的感知規(guī)劃模塊能夠適配不同的機器人本體,降低開發(fā)成本。
“具身智能的發(fā)展不會依賴單一的技術(shù)突破,而是需要新老技術(shù)的疊加融合?!彼卫^強說。一項未經(jīng)充分驗證的新技術(shù)無法直接應(yīng)用于關(guān)鍵任務(wù),只有與成熟技術(shù)結(jié)合,才能形成完整可靠的解決方案。

這或許正是英特爾在這場具身智能競賽中的獨特定位:不做最激進的顛覆者,而是做最可靠的整合者。利用其在工業(yè)領(lǐng)域數(shù)十年積累的“隱性知識”,為快速發(fā)展的AI“天才少年”,配備上經(jīng)過物理世界檢驗的“小腦”與“反射神經(jīng)”。
當(dāng)機器人離開聚光燈下的展示臺,走進嘈雜、混亂、充滿不確定性的真實世界時,決定其價值的將不再是它最驚艷的瞬間,而是它最不容易出錯的下限。而這,正是一場關(guān)于“可靠”的漫長工程的開端。
本文來自微信公眾號“鳳凰網(wǎng)科技”,作者:于浩,編輯:董雨晴,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





