Figure Helix系統(tǒng)引入System 0的技術(shù)突破與行業(yè)意義
本文來自微信公眾號(hào):42號(hào)電波,作者:蘭博,編輯:James
此前42號(hào)電波發(fā)布的Figure機(jī)器人相關(guān)文章引發(fā)熱議,網(wǎng)友圍繞Figure 03做家務(wù)是否真正自主展開討論。鑒于遙操作機(jī)器人偽裝自主的現(xiàn)象頻發(fā),觀眾對(duì)此類演示存在疑慮。本文將從技術(shù)層面解析Helix 02模型為Figure 03機(jī)器人帶來的全新能力。
Figure發(fā)布的視頻顯示,機(jī)器人在客廳可完成擦桌、撿玩具、清理沙發(fā)、關(guān)電視等操作,還能像人一樣將毛巾甩到肩上、把收納箱夾在腋下。官方稱這些新行為僅通過新增訓(xùn)練數(shù)據(jù)獲得,未針對(duì)單個(gè)動(dòng)作單獨(dú)設(shè)計(jì),核心在于年初發(fā)布的Helix 02模型——相比初代版本,其能力提升的關(guān)鍵是正式引入System 0系統(tǒng)層級(jí)。

為何要增設(shè)System 0
在原有Helix的System 2和System 1之下,System 0插入了以1 kHz運(yùn)行的全身控制器,負(fù)責(zé)平衡、接觸及全身協(xié)調(diào)。該層級(jí)通過超1000小時(shí)關(guān)節(jié)級(jí)人體運(yùn)動(dòng)數(shù)據(jù),結(jié)合大規(guī)模仿真到現(xiàn)實(shí)的強(qiáng)化學(xué)習(xí)訓(xùn)練而成,約1000萬參數(shù)的網(wǎng)絡(luò)替代了超10萬行手寫C++控制代碼。
有人認(rèn)為這只是新增低級(jí)控制器,但System 0的加入實(shí)則重新劃分了機(jī)器人系統(tǒng)邊界。去年Figure初代Helix模型聚焦人形機(jī)器人上半身操作,今年Helix 02能讓Figure 03在移動(dòng)中完成精確操作,System 0是關(guān)鍵所在。

過去行業(yè)討論VLA時(shí),核心集中在機(jī)器人能否理解世界、能否按語言完成動(dòng)作,卻鮮少關(guān)注穩(wěn)定移動(dòng)操作的融入。盡管機(jī)器人在移動(dòng)(走路、跑步、越障)和操作(抓取、放置、操作物體)兩方面表現(xiàn)不錯(cuò),但兩者很少能同時(shí)實(shí)現(xiàn)。多數(shù)模型默認(rèn)二者可拆分,即先走過去、停下、穩(wěn)住、再操作、再移動(dòng),導(dǎo)致很多機(jī)器人演示動(dòng)作分段,不夠連貫。
然而真實(shí)世界并非如此,人在日常生活中很少完全停下再做動(dòng)作,移動(dòng)和操作往往耦合而非串行。Figure在Helix 02介紹中提到,移動(dòng)操作一體化的難點(diǎn)不在于走路或操作本身,而在于兩者無法清晰分解。
因此,System 0的出現(xiàn)將“機(jī)器人本體如何穩(wěn)定移動(dòng)操作”納入學(xué)習(xí)系統(tǒng),意味著Helix 02不只是想成為調(diào)用技能的智能體,更試圖改寫技能生成方式及身體控制本身。

用智能體與技能類比理解System 0
用當(dāng)下熱門的智能體概念類比,能更直觀理解Helix 02的結(jié)構(gòu):最上層是智能體,負(fù)責(zé)決策,觀察環(huán)境后判斷下一步行動(dòng);中間是技能,如同“工種包”,如走路、伸手、抓取、放置;最下層是控制器,負(fù)責(zé)執(zhí)行動(dòng)作,讓電機(jī)轉(zhuǎn)動(dòng)、身體移動(dòng)。
傳統(tǒng)結(jié)構(gòu)中各層邊界清晰,智能體不管具體抓取方式,技能不管身體穩(wěn)定性,控制器不理解任務(wù)。但進(jìn)入真實(shí)環(huán)境后,易出現(xiàn)各層單獨(dú)看都沒錯(cuò),組合起來卻不順暢的情況,動(dòng)作被強(qiáng)行分段。一旦環(huán)境變化,如物體位置偏移或地面不平,這種分段結(jié)構(gòu)就易出問題。
Helix 02的變化可通過同樣類比來看:System 2仍是智能體,負(fù)責(zé)理解任務(wù)和場(chǎng)景;System 1不再是離散技能庫,更像連續(xù)技能生成器,不調(diào)用“走路”或“抓取”,而是持續(xù)生成全身動(dòng)作;System 0可理解為身體反射或“肌肉記憶”。這三層與傳統(tǒng)結(jié)構(gòu)的關(guān)鍵區(qū)別在于,技能不再是系統(tǒng)中間樞紐,它處于最底層,作用是讓執(zhí)行過程穩(wěn)定、自然且連續(xù)。
這些功能在傳統(tǒng)系統(tǒng)中通常分散在各類控制邏輯和補(bǔ)償模塊,而在Helix 02中被統(tǒng)一為習(xí)得先驗(yàn)。System 0是所有動(dòng)作成立的身體基礎(chǔ),正因如此,System 1才能放心生成連續(xù)動(dòng)作,無需每一步都考慮是否會(huì)摔倒、接觸是否會(huì)中斷,這也是Helix 02能將原本需拆開的動(dòng)作變?yōu)檫B續(xù)行為,讓Figure 03機(jī)器人干活更流暢的原因。

深入解析:System 0實(shí)際改變了什么?
若僅認(rèn)為System 0是“新增1 kHz控制層”,易低估其帶來的變化。從關(guān)鍵技術(shù)點(diǎn)分析:
首先是訓(xùn)練數(shù)據(jù)形態(tài)。System 0使用超1000小時(shí)關(guān)節(jié)級(jí)人體運(yùn)動(dòng)數(shù)據(jù),且這些數(shù)據(jù)已重新定位到機(jī)器人本體關(guān)節(jié)空間,學(xué)習(xí)的是人體運(yùn)動(dòng)時(shí)各關(guān)節(jié)的協(xié)調(diào)關(guān)系,而非簡(jiǎn)單走路姿勢(shì)。
其次是模型角色與規(guī)模。Figure介紹System 0是約1000萬參數(shù)的網(wǎng)絡(luò),輸入全身關(guān)節(jié)狀態(tài)和基座運(yùn)動(dòng)信息,輸出1 kHz關(guān)節(jié)級(jí)執(zhí)行器指令。該規(guī)模使其更接近高頻、低延遲、強(qiáng)約束的運(yùn)動(dòng)先驗(yàn)網(wǎng)絡(luò),不負(fù)責(zé)理解環(huán)境或生成任務(wù)層面動(dòng)作,專門解決高頻閉環(huán)中如何將上層動(dòng)作目標(biāo)穩(wěn)定轉(zhuǎn)化為物理可執(zhí)行行為的問題。
再者是訓(xùn)練方式。System 0完全在仿真中訓(xùn)練,使用超20萬并行環(huán)境和大規(guī)模領(lǐng)域隨機(jī)化,學(xué)習(xí)在各種擾動(dòng)和接觸條件下保持身體穩(wěn)定,通過仿真窮舉身體可能遇到的物理情況,讓策略在這些分布上收斂。
還有與System 1的接口設(shè)計(jì)。System 1仍是Transformer,負(fù)責(zé)將感知和語義目標(biāo)轉(zhuǎn)化為全身動(dòng)作,但輸出的是關(guān)節(jié)目標(biāo)位置,而非直接控制力。System 0接管“最后一跳”,在1 kHz頻率下將這些目標(biāo)轉(zhuǎn)化為具體執(zhí)行器指令,過程中持續(xù)修正誤差、處理接觸、維持平衡。
這種接口設(shè)計(jì)較為克制,F(xiàn)igure未將所有內(nèi)容揉成端到端黑箱,而是按時(shí)間尺度分層:慢的部分負(fù)責(zé)理解,中的部分負(fù)責(zé)生成,快的部分負(fù)責(zé)穩(wěn)定。從這個(gè)角度看,System 0改寫的是從動(dòng)作到物理執(zhí)行鏈路的表達(dá)方式,用習(xí)得先驗(yàn)在高頻閉環(huán)中統(tǒng)一處理相關(guān)問題,這也是Figure強(qiáng)調(diào)“10萬行C++被替代”的原因——從顯式規(guī)則轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的運(yùn)動(dòng)先驗(yàn)。
機(jī)器人技術(shù)路線的轉(zhuǎn)向
System 0的加入讓Helix 02模型具備強(qiáng)大移動(dòng)操作能力,這也反映出今年機(jī)器人行業(yè)的一大重點(diǎn):移動(dòng)與操作的融合。在機(jī)器人需規(guī)模落地真實(shí)環(huán)境的背景下,去年行業(yè)中大量聚焦上半身操作的模式已難以滿足應(yīng)用需求。
這一過程類似智能駕駛的發(fā)展路徑:產(chǎn)業(yè)早期比拼單個(gè)模塊質(zhì)量,后來越來越多能力被統(tǒng)一模型整合。與Google DeepMind RT-2擅長(zhǎng)的語義理解和動(dòng)作選擇、英偉達(dá)GR00T強(qiáng)調(diào)的模型和數(shù)據(jù)體系不同,Helix 02更側(cè)重機(jī)器人動(dòng)作在現(xiàn)實(shí)世界中的連續(xù)可行性,即移動(dòng)操作一體化。
不過,盡管Figure展示的廚房和客廳整理任務(wù)完成度較高,但目前尚未展示其機(jī)器人在陌生環(huán)境、強(qiáng)擾動(dòng)、長(zhǎng)時(shí)序失敗恢復(fù)及跨家庭泛化等維度上,S0+S1+S2系統(tǒng)的真實(shí)魯棒性,這是后續(xù)需驗(yàn)證的內(nèi)容。
就目前而言,Helix 02將各類工具能力融合為連續(xù)策略,并新增高頻次身體先驗(yàn)約束的路線,讓機(jī)器人系統(tǒng)鏈路從“像素到動(dòng)作”進(jìn)一步延伸至“像素到扭矩”。未來,模型與身體的融合協(xié)同能力將成為機(jī)器人發(fā)展的重要主線。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



