口袋機(jī)采:讓“訓(xùn)練機(jī)器人”的能力,觸手可及
具身數(shù)采正從專業(yè)采集場(chǎng)景邁向日常生活
目前具身智能所需的數(shù)據(jù),仍局限于實(shí)驗(yàn)室和集中式數(shù)據(jù)采集場(chǎng)景,真實(shí)世界里多樣的操作與物理交互,難以被全面系統(tǒng)地覆蓋?;仡欁詣?dòng)駕駛的發(fā)展歷程,當(dāng)系統(tǒng)從實(shí)驗(yàn)室走向真實(shí)道路,數(shù)據(jù)也從少量、受控的采集,轉(zhuǎn)變?yōu)樵谡鎸?shí)場(chǎng)景中的規(guī)?;e累,進(jìn)而推動(dòng)模型能力快速提升。
基于這一經(jīng)驗(yàn),穹徹智能正式推出口袋機(jī)采(RoboPocket)——借助智能手機(jī)和App,每位使用者都能成為數(shù)據(jù)采集的參與者,完成任務(wù)并上傳數(shù)據(jù),實(shí)現(xiàn)輕量化、可控且高質(zhì)量的數(shù)據(jù)采集,將數(shù)據(jù)采集拓展到更廣泛的真實(shí)環(huán)境中,讓更多人能夠參與任務(wù)采集。并在輕量化、可控的前提下,持續(xù)產(chǎn)出高質(zhì)量可用數(shù)據(jù),為具身智能模型構(gòu)建更真實(shí)、可靠的數(shù)據(jù)基礎(chǔ)。

RoboPocket——讓普通人也能采集高質(zhì)量數(shù)據(jù)
RoboPocket是每個(gè)普通人都能操作的“從口袋取出即可開(kāi)始采集”的高質(zhì)量數(shù)據(jù)采集方案。
輕便易用:高度集成的高質(zhì)量數(shù)采設(shè)備
數(shù)據(jù)采集不再依賴復(fù)雜的專業(yè)設(shè)備,一部手機(jī)就能解鎖無(wú)限的高質(zhì)量采集。RoboPocket體積輕巧、開(kāi)箱即用,用戶只需用手機(jī)輕輕一碰,就能與設(shè)備連接開(kāi)始采集。

圖注:開(kāi)箱與快速啟動(dòng)
這樣輕便的數(shù)采方案并未犧牲精度。
手機(jī),如iPhone,同時(shí)具備RGB相機(jī)和深度相機(jī)(LiDAR),相比純視覺(jué)SLAM,它采用多傳感器融合(視覺(jué)、深度、IMU)的方案。在這一技術(shù)路線下,采集精度高于純VSLAM,對(duì)比紅外定位也無(wú)需攜帶基站,同時(shí)保持高度集成。可拆卸、可替換的魚(yú)眼鏡頭帶來(lái)超廣視野,原生鏡頭畫(huà)質(zhì)出色,能應(yīng)對(duì)強(qiáng)光、弱光等真實(shí)場(chǎng)景的挑戰(zhàn)。無(wú)論在昏暗的房間,還是野外陽(yáng)光直射的環(huán)境,都能保持良好性能。

圖注:魚(yú)眼鏡頭、超廣角視野
RoboPocket利用手機(jī)的成熟功能完成SLAM定位與建圖。相比原版UMI需要手動(dòng)標(biāo)定、反復(fù)操作,RoboPocket的核心價(jià)值之一就是讓“建圖成為用戶無(wú)感的事”。

圖注:快速建圖
實(shí)時(shí)保障采集質(zhì)量,RoboPocket更是智能中樞
在具身模型規(guī)模化發(fā)展的時(shí)代,數(shù)據(jù)質(zhì)量和數(shù)據(jù)量同等重要。
傳統(tǒng)的UMI式數(shù)采方案一直面臨著數(shù)據(jù)質(zhì)量、便攜易用、后處理壓力的不可能三角。如果要保證數(shù)據(jù)質(zhì)量,通常需要犧牲便捷性,采集設(shè)備連接電腦來(lái)提升數(shù)采現(xiàn)場(chǎng)的質(zhì)量反饋效率,而這樣的方式,注定無(wú)法普及到大眾;或者需要集成存儲(chǔ)和數(shù)采的小型設(shè)備,將數(shù)據(jù)處理壓力留在采集后,導(dǎo)致采集效率低,數(shù)據(jù)可用比例不高。
RoboPocket面向大規(guī)模、分布式的真實(shí)場(chǎng)景采集設(shè)計(jì),以集成化形態(tài),通過(guò)強(qiáng)化實(shí)時(shí)交互與質(zhì)量控制,來(lái)破解這一不可能三角。
我們重新定義了具身智能的數(shù)據(jù)采集模式,將對(duì)模型訓(xùn)練的理解融入端側(cè)的智能中樞。Robopocket就像一位時(shí)刻在線的人工智能導(dǎo)師,不僅能即時(shí)診斷每一幀數(shù)據(jù)的質(zhì)量、智能指導(dǎo)采集員調(diào)整動(dòng)作,還能通過(guò)實(shí)時(shí)互動(dòng)動(dòng)態(tài)評(píng)估數(shù)據(jù)價(jià)值,讓每一次采集都直接助力模型的關(guān)鍵進(jìn)化。
?任務(wù)指導(dǎo):任務(wù)采集教程可實(shí)時(shí)發(fā)送到數(shù)采人員端,指導(dǎo)數(shù)采人員操作。

圖注:任務(wù)教學(xué)指導(dǎo)
?實(shí)時(shí)交互提醒:提示采集者動(dòng)作過(guò)快、超出機(jī)器人工作空間,避免無(wú)效數(shù)據(jù)進(jìn)入后處理環(huán)節(jié)。

圖注:異常速度檢測(cè)

圖注:異常動(dòng)作監(jiān)測(cè)
?多維質(zhì)量打分:在采集階段就對(duì)數(shù)據(jù)進(jìn)行評(píng)分,幫助采集員及時(shí)修正,并為后處理提供篩選依據(jù)。

圖注:數(shù)據(jù)質(zhì)量閉環(huán)監(jiān)測(cè)
基于在采集階段引入的質(zhì)量控制機(jī)制,RoboPocket能夠盡可能提前解決數(shù)據(jù)質(zhì)量問(wèn)題,讓后續(xù)的數(shù)據(jù)處理從“大量清洗”轉(zhuǎn)變?yōu)椤坝斜O(jiān)督的篩選”。
靈活添加第一人稱視角:多設(shè)備快速對(duì)齊
視角局限是腕部第一視角的固有問(wèn)題。RoboPocket支持靈活添加第一人稱視角,并通過(guò)多機(jī)快速對(duì)齊實(shí)現(xiàn)同一空間坐標(biāo)。這種設(shè)計(jì)既保留了UMI的“具身一致性”,又補(bǔ)充了場(chǎng)景上下文,確保RoboPocket不僅能采集“可操作性強(qiáng)”的桌面任務(wù)數(shù)據(jù),也能為更復(fù)雜、更豐富的場(chǎng)景提供額外視角和場(chǎng)景信息。

圖注:第一人稱視角
在多臂采集或協(xié)作場(chǎng)景中,讓多個(gè)設(shè)備的時(shí)間戳快速對(duì)齊并統(tǒng)一坐標(biāo)系是關(guān)鍵,也是難點(diǎn)。RoboPocket大幅降低了這一環(huán)節(jié)的難度,通過(guò)RoboPocket的快速同步機(jī)制,多個(gè)手機(jī)可共享時(shí)間戳與SLAM坐標(biāo)系,雙臂配對(duì)也變得非常簡(jiǎn)單。

圖注:雙臂快速同步
擴(kuò)展性出色:用戶交互豐富
除了硬件層面的擴(kuò)展,iOS系統(tǒng)的算力與豐富的UI界面帶來(lái)更多、更高級(jí)的功能交互,使數(shù)采員能以更直觀的方式獲得指導(dǎo)、控制質(zhì)量,甚至完成采集全流程。
除上述質(zhì)量把控功能外,RoboPocket還支持實(shí)時(shí)回放與自動(dòng)無(wú)線上傳,可通過(guò)語(yǔ)音或按鍵啟動(dòng)采集。
數(shù)據(jù)認(rèn)知、模型技術(shù)與數(shù)據(jù)基礎(chǔ)設(shè)施
硬件只是起點(diǎn),真正的核心競(jìng)爭(zhēng)力在于對(duì)有用數(shù)據(jù)的認(rèn)知、“模型技術(shù)”以及數(shù)據(jù)管線的構(gòu)建。
從專業(yè)數(shù)采場(chǎng)景到普通人的日常生活,穹徹智能持續(xù)推動(dòng)行業(yè)對(duì)數(shù)據(jù)的理解與方法論升級(jí):
?2023年與上交大盧策吾團(tuán)隊(duì)共同發(fā)布RH20T大規(guī)模具身智能數(shù)據(jù)集:在預(yù)設(shè)條件下,實(shí)現(xiàn)機(jī)器人操作數(shù)據(jù)的系統(tǒng)化、規(guī)?;杉?/p>
?2025年發(fā)布CoMiner伴隨式數(shù)據(jù)采集系統(tǒng):機(jī)器人走出采集場(chǎng),進(jìn)入真實(shí)世界,在開(kāi)放環(huán)境中獲取更豐富、更復(fù)雜的操作數(shù)據(jù);
?2026年邁出關(guān)鍵一步:把機(jī)器人數(shù)據(jù)采集從特定場(chǎng)所和依賴專業(yè)系統(tǒng),進(jìn)一步推廣到整個(gè)社會(huì)——讓每一個(gè)普通人、每一部手機(jī)都能成為機(jī)器人學(xué)習(xí)網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),讓數(shù)據(jù)在真實(shí)生活中持續(xù)產(chǎn)生價(jià)值。
在大規(guī)模數(shù)據(jù)采集的背后,是我們憑借強(qiáng)大的數(shù)據(jù)基礎(chǔ)設(shè)施和科學(xué)的數(shù)據(jù)管線,覆蓋高效任務(wù)設(shè)計(jì)、大規(guī)模數(shù)據(jù)采集、上傳、清洗與質(zhì)量監(jiān)控,最終服務(wù)于模型訓(xùn)練與評(píng)估,并反向指導(dǎo)下一輪數(shù)據(jù)采集。

圖注:穹徹具身工具鏈
而支撐這些數(shù)據(jù)持續(xù)創(chuàng)造價(jià)值的核心,正是穹徹智能深耕已久的模型能力。
在最新公開(kāi)視頻的最后,我們展示了:僅使用RoboPocket方案采集的數(shù)據(jù),就能訓(xùn)練出支持長(zhǎng)程任務(wù)、雙臂協(xié)作、無(wú)遙操作、非回放的機(jī)器人策略,并在工業(yè)相機(jī)和機(jī)器人系統(tǒng)上自主執(zhí)行。
這一結(jié)果表明,來(lái)自RoboPocket這種“人人可及”的數(shù)采方式,能夠跨越采集終端與部署平臺(tái)的差異,穩(wěn)定遷移到工業(yè)級(jí)感知與執(zhí)行系統(tǒng)中,驗(yàn)證了穹徹智能在數(shù)據(jù)采集、數(shù)據(jù)質(zhì)量管理、模型訓(xùn)練、模型部署等方面的系統(tǒng)性能力。
 
- 視頻注:機(jī)器人自主執(zhí)行擺放餐具、碰杯、疊毛巾、收拾零食
我們將“數(shù)據(jù)”轉(zhuǎn)化為真正的生產(chǎn)力:從真實(shí)世界中穩(wěn)定獲取可用數(shù)據(jù)資產(chǎn),驅(qū)動(dòng)模型快速迭代與成本下降,并將能力以標(biāo)準(zhǔn)化流程交付至藥房、酒店等多元化場(chǎng)景,實(shí)現(xiàn)規(guī)?;涞?。
未來(lái),RoboPocket將與高精度力控遙操作、CoMiner伴隨式野外采集以及人類操作數(shù)據(jù)一同,持續(xù)完善并夯實(shí)穹徹的數(shù)據(jù)體系,支撐具身模型在真實(shí)世界中的不斷發(fā)展。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





