京東啟動大規(guī)模數(shù)據(jù)采集:以人海戰(zhàn)術破解具身智能數(shù)據(jù)困局
3月16日,京東宣布建成全球規(guī)模最大、場景最全的具身智能數(shù)據(jù)采集中心,這一消息在一度沉寂的機器人賽道引發(fā)關注。此次行動動員了內(nèi)部超10萬員工及外部最多50萬各行業(yè)人員,甚至在宿遷一地就動員超10萬市民,試圖以規(guī)?;绞浇鉀Q具身智能面臨的“數(shù)據(jù)荒”難題。
在模型架構逐漸成熟、算力門檻相對透明的當下,高質(zhì)量物理交互數(shù)據(jù)已成為機器人能否廣泛應用的關鍵。這場被稱為“人類歷史上規(guī)模最大的數(shù)據(jù)采集行動”,反映出行業(yè)共識:當具身智能的運動控制能力不斷提升,如何用高質(zhì)量數(shù)據(jù)培養(yǎng)其對物理世界的理解能力,成為決定行業(yè)格局的核心。

卷入的參與者
京東發(fā)起這場數(shù)據(jù)采集行動的核心支撐,是其龐大且復雜的自營實體供應鏈。與純軟件企業(yè)不同,京東自身就是物理世界的互動場,具身智能的成熟直接關系到其未來履約成本與運營效率。這一布局與北京亦莊的機器人產(chǎn)業(yè)生態(tài)深度結合,亦莊已集聚300余家機器人相關企業(yè),開放40余個應用場景,京東作為“鏈主”企業(yè),此前已發(fā)布機器人產(chǎn)業(yè)加速計劃,此次投入數(shù)據(jù)采集中心意在補齊產(chǎn)業(yè)鏈短板,形成從數(shù)據(jù)到硬件迭代的閉環(huán)。
數(shù)據(jù)采集場景覆蓋物流、工業(yè)、零售等領域,實際操作可能依賴京東現(xiàn)有的數(shù)字化管理網(wǎng)絡,例如讓一線員工佩戴傳感器設備作業(yè)。不過,目前相關實施細節(jié)尚未傳導至員工層面,部分京東員工表示尚未收到通知,認為若有合理報酬,參與與否取決于個人選擇。同時,數(shù)據(jù)合規(guī)問題也引發(fā)關注,快遞配送、零售場景涉及大量隱私數(shù)據(jù),脫敏與清洗的合規(guī)成本可能極高。
破解莫拉維克悖論
1988年,機器人學家漢斯?莫拉維克提出,計算機在智力測試或下棋中達到成人水平較易,但擁有一歲嬰兒的感知和運動能力卻極難。如今,具身智能面臨的“數(shù)據(jù)真空”正是這一悖論的體現(xiàn)。大模型依賴互聯(lián)網(wǎng)積累的文本語料,而物理世界缺乏現(xiàn)成的“數(shù)據(jù)互聯(lián)網(wǎng)”,具身智能要實現(xiàn)規(guī)?;瘧?,需突破數(shù)據(jù)壁壘。
當前行業(yè)獲取數(shù)據(jù)的主流方式存在局限:仿真環(huán)境雖成本低、速度快,但“仿真到現(xiàn)實”存在鴻溝,物理引擎難以模擬真實世界的復雜物理反饋;遙操作采集數(shù)據(jù)質(zhì)量高,但硬件和人力成本高昂,難以規(guī)模化;機器人硬件碎片化導致數(shù)據(jù)難以跨本體復用。在此背景下,擁有真實落地場景的企業(yè)更具優(yōu)勢,京東依托物流網(wǎng)絡和實體體系,試圖打造半自動化數(shù)據(jù)流水線,將供應鏈壁壘轉(zhuǎn)化為數(shù)據(jù)壁壘。
高質(zhì)量數(shù)據(jù)的稀缺性
針對京東“兩年積累超1000萬小時真實場景數(shù)據(jù)”的計劃,業(yè)內(nèi)人士保持冷靜。具身智能中,數(shù)據(jù)的質(zhì)量和模態(tài)比時長更重要,行業(yè)缺的是包含精確物理反饋的“狀態(tài)-動作對”,而非單純的視覺數(shù)據(jù)。普通可穿戴設備難以捕捉人類動作中的觸覺、力覺等隱性知識,若僅采集視頻數(shù)據(jù),轉(zhuǎn)化為機器人可執(zhí)行動作的損耗率可能很高。此外,行業(yè)缺乏統(tǒng)一的數(shù)據(jù)標準,京東采集的人類動作數(shù)據(jù)如何映射到不同構型的機器人本體,仍是難題。若缺乏標準,這些數(shù)據(jù)可能僅服務于京東自研機器人,難以推動全行業(yè)進步。
京東的舉措標志著國內(nèi)企業(yè)嘗試以規(guī)?;侄谓鉀Q數(shù)據(jù)短缺問題,但要實現(xiàn)機器人“智能涌現(xiàn)”,需保障數(shù)據(jù)的高維度與高質(zhì)量,建立統(tǒng)一標準,并妥善處理隱私合規(guī)問題。這些是行業(yè)邁向商業(yè)化必須解決的課題。
本文來自微信公眾號 “全天候科技”(ID:iawtmt),作者:王小娟,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



