欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

融資14億美元,Skild AI構(gòu)建跨任務(wù)跨硬件的通用具身智能大腦

01-23 06:24
突破通用性瓶頸,物理AI的價(jià)值有望實(shí)現(xiàn)指數(shù)級增長。

人工智能的演進(jìn)遵循先專用化、再通用化,最終在通用基礎(chǔ)上深耕高價(jià)值細(xì)分場景的路徑。


相較于過去人臉識(shí)別、語音轉(zhuǎn)錄需單獨(dú)訓(xùn)練專有模型的時(shí)代,如今通用全模態(tài)模型已能完成各類復(fù)雜任務(wù);對通用模型進(jìn)行針對性后訓(xùn)練,還可在醫(yī)療、法律、客服等特定領(lǐng)域展現(xiàn)優(yōu)異性能。


在物理AI領(lǐng)域,上一代工業(yè)機(jī)器人、清潔機(jī)器人等僅能在特定場景作業(yè),無法泛化至通用場景,尤其難以在非常規(guī)環(huán)境中完成多種復(fù)雜任務(wù),因此家用人形機(jī)器人的實(shí)際應(yīng)用仍有較長距離。


不過已有部分具身智能企業(yè)嘗試推動(dòng)物理AI邁入通用時(shí)代,例如Skild AI,其打造的“全具身(Omni-bodied)”大腦Skild Brain,愿景是能適配任意形態(tài)機(jī)器人并完成各類任務(wù),賦予機(jī)器人跨任務(wù)、跨硬件形態(tài)的通用泛化能力。



此前Skild AI于2024年完成3億美元A輪融資,近日又?jǐn)孬@14億美元B輪融資。此輪融資由SoftBank領(lǐng)投,NVentures(NVIDIA)、Macquarie Capital及Jeff Bezos跟投,公司估值突破140億美元。


Lightspeed、Felicis、Coatue、Sequoia Capital等頭部風(fēng)投,以及LG、Schneider、CommonSpirit、Salesforce Ventures等戰(zhàn)略投資者也參與其中。


全具身智能:單一大腦適配多元硬件與任務(wù)


Skild AI的兩位創(chuàng)始人Deepak Pathak(CEO)與Abhinav Gupta(總裁)在過去十年引領(lǐng)了機(jī)器人領(lǐng)域的多項(xiàng)重大突破,兩人合計(jì)論文引用量超11萬次。


Deepak Pathak是卡內(nèi)基梅隆大學(xué)(CMU)機(jī)器人研究所助理教授,Abhinav Gupta是CMU機(jī)器人研究所終身教授、FAIR Robotics創(chuàng)始成員及研究負(fù)責(zé)人。


相識(shí)十年后,二人于2023年共同離開CMU投身具身智能創(chuàng)業(yè),組建了由Meta、Tesla、NVIDIA、Amazon、Google等企業(yè),以及CMU、斯坦福大學(xué)、加州大學(xué)伯克利分校等高校的機(jī)器人與人工智能專家構(gòu)成的頂尖團(tuán)隊(duì)。



Skild AI核心團(tuán)隊(duì)(來源:Skild AI)


上一代機(jī)器人公司多采用定制化方案,僅能打造適配特定任務(wù)的專用機(jī)器人,缺乏泛化能力。


Skild AI致力于研發(fā)面向真實(shí)世界的通用人工智能,其機(jī)器人大腦Skild Brain具備跨任務(wù)與跨機(jī)器人硬件的泛化能力。


該大腦無需預(yù)先知曉機(jī)器人形態(tài),即可控制四足機(jī)器人、人形機(jī)器人、桌面機(jī)械臂、移動(dòng)操作機(jī)器人等各類形態(tài)的機(jī)器人。


它賦予機(jī)器人處理多種事務(wù)的能力,從清潔、裝填洗碗機(jī)、煎蛋等簡單家務(wù),到濕滑地形通行等對物理性能要求極高的挑戰(zhàn),只要是可運(yùn)動(dòng)的機(jī)器,Skild Brain都能操控。


這種跨形態(tài)訓(xùn)練不僅解鎖了海量數(shù)據(jù),還顯著增強(qiáng)了模型應(yīng)對硬件變更或故障的魯棒性。


基于視覺的端到端運(yùn)動(dòng)控制

構(gòu)建機(jī)器人基礎(chǔ)模型的最大挑戰(zhàn)在于缺乏大規(guī)模機(jī)器人數(shù)據(jù),且利用硬件采集真實(shí)世界數(shù)據(jù)既緩慢又成本高昂。


部分公司基于現(xiàn)有視覺-語言模型(VLM),摻入不足1%的真實(shí)機(jī)器人數(shù)據(jù)構(gòu)建“機(jī)器人基礎(chǔ)模型”,但這類模型缺乏經(jīng)物理世界驗(yàn)證的物理常識(shí),難以適應(yīng)真實(shí)物理環(huán)境。它們能完成側(cè)空翻、后空翻、舞蹈等動(dòng)作,卻難以可靠攀爬各類樓梯或應(yīng)對高難度障礙物。


因?yàn)榕罉翘菪枰曈X感知與運(yùn)動(dòng)控制的精細(xì)協(xié)同,機(jī)器人需與樓梯物理結(jié)構(gòu)精確交互,并根據(jù)臺(tái)階高度和幾何形狀差異動(dòng)態(tài)調(diào)整。


Skild Brain采用分層架構(gòu):上層是低頻運(yùn)行的操作與導(dǎo)航策略,下層是高頻響應(yīng)的底層動(dòng)作策略。


作為核心驅(qū)動(dòng)力,底層單一神經(jīng)網(wǎng)絡(luò)能將上層宏觀指令實(shí)時(shí)轉(zhuǎn)化為驅(qū)動(dòng)軀體的精確關(guān)節(jié)角度與電機(jī)扭矩。這種設(shè)計(jì)讓機(jī)器人無需繁瑣的路徑規(guī)劃、建圖或手動(dòng)模式切換,在平地行走、爬樓梯和越障間實(shí)現(xiàn)本能般的無縫切換。


本質(zhì)上,它是完全由在線視覺和本體感覺驅(qū)動(dòng)的端到端運(yùn)動(dòng)控制。


真實(shí)世界部署對可靠性要求嚴(yán)苛,Skild在驗(yàn)證模型時(shí)將其置于城市公園、街道等真實(shí)環(huán)境,測試其爬防火梯、越障等能力,環(huán)境中還包含不穩(wěn)定托盤、縫隙、不均勻臺(tái)階及雜物等障礙。



Skild Brain借助攝像頭感知圖像,對機(jī)器人周遭場景做出毫秒級動(dòng)態(tài)反應(yīng),使其能根據(jù)最新觀測結(jié)果自主摸索避障路徑。面對未知環(huán)境,機(jī)器人無需預(yù)設(shè)動(dòng)作,可實(shí)時(shí)調(diào)整落腳點(diǎn)、平衡與時(shí)機(jī),靈活應(yīng)對各類障礙。


例如,搭載Skild Brain的機(jī)器人面對不均勻臺(tái)階時(shí),即便臺(tái)階深度比腳長多3厘米,也能精準(zhǔn)落足,甚至能在非平坦表面負(fù)重搬運(yùn)箱子上下樓梯。


要讓機(jī)器人適應(yīng)真實(shí)環(huán)境并具備通用性,需打破以往控制器僅針對特定機(jī)型訓(xùn)練的傳統(tǒng)模式,這種模式本質(zhì)是讓機(jī)器人“死記硬背”,易對特定場景或環(huán)境“過擬合”。


為此,Skild為Skild Brain設(shè)計(jì)了無法“投機(jī)取巧”的測試環(huán)境,并采用特殊訓(xùn)練方法。


方法一是讓AI學(xué)習(xí)控制包含10萬種不同形態(tài)的“機(jī)器人多重宇宙”,而非單一機(jī)器人,使其無法“背誦”特定軀體的特解,必須找到通用生存策略。


方法二是讓模型從失敗中學(xué)習(xí),Skild將大語言模型的“上下文學(xué)習(xí)(In-context learning)”引入物理AI領(lǐng)域,這是通用性的基石之一。


具體而言,Skild讓機(jī)器人處于非常規(guī)環(huán)境或狀態(tài),如截去小腿保留大腿模擬肢體缺失、軟件鎖定膝關(guān)節(jié)模擬關(guān)節(jié)故障、無預(yù)警卡死輪子、在腿上加裝高蹺改變腿身比等。


面對這些情況,Skild Brain驅(qū)動(dòng)的機(jī)器人經(jīng)短暫適應(yīng)后能找到解決方法。


以模擬關(guān)節(jié)故障為例,四足機(jī)器人變成未訓(xùn)練過的“三足”機(jī)器人,起初會(huì)向前傾倒,但很快學(xué)會(huì)將重心后移至三條腿,2-3秒適應(yīng)后甚至能行走。


可理解為模型遇到陌生情況時(shí)會(huì)多次嘗試,將前一次嘗試作為“提示詞(prompt)”輸入,直至成功適應(yīng)環(huán)境。


經(jīng)“上下文學(xué)習(xí)”訓(xùn)練后,模型能實(shí)現(xiàn)零樣本運(yùn)動(dòng)控制,甚至適應(yīng)極端形態(tài)變化。


Skild的數(shù)據(jù)飛輪

Skild構(gòu)建了龐大的數(shù)據(jù)基礎(chǔ)設(shè)施,Skild Brain可從四大來源學(xué)習(xí)。


預(yù)訓(xùn)練階段,它能從大規(guī)模仿真數(shù)據(jù)和互聯(lián)網(wǎng)視頻中學(xué)習(xí),觀看人類視頻是解決具身基礎(chǔ)模型數(shù)據(jù)規(guī)模和多樣性不足的重要途徑。


互聯(lián)網(wǎng)上第一人稱視角的頭戴式攝像機(jī)畫面數(shù)量龐大,但并非“機(jī)器人原生(robot-native)”格式。


機(jī)器人用視頻數(shù)據(jù)存在信號缺失和具身鴻溝兩大痛點(diǎn):信號缺失指視頻無法顯示底層力、扭矩或觸覺反饋;具身鴻溝指人類肢體與機(jī)器人形態(tài)差異大,將人類動(dòng)作映射為機(jī)器人“驅(qū)動(dòng)”指令難度大。


Skild的模型具備跨越具身差異的核心能力,使機(jī)器人能直接從視頻演示中習(xí)得新技能。實(shí)驗(yàn)中,僅需觀看視頻及極少量機(jī)器人數(shù)據(jù)(少于1小時(shí))微調(diào)模型,即可掌握新技能。


后訓(xùn)練階段有遙操作和真實(shí)世界部署兩種方法,Skild的機(jī)器人已廣泛應(yīng)用于安防、建筑、配送、數(shù)據(jù)中心、倉庫及工廠組裝等領(lǐng)域,持續(xù)為后訓(xùn)練生成數(shù)據(jù)。


2025年Skild AI實(shí)現(xiàn)規(guī)?;癄I收增長,其機(jī)器人在點(diǎn)對點(diǎn)配送、安防、數(shù)據(jù)中心及制造業(yè)倉庫等場景部署,數(shù)月內(nèi)營收增長至3000萬美元,不過其終極目標(biāo)是家庭消費(fèi)級市場。


突破通用性瓶頸,物理AI價(jià)值將指數(shù)級增長


大語言模型已跨越通用性鴻溝,擁有數(shù)億用戶的標(biāo)桿消費(fèi)級應(yīng)用(如ChatGPT),并進(jìn)入千行百業(yè)創(chuàng)造價(jià)值。


具身模型正開始跨越通用性門檻,Skild AI已初步研發(fā)出能跨機(jī)器人形態(tài)、適應(yīng)各類任務(wù)的具身基礎(chǔ)模型。


通過將“上下文學(xué)習(xí)”引入物理AI,降低了各類機(jī)器人學(xué)習(xí)新技能和任務(wù)的成本,也降低了進(jìn)入新應(yīng)用場景的成本。


但具身基礎(chǔ)模型和大語言模型目前都面臨無法通過學(xué)習(xí)自我迭代的問題,AI模型每次大升級都需重新訓(xùn)練,迭代成本難降低,導(dǎo)致商業(yè)模式較移動(dòng)互聯(lián)網(wǎng)時(shí)代難成立。


不過仍期待“物理AI”未來進(jìn)入成熟期,追上大語言模型的發(fā)展進(jìn)度。一旦進(jìn)入該階段,物理AI的應(yīng)用范圍將大幅拓展,價(jià)值實(shí)現(xiàn)指數(shù)級增長。


本文來自微信公眾號“阿爾法公社”,作者:發(fā)現(xiàn)非凡創(chuàng)業(yè)者的,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com