騰訊智能體最新進(jìn)展:引入AI模型后 機(jī)器狗靈活性、自主決策能力大增
今日,騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室公布了智能體研究的最新進(jìn)展,通過將前沿的預(yù)訓(xùn)練AI模型和強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到機(jī)器人控制領(lǐng)域,讓騰訊機(jī)器狗Max的靈活性和自主決策能力得到大幅提升。
Max是騰訊開發(fā)的多模態(tài)四足機(jī)器人,其學(xué)習(xí)真狗的過程都在虛擬世界里面訓(xùn)練而成,不需要進(jìn)行實(shí)機(jī)訓(xùn)練和調(diào)整。
具體來看,在第一個(gè)預(yù)訓(xùn)練學(xué)習(xí)中,RoboticsX實(shí)驗(yàn)室與騰訊游戲展開合作,使用游戲研發(fā)過程中的動(dòng)捕數(shù)據(jù)集,讓Max學(xué)會(huì)走、跑、跳、站立等動(dòng)作。
第二個(gè)預(yù)訓(xùn)練學(xué)習(xí)通過額外的網(wǎng)絡(luò)參數(shù)來將第一階段掌握的機(jī)器狗靈動(dòng)姿態(tài)與外界感知聯(lián)系在一起,使得機(jī)器狗能夠通過已經(jīng)學(xué)會(huì)的靈動(dòng)姿態(tài)來應(yīng)對(duì)外界環(huán)境,完成匍匐前進(jìn)、跨欄跑、障礙物跑酷穿梭等高難度動(dòng)作。
在第三階段的學(xué)習(xí)中,附加的網(wǎng)絡(luò)會(huì)獲取與復(fù)雜任務(wù)有關(guān)的信息,例如在游戲中,獲取對(duì)手的信息、旗子的信息,最終使得機(jī)器狗在策略側(cè)面能自主形成認(rèn)知。
在基于預(yù)訓(xùn)練好的模型下,機(jī)器狗通過深度強(qiáng)化學(xué)習(xí),不僅能夠在運(yùn)動(dòng)過程中保持靈活、穩(wěn)定,克服路障,還具備了一定的推理和決策能力:
在雙狗障礙追逐游戲中,當(dāng)追擊者意識(shí)到自己在躲避者碰到旗子之前已經(jīng)無法追上它的時(shí)候,追擊者就會(huì)放棄追擊,而是在遠(yuǎn)離躲避者的位置徘徊,目的是為了等待下一個(gè)重置的旗子出現(xiàn)。
另外,當(dāng)追擊者即將抓到躲避者的最后時(shí)刻,或者躲避者在快要接觸旗子的時(shí)候,機(jī)器狗喜歡跳起來做出一個(gè)“撲”的動(dòng)作。這些都是機(jī)器狗為了確保自己的勝利采取的主動(dòng)加速措施。
騰訊方面表示,預(yù)訓(xùn)練AI模型和深度強(qiáng)化學(xué)習(xí)技術(shù)為未來機(jī)器人解決其他復(fù)雜任務(wù)提供了一套通用的解決方案。為機(jī)器人走入現(xiàn)實(shí)生活,服務(wù)人類打下了堅(jiān)實(shí)的基礎(chǔ)。
▌GPT等AI大模型有望讓機(jī)器人智能化更上一層
騰訊機(jī)器狗的案例是AI賦能機(jī)器人的生動(dòng)詮釋。AI所造就的機(jī)器人,與傳統(tǒng)機(jī)器人最大的區(qū)別在于,AI機(jī)器人表現(xiàn)出一些與人類相似的智能特征,從原先的“自動(dòng)化”(工程師藉由程序設(shè)計(jì)編寫規(guī)則,讓機(jī)器人遵守)邁向了真正的“自主學(xué)習(xí)”。
從產(chǎn)業(yè)端來看,已有特斯拉的Optimus、波士頓動(dòng)力Atlas/Spot等AI機(jī)器人出圈。
進(jìn)入AIGC時(shí)代,GPT等AI大模型的出現(xiàn)則有望讓機(jī)器人智能化更上一個(gè)臺(tái)階。過往的機(jī)器人更多依賴人們手寫代碼從而在特定場景下完成特定任務(wù),難以與人類進(jìn)行多維度交互,而通用大模型的突破為人機(jī)交互提供新的思路,通過引入多模態(tài)讓人們能夠更采用更直接、輕便、靈活的方式對(duì)奇跡人實(shí)現(xiàn)操控。
開源證券分析師孟鵬飛表示,2023年,以GPT-4為代表的AI大模型迎來突破性進(jìn)展,將進(jìn)一步提升特斯拉機(jī)器人交互、決策、感知能力,加速迭代落地。OpenAI領(lǐng)投人形機(jī)器人公司1X證明了AI在人形機(jī)器人領(lǐng)域大有可為。
國泰君安分析師肖群稀認(rèn)為,AI大模型的出現(xiàn),會(huì)從語音、視覺、決策、控制等多方面實(shí)現(xiàn)同人形機(jī)器人的結(jié)合,形成感知、決策、控制閉環(huán)。
國信證券分析師吳雙表示,GPT大模型技術(shù)在人形機(jī)器人上的應(yīng)用有助于其商業(yè)化進(jìn)程推進(jìn)。一方面,大模型可解決“大腦”自主思考問題,使其具備理解與推理能力;另一方面,更強(qiáng)算力可提升機(jī)器人“小腦”運(yùn)動(dòng)控制能力。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






