欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<abbr id="znbqu"><var id="znbqu"></var></abbr>

<em id="znbqu"></em>

AI大戰(zhàn)進入實體化階段谷歌剛發(fā)布的PaLM-E模型有哪些亮點？

商界觀察

2023-03-09

過去幾個月里，由ChatGPT引發(fā)的AI熱潮向人類展現(xiàn)了通用語言模型的生產(chǎn)力前景。就在聊天機器人逐漸變成生產(chǎn)力工具之時，利用通用語言模型驅(qū)動真正的機器人也已經(jīng)提上日程。

本周老牌AI大廠谷歌與柏林工業(yè)大學的研究人員聯(lián)合發(fā)布PaLM-E視覺語言模型，通過同時處理圖像和語言文本，解鎖人類與機器人交互的新篇章。

顧名思義，PaLM-E模型源自于谷歌的大型語言模型PaLM，E指的就是具象化（Embodied）。通過將通用語言模型與視覺轉(zhuǎn)換模型ViT相結(jié)合，PaLM-E成功實現(xiàn)讓AI同時具備“理解文字”和“讀懂圖片”的能力，不僅能夠輸出文字，還能輸出指令使得機器人的智能化躍上一個新的臺階。

研究人員介紹稱，PaLM和ViT的結(jié)合，使得PaLM-E的參數(shù)量最高可達5620億組，也是全球已知的最大視覺語言模型。

回歸到資本市場最關心的問題，這個聽上去很厲害的AI模型，到底能干什么事情呢？對此研究人員也給出一系列案例，幫助外界理解這個模型的妙處。

首先，具備視覺屬性的AI模型將擁有解讀圖片并進行思維推理的能力。例如可以通過一張禁行交通標志（除自行車外）的圖片，來解答“我能否在這條馬路上騎自行車”；通過OCR識別餐館的手寫菜單，能進行賬單的計算；或是通過識別一系列烘焙材料的照片，向機器人傳達“制作蛋糕胚”的流程。

此外，在AI模型與機器人結(jié)合的實驗演示中，機器人得到“從抽屜里拿出米餅”的指令后，能夠順利地從十多個開放式抽屜中找到米餅，拿給研究人員。

在后續(xù)的實驗中，研究人員還要求機器人完成“將所有色塊按顏色堆放到不同角落”的指令，以及將“綠色色塊推到烏龜旁邊”的指令，即便機器人之前沒有見過這只烏龜擺件，也能順利地完成任務。

雖然從演示視頻中來看，受限于演示機器人較為簡單的設計，執(zhí)行指令的時候仍顯得“笨手笨腳”。但隨著PaLM-E模型賦予機器思考如何執(zhí)行人類指令的能力，工業(yè)應用和工業(yè)設計上的突破也指日可待。或許在不久的將來，就會出現(xiàn)一款風靡全球的智能機器人硬件。

值得一提的是，作為AI大戰(zhàn)的老對手，微軟也已經(jīng)在“圖像+語言模型”的路數(shù)上有所布局。在今年2月底發(fā)表的研究中，微軟就展現(xiàn)了如何使用ChatGPT為大疆Tello無人機編寫“找飲料”程序的案例。

版權(quán)說明：
本文僅代表作者個人觀點，版權(quán)歸原創(chuàng)者所有。部分圖片源自網(wǎng)絡，未能核實歸屬。本文僅為分享，不為商業(yè)用途。若錯標或侵權(quán)，請與我們聯(lián)系刪除。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

ChatGPT熱浪之下，無法加分的AI教育如何從娃娃抓起？

北京首店扶持政策再升級，亞洲首店最高補貼500萬元...|政策晚報

2023中國杰出商業(yè)女性，第一名曾是打工妹；這食品熱度猛增200倍丨老板早知道

21萬汽車降價9萬！“史上最強補貼”來襲？

董明珠：格力做預制菜不為賺錢

項目推薦

<blockquote id="49vy5"><sup id="49vy5"></sup></blockquote>

<nobr id="49vy5"></nobr>

<ul id="49vy5"></ul>