點(diǎn)外賣(mài)等瑣事到底能不能靠AI?我們找5款語(yǔ)音助手聊了500句話
曾幾何時(shí),人們與手機(jī)、汽車(chē)交互的方式從選擇指令變成了自然對(duì)話,這種方式讓人們享受了方便,因?yàn)榧夹g(shù)不斷發(fā)展,AI 助手能為我們做的事情也越來(lái)越多。
前段時(shí)間,丹麥的「合成黨」(The Synthetic Party)成為了熱門(mén)新聞,這個(gè)新組織曾希望在 11 月的大選中獲得議會(huì)席位,其公眾形象和名義領(lǐng)袖是 AI 聊天機(jī)器人「拉爾斯」(Leader Lars)。
根據(jù)該黨的創(chuàng)始人、藝術(shù)家和研究員 Asker Staun?s 的說(shuō)法,如果該黨進(jìn)入議會(huì),人工智能將決定政策和議程(比如建立每月 13799 美元的全民基本收入,是丹麥平均工資的兩倍以上),而人類(lèi)將充當(dāng)該計(jì)劃的解釋者。不過(guò)最終,支持合成黨的簽名未能達(dá)到選舉所要求的 2 萬(wàn)個(gè),合成黨 AI 黨魁也就失去了機(jī)會(huì)。
雖然 AI 制定政策看起來(lái)還是一個(gè)遙不可及的嘗試,但與人交流、推薦和購(gòu)物已是當(dāng)今人工智能的「基本能力」了——很多品牌的手機(jī)上、智能音箱里都內(nèi)置有這樣的智能助手,其功能我們每天都可以接觸到。
但和面向研究和技術(shù)展示的聊天機(jī)器人不同,人們?cè)谑褂谜Z(yǔ)音助手訂機(jī)票、點(diǎn)外賣(mài)時(shí)帶有明確的目的,如何在連續(xù)對(duì)話中獲取信息、正確理解用戶意圖并完成特定任務(wù),是相關(guān) AI 算法面臨的重要挑戰(zhàn),現(xiàn)有的語(yǔ)音助手在不同場(chǎng)景中的表現(xiàn)也參差不齊。
在這篇文章中,我們選取了四個(gè)中高頻生活場(chǎng)景和市面上常見(jiàn)的五款語(yǔ)音助手進(jìn)行測(cè)評(píng),看看它們?cè)谶@些場(chǎng)景中到底能做哪些事情,哪些方面還沒(méi)有做好。
四個(gè)高頻場(chǎng)景包括點(diǎn)外賣(mài)、選餐廳、訂電影票和訂酒店。參與評(píng)測(cè)的語(yǔ)音助手包括天貓精靈(天貓精靈 IN 糖)、玩秘(獨(dú)立 APP)、小度(小度智能屏 1S)、曉悟(獨(dú)立 APP)和 Siri(搭載于蘋(píng)果手機(jī))。
評(píng)測(cè)過(guò)程中,我們先在這些語(yǔ)音助手上嘗試了各個(gè)場(chǎng)景,然后根據(jù)體驗(yàn)的情況選出了這些產(chǎn)品各自擅長(zhǎng)的領(lǐng)域進(jìn)行進(jìn)一步評(píng)測(cè)。最終,每款語(yǔ)音助手只參與一個(gè)場(chǎng)景的詳細(xì)測(cè)評(píng),每場(chǎng)測(cè)評(píng)包含 100 句(50 輪)對(duì)話。
以下是測(cè)評(píng)結(jié)果。
外賣(mài)場(chǎng)景
在外賣(mài)場(chǎng)景中,我們首先測(cè)試了天貓精靈。
在菜品的劃分上,天貓精靈基本能夠按照用戶需求找到對(duì)應(yīng)的菜品,比如「大閘蟹」、「炸雞」、「小龍蝦」,并主動(dòng)播報(bào)店名,詢問(wèn)用戶是否購(gòu)買(mǎi)。此外,它也可以幫你尋找附近的美食,并告訴你距離多遠(yuǎn)、有什么特色菜等信息,有時(shí)候甚至能提供一些百科知識(shí),比如大閘蟹的吃法。這使得其前兩輪的對(duì)話往往進(jìn)行得比較順利。
不過(guò),在后續(xù)的對(duì)話中,天貓精靈非常容易「跑題」,點(diǎn)外賣(mài)過(guò)程中會(huì)突然跳轉(zhuǎn)到購(gòu)物、歌曲播放、百科知識(shí)等不相關(guān)的場(chǎng)景。比如,用戶說(shuō)「換個(gè)別的」,天貓精靈會(huì)誤以為用戶想要點(diǎn)歌,然后就開(kāi)始播放歌曲,讓用戶摸不著頭腦。
這種場(chǎng)景區(qū)分的失誤有時(shí)也會(huì)發(fā)生在首輪對(duì)話中:
另外,對(duì)于菜品的細(xì)粒度信息,天貓精靈似乎掌握比較有限,比如不能區(qū)分菜系。而且在用戶不滿意當(dāng)前推薦的時(shí)候,天貓精靈可能會(huì)就此結(jié)束對(duì)話(而不是繼續(xù)推薦)。此時(shí),用戶就不得不重啟新一輪的對(duì)話。
另一個(gè)參與外賣(mài)場(chǎng)景測(cè)評(píng)的是輪子科技出品的玩秘 APP(華為、榮耀等品牌的手機(jī)的語(yǔ)音助理中也搭載了玩秘。據(jù)了解,玩秘 APP 中的 NLP 模型有重大升級(jí),因此這里選取玩秘 APP 作為測(cè)評(píng)對(duì)象)。
首先,在菜品的劃分上,玩秘 APP 支持多種點(diǎn)單方式,你既可以說(shuō)「我想喝咖啡」、「我想吃牛排」或者「我想吃 xx 飯店」,也可以說(shuō)「我想吃點(diǎn)清淡的」、「我想吃點(diǎn)辣的」,這些玩秘都能聽(tīng)懂,首輪對(duì)話輕松過(guò)關(guān)。
如果你對(duì)推薦滿意,它會(huì)幫你加入購(gòu)物車(chē),甚至還會(huì)幫你湊夠起送價(jià)并提醒你填寫(xiě)備注。
下單之后,它還支持配送時(shí)間查詢和自動(dòng)催單功能。
如果你對(duì)推薦不滿意,玩秘會(huì)繼續(xù)推薦,而不是結(jié)束對(duì)話。值得注意的是,玩秘能夠理解到很多表示拒絕的詞,比如「不愛(ài)吃」、「太油了」、「太貴了」,然后在下一輪推薦中主動(dòng)避雷,并把你的偏好記錄下來(lái),對(duì)話再長(zhǎng)也不會(huì)脫離外賣(mài)場(chǎng)景。
不過(guò),由于中國(guó)菜品非常復(fù)雜,而且用戶的個(gè)性化需求也比較豐富,玩秘在理解過(guò)程中也會(huì)偶爾出錯(cuò),比如不理解回鍋肉中有肥肉,不知道茶樹(shù)菇屬于素菜等。
此外,和我們?cè)u(píng)測(cè)的另外幾款語(yǔ)音助手一樣,玩秘在菜品價(jià)格對(duì)比方面還不太成熟,有時(shí)候無(wú)法按照用戶需求推薦更加便宜的菜品。
餐廳推薦場(chǎng)景
在餐廳推薦場(chǎng)景中,我們選擇了小度來(lái)進(jìn)行測(cè)試。
在首輪問(wèn)答中,小度支持多種餐廳篩選方式,比如按照評(píng)分(「永旺評(píng)分最高的餐廳」)、距離(「離我最近的西餐廳」)、菜品(「想吃龍蝦」)等等,這點(diǎn)和外賣(mài)場(chǎng)景的兩個(gè)語(yǔ)音助手是類(lèi)似的。在達(dá)到用戶滿意之后,小度會(huì)詢問(wèn)用戶是否導(dǎo)航前往,還能在導(dǎo)航開(kāi)始后切換不同的導(dǎo)航方式。
不過(guò),如果你想進(jìn)一步了解餐廳的詳細(xì)信息,比如特色菜、是否有包廂…… 小度往往沒(méi)辦法提供。
而且,在沒(méi)有聽(tīng)懂的情況下,小度的導(dǎo)航功能似乎非常容易誤觸。
此外,和外賣(mài)不同的一點(diǎn)是,餐廳往往會(huì)帶一些社交屬性,比如有些酒店可以辦婚禮。小度在這方面的意圖理解能力似乎還不太成熟,需要用戶給出更明顯的需求描述。
電影票預(yù)訂場(chǎng)景
在電影票預(yù)訂場(chǎng)景中,我們選擇了曉悟來(lái)進(jìn)行測(cè)試。
首先,當(dāng)被要求推薦電影時(shí),曉悟能準(zhǔn)確地找出當(dāng)前正在影院上映的電影,而不是將院線電影和網(wǎng)絡(luò)電影混為一談,這是一些手機(jī)語(yǔ)音助手容易混淆的地方。其次,它還能匹配到指定地點(diǎn)的電影院,并導(dǎo)航前往,還有自動(dòng)選座等功能。
不過(guò),美中不足的是,曉悟基本上不支持按照常用時(shí)間段(如上午場(chǎng)、下午場(chǎng))選電影,也很難給出電影的詳細(xì)信息(如電影內(nèi)容、類(lèi)型、票價(jià)對(duì)比)。更重要的是,對(duì)于不同的問(wèn)題,曉悟有時(shí)會(huì)連續(xù)給出相同的答案,很多情況下可能答非所問(wèn)。在電影場(chǎng)景所需要的長(zhǎng)對(duì)話中,這會(huì)對(duì)用戶的耐心形成一定的考驗(yàn)。
此外,在與選座相關(guān)的交互中,曉悟的自然語(yǔ)言理解能力也有待加強(qiáng)。
酒店推薦場(chǎng)景
在酒店推薦場(chǎng)景中,我們選擇了搭載在蘋(píng)果手機(jī)上的 Siri 進(jìn)行測(cè)試。
「Hey,Siri,給我定個(gè)酒店。」對(duì)于這種簡(jiǎn)單、直接的要求,Siri 應(yīng)對(duì)起來(lái)似乎沒(méi)有什么壓力,它會(huì)推薦一個(gè)距離用戶較近且評(píng)分尚可的酒店,也可以導(dǎo)航前往或者給酒店打電話,甚至可以幫用戶尋找附近的美食等信息。
但如果你想知道更細(xì)粒度的信息,比如酒店房型、價(jià)格、是否包含早餐等,Siri 往往沒(méi)有辦法提供。這種情況下,它可能變身「搜索引擎」,搜出和當(dāng)前話題無(wú)關(guān)的內(nèi)容展示給你。
此外,與前幾款語(yǔ)音助手相比,Siri 的交互明顯更依賴屏幕,播報(bào)內(nèi)容比較有限,很多時(shí)候給出的回答都是「我找到了這些結(jié)果」,而不是在用戶詢問(wèn)「哪一個(gè)」的時(shí)候給出一個(gè)具體的推薦,或者一個(gè)明確的答案。
所以總體來(lái)看,我們基本可以依靠 Siri 獲取一些酒店推薦信息,但要想依靠這些信息直接預(yù)訂,信息量還遠(yuǎn)遠(yuǎn)不夠,而且「下訂單」這一動(dòng)作也不能靠 Siri 來(lái)完成。
評(píng)測(cè)結(jié)論
在 Siri 誕生之初,它的創(chuàng)始人就假設(shè),語(yǔ)音助手應(yīng)當(dāng)是「執(zhí)行引擎」,而不是簡(jiǎn)單的「搜索引擎」。
從測(cè)試結(jié)果來(lái)看,五款語(yǔ)音助手基本都實(shí)現(xiàn)了從簡(jiǎn)單的「搜索引擎」到復(fù)雜的「執(zhí)行引擎」的跨越,可以幫我們找店、導(dǎo)航、下單甚至選座、湊起送費(fèi)…… 但在意圖理解能力和面向任務(wù)的連續(xù)對(duì)話能力方面,幾款語(yǔ)音助手的表現(xiàn)還存在較大差異。在各自經(jīng)歷的 100 句對(duì)話中,幾款語(yǔ)音助手的理解率分別為:天貓精靈(44%);玩秘(82%);小度(44%);曉悟(32%);Siri(40%)。
可以看出,玩秘在測(cè)評(píng)中的表現(xiàn)尤其亮眼,在外賣(mài)場(chǎng)景中不僅能準(zhǔn)確分辨菜品類(lèi)型、口味等信息,還能理解用戶通過(guò)不同措辭表達(dá)的意圖,在多輪對(duì)話中成功地保持了對(duì)話場(chǎng)景和邏輯的一致性,這些都是強(qiáng)大的意圖理解能力和連續(xù)對(duì)話能力的表現(xiàn)。據(jù)了解,這些得益于其背后的公司輪子科技自主研發(fā)的基于貝葉斯網(wǎng)絡(luò)的 Causal Inference NLP 算法框架。該框架可以模擬人類(lèi)因果認(rèn)知系統(tǒng),實(shí)現(xiàn)高理解準(zhǔn)確度的語(yǔ)義解析 NLP 解決方案,因此才能如此出色地應(yīng)對(duì)訂外賣(mài)等語(yǔ)義理解難度較高的場(chǎng)景。
可以預(yù)見(jiàn)的是,隨著用戶對(duì)語(yǔ)音交互接受程度的提高,大家的期望也會(huì)越來(lái)越高,會(huì)希望語(yǔ)音助手能夠協(xié)助我們更便捷地完成那些需要了解垂直領(lǐng)域才能完成的任務(wù),而這正是玩秘等幾款語(yǔ)音助手正在努力的方向。這些語(yǔ)音助手致力于提高人們生活的便利程度,體現(xiàn)了人工智能的社會(huì)價(jià)值和實(shí)用價(jià)值,未來(lái)將有非常廣闊的發(fā)展空間。
版權(quán)說(shuō)明:
本文僅代表作者個(gè)人觀點(diǎn),版權(quán)歸原創(chuàng)者所有。部分圖片源自網(wǎng)絡(luò),未能核實(shí)歸屬。本文僅為分享,不為商業(yè)用途。若錯(cuò)標(biāo)或侵權(quán),請(qǐng)與我們聯(lián)系刪除。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






