智能咖啡機(jī)“耍脾氣”背后:生成式AI語音助手的確定性困境
目前還沒有人真正解決這個(gè)問題:如何讓LLM知道什么時(shí)候該精確、什么時(shí)候可以隨機(jī)。
這并非個(gè)例。社區(qū)里吐槽生成式AI語音助手的場面堪稱“怨聲載道”:開燈成了重災(zāi)區(qū),播放歌曲、定時(shí)也頻頻翻車,有人甚至徹底心灰意冷。










現(xiàn)實(shí)與預(yù)期的反差很鮮明:傳統(tǒng)語音助手雖“笨”,但只要念對“咒語”(關(guān)鍵詞),結(jié)果就可預(yù)期;生成式AI助手智商高、理解深、表達(dá)豐富,卻在開燈、定時(shí)等原本擅長的事上頻頻掉鏈子。

問題出在哪?LLM天生帶隨機(jī)性,理解多、表達(dá)自由的代價(jià)是解釋空間被放大,包括誤解的可能。ChatGPT同一問題不同答案是優(yōu)勢,但放到咖啡機(jī)控制這種需即時(shí)、可重復(fù)、零容錯(cuò)的場景,概率性就是bug。

傳統(tǒng)語音助手是“模板匹配器”,不理解語義,只識別關(guān)鍵詞填參數(shù),比如“播放廣播”后只能跟電臺名。亞馬遜、谷歌嘗試把LLM和智能家居API綁定補(bǔ)確定性短板,卻又引新問題:LLM不擅長每次生成完全一致、語法正確的系統(tǒng)調(diào)用,控制真實(shí)設(shè)備時(shí),極小偏差都可能導(dǎo)致操作失敗——這就是咖啡機(jī)“耍脾氣”的原因。

理論上,讓新助手達(dá)舊助手的可靠性并非不可能,但需大量工程投入、約束設(shè)計(jì)和失敗兜底。現(xiàn)實(shí)中,企業(yè)更愿先推技術(shù)再慢慢修正,我們成了AI的長期內(nèi)測用戶。
既然如此,為何還要拋棄舊技術(shù)?因?yàn)椤皾摿Α薄I墒紸I帶來的是能力范式切換:代理式AI(Agentic AI)能理解復(fù)雜任務(wù)關(guān)系,動態(tài)生成執(zhí)行邏輯;而傳統(tǒng)語音助手是“單指令執(zhí)行器”,無法理解目標(biāo)、拆解任務(wù),更不能運(yùn)行時(shí)生成新路徑。
社區(qū)討論中,用戶也承認(rèn)新助手的進(jìn)步:能同時(shí)調(diào)燈和恒溫器,質(zhì)問“為何不關(guān)音樂”時(shí)會查原因,攝像頭通知從“后院檢測到運(yùn)動”變成“門口出現(xiàn)不熟悉面孔但未進(jìn)院子”,語音設(shè)置復(fù)雜Routine比App點(diǎn)設(shè)置輕松。
逐漸形成的溫和共識是:問題不在引入AI,而在“邊界”——是否用AI替代一切。合理方向不是“去按鈕化”取代已驗(yàn)證的確定性執(zhí)行機(jī)制,而是讓AI幫人理解系統(tǒng)。

當(dāng)前的混亂,或許不是生成式AI的失敗,而是它被放在了不適合的核心位置。這條“邊界”何時(shí)能清晰勾勒,還未可知。
你的智能家具還好嗎?有過抓狂瞬間嗎?歡迎評論區(qū)聊聊。
參考鏈接
https://www.theverge.com/tech/845958/ai-smart-home-broken
https://www.reddit.com/r/technology/comments/1pvh1c8/how_ai_broke_the_smart_home_in_2025_the_arrival/
本文來自微信公眾號“機(jī)器之心”(ID:almosthuman2014),作者:Sia,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






