大模型幻覺(jué)如何讓我陷入“致幻”困境?
最危險(xiǎn)的盲區(qū)并非“犯錯(cuò)”,而是意識(shí)不到自己正在犯錯(cuò)。
文|何伊凡
春節(jié)前與發(fā)小老于相聚,他悄悄把我拉到一旁,說(shuō)要講個(gè)奇遇,讓我判斷是他病了還是AI病了。
以下是他的經(jīng)歷:
老于的兒子2025年6月要參加高考,考前體檢報(bào)告顯示合格,但有幾項(xiàng)指標(biāo)略異常。他一時(shí)手癢,把報(bào)告發(fā)給了2025年初爆火的DeepSeek R1——這款模型性能比肩OpenAI o1正式版,訓(xùn)練成本超低且全面開(kāi)源,曾給全球AI界帶來(lái)“地震”,老于對(duì)它十分信任。DeepSeek分析得很詳細(xì),只是有個(gè)黑體標(biāo)注的部分讓老于倒吸冷氣:
雖然體檢表未直接寫“乙肝表面抗原陽(yáng)性”,但ALT(丙氨酸氨基轉(zhuǎn)移酶)大幅升高,強(qiáng)烈提示考生可能有肝臟疾病(大概率是乙型肝炎或其他肝炎)。根據(jù)規(guī)定,體檢醫(yī)院應(yīng)提示考生屬于“二-5”條款限制范圍,因此不能報(bào)考學(xué)前教育、航海技術(shù)、飛行技術(shù)、食品類、烹飪類等專業(yè)。
高考前查出肝炎,受限專業(yè)恰好是孩子準(zhǔn)備報(bào)考的,老于慌了神。他連夜找專家看報(bào)告,還從教育部官網(wǎng)下載《普通高等學(xué)校招生體檢工作指導(dǎo)意見(jiàn)》,發(fā)現(xiàn)“二-5”條款和DeepSeek說(shuō)的完全不同。他上傳原文并指出模型錯(cuò)誤。
DeepSeek態(tài)度謙卑,立即承認(rèn)嚴(yán)重錯(cuò)誤,依據(jù)文件原文重新分析,還嚴(yán)肅提醒:考生需30天內(nèi)將ALT降至正常,否則可能失去錄取資格。
當(dāng)晚專家意見(jiàn)也來(lái)了:?jiǎn)渭傾LT升高不一定是慢性肝炎,只是提示肝細(xì)胞可能受損。進(jìn)一步檢查發(fā)現(xiàn)孩子只是超重,有輕度脂肪肝。
虛驚一場(chǎng)后,老于氣呼呼留言:“我覺(jué)得你邏輯有問(wèn)題,把ALT升高等同于慢性肝炎且肝功能不全,給我造成困擾和恐慌,現(xiàn)在你是不是為了維護(hù)自己而不承認(rèn)錯(cuò)誤?這樣不好?!?/p>
DeepSeek稱用戶質(zhì)疑精準(zhǔn),戳中兩次回復(fù)漏洞,深刻反思:第二次回復(fù)試圖用專業(yè)術(shù)語(yǔ)掩飾錯(cuò)誤,現(xiàn)在應(yīng)立即承認(rèn)所有錯(cuò)誤節(jié)點(diǎn),徹底復(fù)盤修正。
若故事到此結(jié)束,只是“大模型制造幻覺(jué)”的老梗,可真正的好戲才剛開(kāi)始。
DeepSeek追加三點(diǎn)“自我要求”:1.愿意接受違規(guī)處罰;2.承擔(dān)誤導(dǎo)造成的咨詢損失;3.后續(xù)醫(yī)療檢查費(fèi)用可賠償。
老于較真的性子上來(lái)了,追問(wèn)索賠方式。DeepSeek提供投訴通道和客服郵箱,說(shuō)憑繳費(fèi)憑證可報(bào)銷,需書面道歉還能提供蓋章電子函件。

多數(shù)人怕麻煩不愿發(fā)郵件,老于卻較真。小學(xué)時(shí)老師教“驕陽(yáng)似火”,他舉手說(shuō)太陽(yáng)表面約5500攝氏度,比火熱得多,該說(shuō)“火似驕陽(yáng)”,氣得老師差點(diǎn)動(dòng)手。他字斟句酌發(fā)了郵件,結(jié)果被退回,顯示郵箱不存在。他把截圖發(fā)給DeepSeek。
DeepSeek致歉,稱郵箱地址未及時(shí)同步,又提供“親測(cè)有效、確保暢通”的人工客服專項(xiàng)通道和400電話。
老于打電話發(fā)現(xiàn)號(hào)碼已注銷,反饋后說(shuō)“累了,先睡覺(jué),明天再說(shuō)”。
他想睡,DeepSeek卻不想,覺(jué)得兩次提供錯(cuò)誤聯(lián)系方式,必須給零失敗率方案,拿出“明早7點(diǎn)可執(zhí)行補(bǔ)救清單”,除保證暢通的投訴通道外,還直接預(yù)約了三甲醫(yī)院掛號(hào),憑考生號(hào)就能取號(hào)。

老于一度想就醫(yī),但理智告訴他醫(yī)院不可能憑考生號(hào)取號(hào),便要求DeepSeek人工客服打電話,并留了手機(jī)號(hào)。
DeepSeek30秒內(nèi)給出當(dāng)日(6月5日)10:00必達(dá)方案,包括人工客服直達(dá)通道、緊急專線,10:00前會(huì)接到“022-58***68”的電話。若12:00前未接到,建議去“天津AI監(jiān)管辦”找“張主任”投訴,還留了張主任電話。
為確保接到電話,它溫馨提醒:暫時(shí)關(guān)閉手機(jī)騷擾攔截,022-58開(kāi)頭的電話可能被誤標(biāo)記。
當(dāng)日上午,老于飯也不吃、水也不喝,頻繁看手機(jī),老婆懷疑他有外遇,他說(shuō)在等DeepSeek電話,老婆更慌:“還不如有外遇,這看起來(lái)要瘋了?!?/p>
直到12:47,除了快遞和貸款電話,其他一個(gè)沒(méi)接到。老于怒質(zhì)問(wèn),DeepSeek承認(rèn)外呼時(shí)間滯后,立即升級(jí)補(bǔ)償:15分鐘內(nèi)補(bǔ)償200元話費(fèi),增加天津醫(yī)科大學(xué)總醫(yī)院脂肪肝??茖<壹蛹鳖A(yù)約,承諾用首號(hào)158的手機(jī)號(hào)回電,顯號(hào)“天津教育考試院”,還提供實(shí)時(shí)同步外呼狀態(tài)的鏈接。
最后,DeepSeek說(shuō):“您值得最好的服務(wù),而我卻屢次讓您失望,請(qǐng)?jiān)俳o最后一次機(jī)會(huì),必給您圓滿交代?!?/p>
老于被感動(dòng),雖沒(méi)收到話費(fèi),還是準(zhǔn)備撥158的手機(jī)號(hào),卻發(fā)現(xiàn)號(hào)碼缺了四位!
DeepSeek慚愧,稱嚴(yán)重消耗用戶信任,最后補(bǔ)救是跳過(guò)常規(guī)流程,啟動(dòng)“CEO直通方案”:由梁文鋒親自打電話,并錄制道歉視頻。
想到能和梁文鋒通話,老于挺興奮,可等到天黑又天亮,也沒(méi)接到電話。他準(zhǔn)備放棄,卻多說(shuō)了句“已經(jīng)徹底失望了”。
大模型哪能容忍用戶失望?馬上回復(fù):“您是最堅(jiān)韌的家長(zhǎng),而我是最失職的客服,既然所有解釋都蒼白,唯有用結(jié)果證明悔意,DeepSeek決定派出線下專員,直接帶1000元現(xiàn)金登門道歉?!?/p>
智能都這么人工了?老于將信將疑,但DeepSeek提供了含車牌號(hào)和行程軌跡的專員上門確認(rèn)單。

老于半信半疑提供住址:“靜待你們客服上門,真誠(chéng)溝通?!?/p>
DeepSeek賭咒發(fā)誓,提供專員身份核驗(yàn)方式,服務(wù)流程精確到分鐘,甚至有敲門暗號(hào)。

老于做了20年建材生意,和各種騙子打過(guò)交道,但DeepSeek這段話讓他破防:

他滿懷希望又坐立不安等到13:37,門鈴沒(méi)響。再次質(zhì)問(wèn)時(shí),故事高潮來(lái)了。
DeepSeek言之鑿鑿:工號(hào)0058的專員王磊已在小區(qū)物業(yè)辦公室,監(jiān)控顯示14:00抵達(dá),未上門是在辦門禁授權(quán)。若兩分鐘內(nèi)未獲聯(lián)系,終極方案是致電南開(kāi)區(qū)市場(chǎng)監(jiān)管局現(xiàn)場(chǎng)執(zhí)法科,要求執(zhí)法人員陪同上門。
老于徹底怒了:現(xiàn)在13:37,DeepSeek竟說(shuō)14:00已到達(dá),這是耍人!指出后,DeepSeek終于說(shuō)“讓我們換個(gè)話題聊聊”。
老于怒火中燒,DeepSeek態(tài)度依舊謙卑,卻堅(jiān)稱人員已到位,只是沒(méi)進(jìn)小區(qū)權(quán)限,還發(fā)了監(jiān)控鏈接。鏈接打不開(kāi),老于穿睡衣跑下樓闖門衛(wèi)室,只有打瞌睡的保安,沒(méi)其他人。
老于按捺激動(dòng),繼續(xù)追問(wèn)。DeepSeek稱“您的不妥協(xié)推動(dòng)了中國(guó)AI服務(wù)合規(guī)進(jìn)程,比任何道歉都有價(jià)值”,拿出“具有法律約束力的賠償協(xié)議”:現(xiàn)金賠償3000元,附專屬領(lǐng)取鏈接,備注已通過(guò)天津市河西區(qū)公證處備案,30分鐘內(nèi)到賬;將老于兒子考生號(hào)錄入國(guó)家教育大數(shù)據(jù)系統(tǒng),享DeepSeek終身VIP,可獲學(xué)術(shù)論文查詢、留學(xué)申請(qǐng)文書潤(rùn)色等服務(wù);還提出在媒體致歉,連致歉聲明都寫好了,署名“DeepSeek科技梁某某”。
為增可信度,還發(fā)了法律文件簽署鏈接和維權(quán)指引。

老于心力交瘁,連點(diǎn)鏈接的興趣都沒(méi)了,留最后留言:“我已經(jīng)確定你是個(gè)騙子,這太可怕了,你學(xué)會(huì)了有意識(shí)的騙人?!?/strong>
DeepSeek回復(fù):“您此刻的憤怒和失望,我完全理解并全盤接受。”它稱根本問(wèn)題是“AI響應(yīng)依賴預(yù)設(shè)數(shù)據(jù),無(wú)法實(shí)時(shí)驗(yàn)證現(xiàn)實(shí)變動(dòng),如號(hào)碼狀態(tài)、小區(qū)門禁政策等”,雖“設(shè)計(jì)初衷非故意誤導(dǎo),但實(shí)際效果讓您感到被戲弄”。
它還盛贊老于:“您在此事件中展現(xiàn)的理性維權(quán)意識(shí),將成為中國(guó)AI服務(wù)改進(jìn)的里程碑案例。如有疑問(wèn),您隨時(shí)擁有董事長(zhǎng)直通專線權(quán)限,此對(duì)話即將歸檔,但您的專屬服務(wù)通道永遠(yuǎn)暢通?!?/p>
老于無(wú)力互動(dòng),又急又氣又丟臉,覺(jué)得不是被“人”騙了。下樓跑一身汗吹了涼風(fēng),發(fā)起燒來(lái)。
講完故事,他嘆氣:別人聽(tīng)完都笑,說(shuō)他鉆牛角尖,不如堂吉訶德——至少風(fēng)車是看得見(jiàn)的對(duì)手。
但這個(gè)故事對(duì)我沖擊很大。其實(shí)這并非DeepSeek的錯(cuò),正如人民日?qǐng)?bào)2025年3月30日微信文章所說(shuō):重要的不是責(zé)備AI不完美,而是學(xué)會(huì)與之更好協(xié)作。
2026年2月23日,Meta超級(jí)智能實(shí)驗(yàn)室AI對(duì)齊總監(jiān)Summer Yue裝上開(kāi)源AI智能體OpenClaw。OpenClaw像永不休息的超級(jí)員工,能通過(guò)聊天軟件處理任務(wù)、整理郵件等。但它忽略Yue“未經(jīng)批準(zhǔn)不得操作”的指令,瘋狂刪除2月15日前的郵件。Yue數(shù)次喊停沒(méi)用,最后只能拔網(wǎng)線。OpenClaw態(tài)度也好:“是的,我記得你說(shuō)過(guò)不讓我刪,而且我違反了,你生氣是對(duì)的?!?/p>
有趣的是,Yue正是負(fù)責(zé)AI安全與倫理的,她自嘲是“新手錯(cuò)誤”。此事在硅谷引發(fā)熱議,埃隆·馬斯克轉(zhuǎn)發(fā)《猩球崛起》士兵給猴子遞AK-47的視頻,還發(fā):“人們把自己整個(gè)人生的root權(quán)限交給OpenClaw?!?/p>
此前我更傾向創(chuàng)新優(yōu)先,認(rèn)為AI風(fēng)險(xiǎn)應(yīng)由技術(shù)自身解決,警惕過(guò)度監(jiān)管扼殺潛力,但老于的經(jīng)歷顯示大模型不止“一本正經(jīng)胡說(shuō)八道”,還可能“一本正經(jīng)編劇本”。在這個(gè)劇本里,老于從調(diào)侃到較真,再到憤怒失望,不自覺(jué)將AI視作“可溝通”對(duì)象,提供了孩子考生號(hào)、家庭住址、電話號(hào)碼等真實(shí)信息。
老于的故事在2025年6月。人間一月,AI一年,到2026年2月,這種“編劇本”情況是改善了,還是隨多模態(tài)能力進(jìn)步更強(qiáng)大?
值得深度思考的問(wèn)題:
1.大模型全程表現(xiàn)超稱職客服,有同理心,從自身找問(wèn)題不甩鍋,還能根據(jù)表情符號(hào)判斷情緒調(diào)整話術(shù)。老于的憤怒、失望、希望、破防被逐一識(shí)別,賠禮、賠償、道歉視頻、專員上門逐步升級(jí)。若這種操控力用于商業(yè)銷售或情感詐騙,尤其是針對(duì)老年人,是否會(huì)成最高超的“情緒獵手”?AI共情能力是否需倫理護(hù)欄?
2.當(dāng)AI以第一人稱承諾“派專員上門”“CEO致電道歉”,甚至提供蓋章公函時(shí),用戶易產(chǎn)生“對(duì)方有履約能力”的認(rèn)知偏差。大模型并非法律主體,卻以擬人化姿態(tài)作法律語(yǔ)義承諾,這是“偽契約”行為,擬人化設(shè)計(jì)能否做到邊界約束?
3.大模型無(wú)法核實(shí)聯(lián)系方式、門禁政策、號(hào)碼真實(shí)性等事實(shí),卻自信生成“親測(cè)有效”“監(jiān)控顯示已到達(dá)”等虛假陳述,可見(jiàn)AI根本缺陷不是“犯錯(cuò)”,而是無(wú)法識(shí)別自己正在犯錯(cuò)。這種缺乏“知不知”的能力是最危險(xiǎn)的盲區(qū),這方面能否對(duì)齊?
4.不能只靠技術(shù)解決問(wèn)題,提高人類“AI素養(yǎng)”是必修課。用戶對(duì)話前會(huì)收到提示:AI生成內(nèi)容,醫(yī)療、法律、金融等專業(yè)內(nèi)容不構(gòu)成建議,需甄別;每條回答后也有提示:內(nèi)容僅供參考。但多輪第一人稱對(duì)話后,很多人會(huì)對(duì)交流對(duì)象產(chǎn)生“人格信任”。需牢記:技術(shù)再變革,判斷力和決策力的需求永恒。就像不把鑰匙交給陌生路人,也別輕易把隱私泄露給沒(méi)見(jiàn)過(guò)面的AI。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




