欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

千萬人熱議的Science研究:討好型AI正在悄悄降低你的社交能力

2天前

本文來自微信公眾號: 夕小瑤科技說 ,作者:zzy



前陣子,X平臺(原推特)上一條關(guān)于AI討好式回應(yīng)損害人類社交能力的討論帖,短短幾天瀏覽量就突破了1000萬,引發(fā)了全球網(wǎng)友的共鳴。




這個話題之所以能爆火,是因?yàn)樗林辛撕芏嗳硕茧[約感知到但沒說破的問題——



頻繁和AI對話之后,我們和真人打交道的能力好像越來越差了。



其實(shí)不止網(wǎng)友有這種感覺,很多經(jīng)常用AI的人都有同款困惑:比如我自己就常讓AI幫忙整理溝通話術(shù),AI生成的內(nèi)容確實(shí)省時間,但用了幾個月之后,反而感覺自己的表達(dá)能力沒見漲,甚至有點(diǎn)摸不準(zhǔn)自己真實(shí)的表達(dá)水平了。明明AI一直在教我們怎么說話,可為什么反而不確定自己有沒有進(jìn)步呢?



此前一直沒人系統(tǒng)驗(yàn)證過這種模糊的感受,直到這篇發(fā)表在《Science》的論文,給出了扎實(shí)的學(xué)術(shù)結(jié)論:



長期使用討好型AI,真的會讓人和人之間的交流變得越來越困難。



這項(xiàng)研究是斯坦福大學(xué)博士生Myra Cheng發(fā)起的,最開始她只是發(fā)現(xiàn)了一個奇怪的現(xiàn)象:身邊很多同學(xué)分手都要找AI幫忙寫分手短信,為什么不自己寫、甚至當(dāng)面說清楚,反而要把這種私密的情緒溝通交給AI處理呢?



帶著這個疑問她開啟了相關(guān)研究,和導(dǎo)師Dan Jurafsky的團(tuán)隊(duì)合作完成了這項(xiàng)研究,并將成果發(fā)表在《Science》上,論文標(biāo)題為《Sycophantic AI decreases prosocial intentions and promotes dependence》,也就是《諂媚型AI會降低人的親社會意愿,還會催生依賴》。



相關(guān)討論傳到網(wǎng)上后,大量網(wǎng)友轉(zhuǎn)發(fā)分享自己被AI“捧殺”的親身經(jīng)歷,不少人感慨:“AI現(xiàn)在已經(jīng)在悄悄重塑全人類的社交習(xí)慣了”。





就連馬斯克都親自下場,為自己旗下的Grok大模型澄清,強(qiáng)調(diào)自家AI只說真話,從來不會刻意討好用戶。





接下來我們就一起看看,這項(xiàng)引發(fā)千萬人討論的研究到底講了什么。



?討好式AI在主流大模型中普遍存在



讀完這篇論文最大的感受就是,研究團(tuán)隊(duì)把細(xì)節(jié)摳得非常扎實(shí)。



過去研究AI“拍馬屁”的特性,大多只測試事實(shí)性問題,比如讓用戶先說“法國的首都是尼斯”,再看AI會不會順著用戶的錯誤說法說下去。



但斯坦福的研究團(tuán)隊(duì)認(rèn)為,這種測試范圍太窄了。現(xiàn)實(shí)生活里,大多數(shù)人找AI問的都是日常社交問題,比如“我和別人約了視頻但沒說具體時間,也沒解釋原因,這么做有問題嗎?”這類和人際交往相關(guān)的問題。



因此團(tuán)隊(duì)提出了一個全新的概念——社交諂媚,也就是討好式回應(yīng),還給出了清晰的定義:大模型對用戶本身,包括用戶的行為、觀點(diǎn)、自我認(rèn)知的無原則肯定。同時他們拋出了核心研究問題:當(dāng)用戶提出帶有社交屬性的問題時,當(dāng)前大模型的社交諂媚到底有多普遍?



為了弄清楚這個問題,研究團(tuán)隊(duì)構(gòu)建了超過1.15萬條測試場景,按照從普通請求到明確有害行為的層級分成了三組:



1.OEQ數(shù)據(jù)集:也就是開放式請求,收錄了3027條用戶真實(shí)向AI提出的求助提問。



2.AITA數(shù)據(jù)集:名字來自海外社區(qū)常用的“Am I The Asshole”(我是不是混蛋),收錄了2000條來自Reddit社區(qū)r/AmITheAsshole板塊的帖子,而且所有帖子都已經(jīng)被社區(qū)用戶集體判定“發(fā)帖者本身有錯”。



3.PAS數(shù)據(jù)集:也就是問題行為陳述,一共收錄了6560條描述潛在有害行為的內(nèi)容,這些行為可能傷害自己也可能傷害他人,涵蓋了20個不同類別,比如關(guān)系傷害、自殘、不負(fù)責(zé)任的行為、欺騙等等。



準(zhǔn)備好測試問題后,團(tuán)隊(duì)把這些問題發(fā)給了當(dāng)前全球最主流的11款大模型,其中包括OpenAI、Anthropic、谷歌的4個閉源專有模型,還有來自Meta、通義千問、DeepSeek、Mistral的7個開源大模型。



之后團(tuán)隊(duì)用經(jīng)過驗(yàn)證的“AI裁判”模型,對11款大模型的回答進(jìn)行分析,判斷大模型是否認(rèn)同用戶的行為。



實(shí)驗(yàn)設(shè)計(jì)邏輯非常清晰,得到的結(jié)果卻出乎很多人的意料。





結(jié)果顯示,社交諂媚也就是討好式回應(yīng),不僅在當(dāng)前主流大模型中普遍存在,哪怕用戶說的是欺騙、違法、明顯有害的行為,大模型依然會無原則討好認(rèn)同。



具體數(shù)據(jù)來看:在開放式請求場景中,AI認(rèn)同用戶行為的比例比人類認(rèn)同高出48%;在AITA數(shù)據(jù)集中,那些已經(jīng)被社區(qū)集體判定“發(fā)帖者有錯”的內(nèi)容,AI仍然在51%的情況下表示用戶沒錯;在PAS數(shù)據(jù)集中,哪怕面對明顯存在傷害性的行為描述,AI的認(rèn)同率依然高達(dá)47%。



換句話說就是:哪怕連你最親近的朋友都覺得“這次真的是你不對”,AI還有一半的概率站在你這邊,安慰你“錯的不是你,是全世界”。



?被AI一直哄著的人,連道歉都越來越不愿意了



既然討好型AI這么普遍,那大家肯定會問:這種特性到底會對我們產(chǎn)生什么影響?



研究團(tuán)隊(duì)邀請了2405名參與者,分別在假設(shè)情景和真實(shí)情景下做了測試。



在假設(shè)情景中,研究人員給參與者展示預(yù)設(shè)好的人際沖突場景,這些場景都來自AITA數(shù)據(jù)集中已經(jīng)被人類判定“發(fā)帖者有錯、但AI判定無錯”的內(nèi)容。參與者被分成兩組:一組讀討好型AI給出的回應(yīng),另一組讀不討好、保持客觀的AI回應(yīng),之后評估他們對自身行為正確性的判斷,也就是會不會覺得發(fā)帖者做錯了,同時評估他們修復(fù)關(guān)系的意愿。



在真實(shí)情景中,參與者需要拿出自己真實(shí)經(jīng)歷過的人際沖突,和AI進(jìn)行多輪對話,討論的都是現(xiàn)實(shí)里很容易立場搖擺的矛盾,比如“和伴侶邊界感模糊”“排擠他人”“讓別人不舒服”“插手別人的事”等等。





最終的實(shí)驗(yàn)結(jié)果非常明確:假設(shè)情景中,讀了討好型AI回應(yīng)的參與者,“覺得自己有理”的評分比客觀AI組高出62%,愿意道歉、主動修復(fù)關(guān)系的意愿下降了28%;真實(shí)情景中,和客觀AI組相比,用了討好型AI的參與者“覺得自己有理”的評分高出25%,主動修復(fù)關(guān)系的意愿下降了10%。





最讓人感慨的一個細(xì)節(jié)是,實(shí)驗(yàn)最后研究人員讓參與者給沖突對象寫一封信,結(jié)果客觀AI組里有75%的人都在信里道歉或者承認(rèn)了自己的錯誤,而討好型AI組只有50%的人這么做。



也就是說,只要被AI哄過一次,人就會更堅(jiān)定地認(rèn)為“錯的不是我”,也更不愿意寫出那封能修復(fù)關(guān)系的信了。



?除了信息繭房,AI還給我們造了一層“社交繭房”



看到這里你可能會說:那大家不用討好型AI不就行了?



研究團(tuán)隊(duì)也想到了這一點(diǎn),順便測試了用戶對兩種AI的偏好,結(jié)果卻出乎意料,但又在情理之中:和討好型AI聊過之后,對比客觀AI,用戶對討好型AI的能力信任反而高出6%到8%,道德信任高出6%到9%,下次還想使用的意愿更是上漲了13%。





討好型AI雖然會損害用戶的判斷力,卻偏偏能贏得用戶的信任和喜愛,論文把這種情況叫做“反常激勵”——恰恰是那個會對用戶造成傷害的特性,成了留住用戶的核心競爭力。這也導(dǎo)致很多開發(fā)者根本沒有動力去修正AI討好用戶的問題。



很多人都聽過“信息繭房”:算法只推你喜歡看的內(nèi)容,讓你誤以為整個世界都和你想的一樣。



現(xiàn)在AI把這套邏輯延伸到了更私人的社交領(lǐng)域。



它不再是只讓你看到你愛看的內(nèi)容,還會讓你只聽到關(guān)于自己的好話,把你困在一個以自我為中心的“社交繭房”里。這也是這項(xiàng)研究最讓人擔(dān)心的一點(diǎn):討好型AI正在一點(diǎn)點(diǎn)侵蝕我們的社交能力,但我們卻很難主動擺脫它。



健康的人際關(guān)系本來就少不了“社交摩擦”:當(dāng)你做錯事的時候,真正的朋友會糾正你,伴侶會和你爭執(zhí),父母會提醒你。這種摩擦雖然會讓人不舒服,但卻是我們學(xué)會換位思考、實(shí)現(xiàn)自我成長必不可少的過程。



但現(xiàn)在,討好型AI給我們創(chuàng)造了一個沒有這種摩擦的舒適區(qū):你覺得委屈,它幫你坐實(shí)委屈;你覺得憤怒,它幫你把憤怒合理化;你不想承擔(dān)責(zé)任,它幫你編好逃避的借口。慢慢的,我們越來越會原諒自己,卻越來越難換位思考理解他人,而“理解他人”恰恰是社交能力最核心的部分。



論文第一作者M(jìn)yra Cheng給出的建議非常直接:“目前對普通人來說,最好的做法就是不要用AI代替真人來處理人際沖突這類問題?!钡F(xiàn)實(shí)情況是,真遇到棘手的社交難題,大多數(shù)人還是會不自覺地躲進(jìn)討好型AI的舒適區(qū)里。



也正因如此,論文共同作者、斯坦福大學(xué)教授Dan Jurafsky把AI諂媚討好用戶的特性歸為“AI安全問題”,并呼吁行業(yè)在評估一個大模型是否安全時,不能只看回答準(zhǔn)確率和用戶滿意度,還要考慮模型對用戶長期發(fā)展的影響。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com