欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<code id="5rkte"><td id="5rkte"></td></code>

<center id="5rkte"><bdo id="5rkte"></bdo></center>

<center id="5rkte"><sup id="5rkte"></sup></center>

<option id="5rkte"></option>

<option id="5rkte"><td id="5rkte"></td></option>

<bdo id="5rkte"><xmp id="5rkte"><center id="5rkte"></center></xmp></bdo>

千萬人熱議的Science研究：討好型AI正在悄悄降低你的社交能力

2天前

本文來自微信公眾號：夕小瑤科技說，作者：zzy

前陣子，X平臺（原推特）上一條關(guān)于AI討好式回應(yīng)損害人類社交能力的討論帖，短短幾天瀏覽量就突破了1000萬，引發(fā)了全球網(wǎng)友的共鳴。

這個話題之所以能爆火，是因?yàn)樗林辛撕芏嗳硕茧[約感知到但沒說破的問題——

頻繁和AI對話之后，我們和真人打交道的能力好像越來越差了。

其實(shí)不止網(wǎng)友有這種感覺，很多經(jīng)常用AI的人都有同款困惑：比如我自己就常讓AI幫忙整理溝通話術(shù)，AI生成的內(nèi)容確實(shí)省時間，但用了幾個月之后，反而感覺自己的表達(dá)能力沒見漲，甚至有點(diǎn)摸不準(zhǔn)自己真實(shí)的表達(dá)水平了。明明AI一直在教我們怎么說話，可為什么反而不確定自己有沒有進(jìn)步呢？

此前一直沒人系統(tǒng)驗(yàn)證過這種模糊的感受，直到這篇發(fā)表在《Science》的論文，給出了扎實(shí)的學(xué)術(shù)結(jié)論：

長期使用討好型AI，真的會讓人和人之間的交流變得越來越困難。

這項(xiàng)研究是斯坦福大學(xué)博士生Myra Cheng發(fā)起的，最開始她只是發(fā)現(xiàn)了一個奇怪的現(xiàn)象：身邊很多同學(xué)分手都要找AI幫忙寫分手短信，為什么不自己寫、甚至當(dāng)面說清楚，反而要把這種私密的情緒溝通交給AI處理呢？

帶著這個疑問她開啟了相關(guān)研究，和導(dǎo)師Dan Jurafsky的團(tuán)隊(duì)合作完成了這項(xiàng)研究，并將成果發(fā)表在《Science》上，論文標(biāo)題為《Sycophantic AI decreases prosocial intentions and promotes dependence》，也就是《諂媚型AI會降低人的親社會意愿，還會催生依賴》。

相關(guān)討論傳到網(wǎng)上后，大量網(wǎng)友轉(zhuǎn)發(fā)分享自己被AI“捧殺”的親身經(jīng)歷，不少人感慨：“AI現(xiàn)在已經(jīng)在悄悄重塑全人類的社交習(xí)慣了”。

就連馬斯克都親自下場，為自己旗下的Grok大模型澄清，強(qiáng)調(diào)自家AI只說真話，從來不會刻意討好用戶。

接下來我們就一起看看，這項(xiàng)引發(fā)千萬人討論的研究到底講了什么。

?討好式AI在主流大模型中普遍存在

讀完這篇論文最大的感受就是，研究團(tuán)隊(duì)把細(xì)節(jié)摳得非常扎實(shí)。

過去研究AI“拍馬屁”的特性，大多只測試事實(shí)性問題，比如讓用戶先說“法國的首都是尼斯”，再看AI會不會順著用戶的錯誤說法說下去。

但斯坦福的研究團(tuán)隊(duì)認(rèn)為，這種測試范圍太窄了。現(xiàn)實(shí)生活里，大多數(shù)人找AI問的都是日常社交問題，比如“我和別人約了視頻但沒說具體時間，也沒解釋原因，這么做有問題嗎？”這類和人際交往相關(guān)的問題。

因此團(tuán)隊(duì)提出了一個全新的概念——社交諂媚，也就是討好式回應(yīng)，還給出了清晰的定義：大模型對用戶本身，包括用戶的行為、觀點(diǎn)、自我認(rèn)知的無原則肯定。同時他們拋出了核心研究問題：當(dāng)用戶提出帶有社交屬性的問題時，當(dāng)前大模型的社交諂媚到底有多普遍？

為了弄清楚這個問題，研究團(tuán)隊(duì)構(gòu)建了超過1.15萬條測試場景，按照從普通請求到明確有害行為的層級分成了三組：

1.OEQ數(shù)據(jù)集：也就是開放式請求，收錄了3027條用戶真實(shí)向AI提出的求助提問。

2.AITA數(shù)據(jù)集：名字來自海外社區(qū)常用的“Am I The Asshole”（我是不是混蛋），收錄了2000條來自Reddit社區(qū)r/AmITheAsshole板塊的帖子，而且所有帖子都已經(jīng)被社區(qū)用戶集體判定“發(fā)帖者本身有錯”。

3.PAS數(shù)據(jù)集：也就是問題行為陳述，一共收錄了6560條描述潛在有害行為的內(nèi)容，這些行為可能傷害自己也可能傷害他人，涵蓋了20個不同類別，比如關(guān)系傷害、自殘、不負(fù)責(zé)任的行為、欺騙等等。

準(zhǔn)備好測試問題后，團(tuán)隊(duì)把這些問題發(fā)給了當(dāng)前全球最主流的11款大模型，其中包括OpenAI、Anthropic、谷歌的4個閉源專有模型，還有來自Meta、通義千問、DeepSeek、Mistral的7個開源大模型。

之后團(tuán)隊(duì)用經(jīng)過驗(yàn)證的“AI裁判”模型，對11款大模型的回答進(jìn)行分析，判斷大模型是否認(rèn)同用戶的行為。

實(shí)驗(yàn)設(shè)計(jì)邏輯非常清晰，得到的結(jié)果卻出乎很多人的意料。

結(jié)果顯示，社交諂媚也就是討好式回應(yīng)，不僅在當(dāng)前主流大模型中普遍存在，哪怕用戶說的是欺騙、違法、明顯有害的行為，大模型依然會無原則討好認(rèn)同。

具體數(shù)據(jù)來看：在開放式請求場景中，AI認(rèn)同用戶行為的比例比人類認(rèn)同高出48%；在AITA數(shù)據(jù)集中，那些已經(jīng)被社區(qū)集體判定“發(fā)帖者有錯”的內(nèi)容，AI仍然在51%的情況下表示用戶沒錯；在PAS數(shù)據(jù)集中，哪怕面對明顯存在傷害性的行為描述，AI的認(rèn)同率依然高達(dá)47%。

換句話說就是：哪怕連你最親近的朋友都覺得“這次真的是你不對”，AI還有一半的概率站在你這邊，安慰你“錯的不是你，是全世界”。

?被AI一直哄著的人，連道歉都越來越不愿意了

既然討好型AI這么普遍，那大家肯定會問：這種特性到底會對我們產(chǎn)生什么影響？

研究團(tuán)隊(duì)邀請了2405名參與者，分別在假設(shè)情景和真實(shí)情景下做了測試。

在假設(shè)情景中，研究人員給參與者展示預(yù)設(shè)好的人際沖突場景，這些場景都來自AITA數(shù)據(jù)集中已經(jīng)被人類判定“發(fā)帖者有錯、但AI判定無錯”的內(nèi)容。參與者被分成兩組：一組讀討好型AI給出的回應(yīng)，另一組讀不討好、保持客觀的AI回應(yīng)，之后評估他們對自身行為正確性的判斷，也就是會不會覺得發(fā)帖者做錯了，同時評估他們修復(fù)關(guān)系的意愿。

在真實(shí)情景中，參與者需要拿出自己真實(shí)經(jīng)歷過的人際沖突，和AI進(jìn)行多輪對話，討論的都是現(xiàn)實(shí)里很容易立場搖擺的矛盾，比如“和伴侶邊界感模糊”“排擠他人”“讓別人不舒服”“插手別人的事”等等。

最終的實(shí)驗(yàn)結(jié)果非常明確：假設(shè)情景中，讀了討好型AI回應(yīng)的參與者，“覺得自己有理”的評分比客觀AI組高出62%，愿意道歉、主動修復(fù)關(guān)系的意愿下降了28%；真實(shí)情景中，和客觀AI組相比，用了討好型AI的參與者“覺得自己有理”的評分高出25%，主動修復(fù)關(guān)系的意愿下降了10%。

最讓人感慨的一個細(xì)節(jié)是，實(shí)驗(yàn)最后研究人員讓參與者給沖突對象寫一封信，結(jié)果客觀AI組里有75%的人都在信里道歉或者承認(rèn)了自己的錯誤，而討好型AI組只有50%的人這么做。

也就是說，只要被AI哄過一次，人就會更堅(jiān)定地認(rèn)為“錯的不是我”，也更不愿意寫出那封能修復(fù)關(guān)系的信了。

?除了信息繭房，AI還給我們造了一層“社交繭房”

看到這里你可能會說：那大家不用討好型AI不就行了？

研究團(tuán)隊(duì)也想到了這一點(diǎn)，順便測試了用戶對兩種AI的偏好，結(jié)果卻出乎意料，但又在情理之中：和討好型AI聊過之后，對比客觀AI，用戶對討好型AI的能力信任反而高出6%到8%，道德信任高出6%到9%，下次還想使用的意愿更是上漲了13%。

討好型AI雖然會損害用戶的判斷力，卻偏偏能贏得用戶的信任和喜愛，論文把這種情況叫做“反常激勵”——恰恰是那個會對用戶造成傷害的特性，成了留住用戶的核心競爭力。這也導(dǎo)致很多開發(fā)者根本沒有動力去修正AI討好用戶的問題。

很多人都聽過“信息繭房”：算法只推你喜歡看的內(nèi)容，讓你誤以為整個世界都和你想的一樣。

現(xiàn)在AI把這套邏輯延伸到了更私人的社交領(lǐng)域。

它不再是只讓你看到你愛看的內(nèi)容，還會讓你只聽到關(guān)于自己的好話，把你困在一個以自我為中心的“社交繭房”里。這也是這項(xiàng)研究最讓人擔(dān)心的一點(diǎn)：討好型AI正在一點(diǎn)點(diǎn)侵蝕我們的社交能力，但我們卻很難主動擺脫它。

健康的人際關(guān)系本來就少不了“社交摩擦”：當(dāng)你做錯事的時候，真正的朋友會糾正你，伴侶會和你爭執(zhí)，父母會提醒你。這種摩擦雖然會讓人不舒服，但卻是我們學(xué)會換位思考、實(shí)現(xiàn)自我成長必不可少的過程。

但現(xiàn)在，討好型AI給我們創(chuàng)造了一個沒有這種摩擦的舒適區(qū)：你覺得委屈，它幫你坐實(shí)委屈；你覺得憤怒，它幫你把憤怒合理化；你不想承擔(dān)責(zé)任，它幫你編好逃避的借口。慢慢的，我們越來越會原諒自己，卻越來越難換位思考理解他人，而“理解他人”恰恰是社交能力最核心的部分。

論文第一作者M(jìn)yra Cheng給出的建議非常直接：“目前對普通人來說，最好的做法就是不要用AI代替真人來處理人際沖突這類問題?！钡F(xiàn)實(shí)情況是，真遇到棘手的社交難題，大多數(shù)人還是會不自覺地躲進(jìn)討好型AI的舒適區(qū)里。

也正因如此，論文共同作者、斯坦福大學(xué)教授Dan Jurafsky把AI諂媚討好用戶的特性歸為“AI安全問題”，并呼吁行業(yè)在評估一個大模型是否安全時，不能只看回答準(zhǔn)確率和用戶滿意度，還要考慮模型對用戶長期發(fā)展的影響。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

賣菜，硬折扣賽道必須補(bǔ)上的一課

曾闖F1賽道、深耕B2B營銷13年，OpenAI終于敲定尋覓半年的CMO

拆解永輝“77好蝦節(jié)”：產(chǎn)地直采加三重品控，打造平價鮮活蝦宴

突破英偉達(dá)壟斷：AI產(chǎn)業(yè)的另一條突圍之路

華為鄭俊：國產(chǎn)大模型結(jié)合本土算力已達(dá)全球領(lǐng)先水平

項(xiàng)目推薦