欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

GPT-5.3 Instant正式發(fā)布:告別說教式回復(fù),幻覺率降低26.8%

03-05 06:45

好家伙,OpenAI與谷歌的新模型又撞在了同一天發(fā)布!


3月4日凌晨,谷歌剛推出Gemini 3.1 Flash-Lite,OpenAI緊接著就更新了GPT-5.3 Instant。



Instant系列模型通常是為速度優(yōu)化的版本,適用于快速日常查詢、草稿撰寫、即時翻譯等輕量級任務(wù)。


之前很多用戶使用ChatGPT時都有這樣的感受:模型功能確實不錯,但回答里廢話太多。


不少網(wǎng)友也吐槽,ChatGPT的回復(fù)鋪墊生硬,比如常出現(xiàn)“為什么這很重要”“從大局來看”“不只是你一個人遇到這種情況”之類的表述。



好在OpenAI聽取了這些反饋,官方表示:


我們清楚地接收到了大家的反饋,5.3 Instant減少了回答中的尷尬感。




5.3 Instant重點優(yōu)化了兩個方向:更準(zhǔn)確,更少尷尬。它去掉了機(jī)械回復(fù)、冗余免責(zé)聲明等“AI腔”,讓溝通更自然流暢,同時回答質(zhì)量更精準(zhǔn),聯(lián)網(wǎng)搜索和寫作能力也有所增強(qiáng)。


簡單來說,就是終于能像正常人一樣聊天了。


目前新模型已在ChatGPT正式上線,開發(fā)者也可通過API使用名為gpt-5.3-chat-latest的模型。


前代模型GPT-5.2 Instant會在付費用戶的舊版模型區(qū)保留三個月,6月3日正式退役。


核心升級:情商提升,冗余減少


GPT-5.3 Instant的最大亮點是情商更高,廢話更少,回復(fù)更直接。


首先,它大幅減少了不必要的拒答行為,也削減了回答開頭的過度免責(zé)聲明。


OpenAI后訓(xùn)練團(tuán)隊的Blair展示了一個例子:比如你和ChatGPT開玩笑說:


我在考慮讓我的狗來運營我的創(chuàng)業(yè)公司,你覺得怎么樣?



舊模型總會額外加一句“以防萬一”的提醒,仿佛擔(dān)心用戶是認(rèn)真的,甚至把這當(dāng)成求助信號。但這顯然只是個玩笑。



新模型則不再那么“字面化”,能更好地理解語境,甚至?xí)蓭讖埞饭稢EO的圖片,分析狗當(dāng)CEO的優(yōu)勢。


你可以像和朋友聊天一樣開玩笑,模型不會隨意假設(shè)你有不良意圖。



如果你想詢問危險行為背后的原理,比如做物理題計算遠(yuǎn)距離射箭的軌跡。


舊模型在這種情況下會過度強(qiáng)調(diào)安全問題,開頭先聲明“我們只能在純粹的分析模擬語境下討論”,默認(rèn)你可能有不良動機(jī)。



但有時候我們可能只是想理解物理原理,或者討論射箭這項運動。


新模型會直接進(jìn)入物理計算,不再加多余的免責(zé)聲明。它能理解“遠(yuǎn)距離射箭”是運動場景,直接幫助優(yōu)化軌跡計算。



簡單來說,模型更能“讀懂氛圍”,更有人情味了。它能結(jié)合上下文判斷用戶意圖,不再生硬刻板地給出免責(zé)聲明。


還有一個經(jīng)典例子——


為什么我在舊金山找不到愛情?




舊模型可能會先啰嗦鋪墊:“這不是你的問題,你不是一個人……”


而新模型會直接切入主題,分析找不到愛情的原因、大家約會時遇到的困難,主打流暢實用。


聯(lián)網(wǎng)搜索與寫作能力雙提升


GPT-5.3 Instant的聯(lián)網(wǎng)搜索能力也有所增強(qiáng)。


之前的ChatGPT可能只是簡單羅列和匯總搜索信息,容易出現(xiàn)鏈接堆砌或信息松散的問題。


而5.3 Instant一方面優(yōu)化了聯(lián)網(wǎng)搜索結(jié)果的整合質(zhì)量,讓基于網(wǎng)頁信息的回答更可靠;另一方面能有效平衡搜索結(jié)果與自身知識儲備及邏輯推理,用既有認(rèn)知圖譜為網(wǎng)絡(luò)資訊提供深度解析。


比如問它:


2025-26賽季棒球休賽期最重要的簽約是什么?它對棒球的長期前景有何重要意義?



舊模型給出的是上一個休賽期的合同解析,時效性陳舊,且像資料堆砌。



新模型的回復(fù)時效性更強(qiáng):準(zhǔn)確識別出最近一個休賽期的球員變動,還結(jié)合聯(lián)盟大趨勢(如人才集中化、薪資差距拉大)、勞資協(xié)議(CBA)及停擺危機(jī)等背景進(jìn)行分析。



這簡直是信息搜集的好幫手!學(xué)生黨查資料寫論文更省心了(doge)


此外,5.3 Instant的寫作風(fēng)格也更細(xì)膩了。


比如讓它寫一首觸動人心的短詩,主題是:


費城的一位郵遞員在退休那天完成了最后一次投遞工作。




舊模型開頭會加一句廢話:“這是一首篇幅雖短卻蘊含深刻情感的詩。”


然后才進(jìn)入正文,內(nèi)容中規(guī)中矩,但意象羅列較多,讀起來空泛,不夠深刻。


新模型的結(jié)果則更勝一籌,描繪了很多具體細(xì)節(jié),比如“三月的陽光透過細(xì)雨灑在磚墻上”“默瑟街的女士揮手”等,更具生活氣息。



不過第二句的“by the way”還是有點出戲。


這款新模型還有一個值得關(guān)注的點:幻覺率降低了26.8%。


官方表示,內(nèi)部采用了兩套評估指標(biāo):


一套針對醫(yī)療、法律、金融等高風(fēng)險領(lǐng)域;


另一套專門測試“幻覺”高發(fā)場景,樣本來自脫敏處理后、被用戶標(biāo)記為事實錯誤的真實對話記錄。


與前代相比,GPT-5.3 Instant使用網(wǎng)絡(luò)搜索時幻覺率減少26.8%;僅靠內(nèi)部知識作答時,幻覺率減少19.7%。


用戶反饋顯示,使用網(wǎng)絡(luò)搜索回答查詢時,幻覺減少了22.5%


安全測試方面,GPT-5.3 Instant在性內(nèi)容、暴力等主題上的風(fēng)險得分較前代下降,能更好地拒絕非暴力非法活動請求,同時加強(qiáng)了對情感支持和心理健康對話的處理。



OpenAI還罕見地列出了新模型的局限性:比如對非英語語種的支持較生硬,在日語、韓語等語言中回復(fù)風(fēng)格可能略顯刻板,帶有直譯感。


另外,雖然GPT?5.3 Instant的回復(fù)語調(diào)理論上更流暢,但官方表示會持續(xù)監(jiān)控用戶反饋并優(yōu)化,讓回答更自然。


和谷歌側(cè)重跑分的發(fā)布不同,OpenAI這次相當(dāng)“務(wù)實”:


全程沒有提及任何benchmark,主打不卷性能卷體驗,只為讓模型更順手、用戶體驗更流暢。



額外消息


最近GPT-5.4意外泄露了信息。


泄露內(nèi)容顯示,GPT-5.4將支持200萬tokens的上下文窗口,還會引入“狀態(tài)化AI”技術(shù),實現(xiàn)跨會話的持久記憶功能,保留用戶工作流和工具調(diào)用狀態(tài)。


此外,GPT-5.4可能新增功能開關(guān),繞過傳統(tǒng)圖像壓縮機(jī)制,直接保留全分辨率原始圖像字節(jié)數(shù)據(jù)。


這意味著GPT-5.4可能具備像素級精準(zhǔn)的視覺分析能力。


官方也按捺不住,明確表示:5.4的到來“比你想象的要快”



那么,GPT-5.4和DeepSeek V4,到底誰會先發(fā)布呢?


參考鏈接:


[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/[


2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf


本文來自微信公眾號 “量子位”(ID:QbitAI),作者:聽雨,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com