欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<i id="0lr8o"><dfn id="0lr8o"></dfn></i>

GPT-5.3 Instant正式發(fā)布：告別說教式回復(fù)，幻覺率降低26.8%

03-05 06:45

好家伙，OpenAI與谷歌的新模型又撞在了同一天發(fā)布！

3月4日凌晨，谷歌剛推出Gemini 3.1 Flash-Lite，OpenAI緊接著就更新了GPT-5.3 Instant。

Instant系列模型通常是為速度優(yōu)化的版本，適用于快速日常查詢、草稿撰寫、即時翻譯等輕量級任務(wù)。

之前很多用戶使用ChatGPT時都有這樣的感受：模型功能確實不錯，但回答里廢話太多。

不少網(wǎng)友也吐槽，ChatGPT的回復(fù)鋪墊生硬，比如常出現(xiàn)“為什么這很重要”“從大局來看”“不只是你一個人遇到這種情況”之類的表述。

好在OpenAI聽取了這些反饋，官方表示：

我們清楚地接收到了大家的反饋，5.3 Instant減少了回答中的尷尬感。

5.3 Instant重點優(yōu)化了兩個方向：更準(zhǔn)確，更少尷尬。它去掉了機(jī)械回復(fù)、冗余免責(zé)聲明等“AI腔”，讓溝通更自然流暢，同時回答質(zhì)量更精準(zhǔn)，聯(lián)網(wǎng)搜索和寫作能力也有所增強(qiáng)。

簡單來說，就是終于能像正常人一樣聊天了。

目前新模型已在ChatGPT正式上線，開發(fā)者也可通過API使用名為gpt-5.3-chat-latest的模型。

前代模型GPT-5.2 Instant會在付費用戶的舊版模型區(qū)保留三個月，6月3日正式退役。

核心升級：情商提升，冗余減少

GPT-5.3 Instant的最大亮點是情商更高，廢話更少，回復(fù)更直接。

首先，它大幅減少了不必要的拒答行為，也削減了回答開頭的過度免責(zé)聲明。

OpenAI后訓(xùn)練團(tuán)隊的Blair展示了一個例子：比如你和ChatGPT開玩笑說：

我在考慮讓我的狗來運營我的創(chuàng)業(yè)公司，你覺得怎么樣？

舊模型總會額外加一句“以防萬一”的提醒，仿佛擔(dān)心用戶是認(rèn)真的，甚至把這當(dāng)成求助信號。但這顯然只是個玩笑。

新模型則不再那么“字面化”，能更好地理解語境，甚至?xí)蓭讖埞饭稢EO的圖片，分析狗當(dāng)CEO的優(yōu)勢。

你可以像和朋友聊天一樣開玩笑，模型不會隨意假設(shè)你有不良意圖。

如果你想詢問危險行為背后的原理，比如做物理題計算遠(yuǎn)距離射箭的軌跡。

舊模型在這種情況下會過度強(qiáng)調(diào)安全問題，開頭先聲明“我們只能在純粹的分析模擬語境下討論”，默認(rèn)你可能有不良動機(jī)。

但有時候我們可能只是想理解物理原理，或者討論射箭這項運動。

新模型會直接進(jìn)入物理計算，不再加多余的免責(zé)聲明。它能理解“遠(yuǎn)距離射箭”是運動場景，直接幫助優(yōu)化軌跡計算。

簡單來說，模型更能“讀懂氛圍”，更有人情味了。它能結(jié)合上下文判斷用戶意圖，不再生硬刻板地給出免責(zé)聲明。

還有一個經(jīng)典例子——

為什么我在舊金山找不到愛情？

舊模型可能會先啰嗦鋪墊：“這不是你的問題，你不是一個人……”

而新模型會直接切入主題，分析找不到愛情的原因、大家約會時遇到的困難，主打流暢實用。

聯(lián)網(wǎng)搜索與寫作能力雙提升

GPT-5.3 Instant的聯(lián)網(wǎng)搜索能力也有所增強(qiáng)。

之前的ChatGPT可能只是簡單羅列和匯總搜索信息，容易出現(xiàn)鏈接堆砌或信息松散的問題。

而5.3 Instant一方面優(yōu)化了聯(lián)網(wǎng)搜索結(jié)果的整合質(zhì)量，讓基于網(wǎng)頁信息的回答更可靠；另一方面能有效平衡搜索結(jié)果與自身知識儲備及邏輯推理，用既有認(rèn)知圖譜為網(wǎng)絡(luò)資訊提供深度解析。

比如問它：

2025-26賽季棒球休賽期最重要的簽約是什么？它對棒球的長期前景有何重要意義？

舊模型給出的是上一個休賽期的合同解析，時效性陳舊，且像資料堆砌。

新模型的回復(fù)時效性更強(qiáng)：準(zhǔn)確識別出最近一個休賽期的球員變動，還結(jié)合聯(lián)盟大趨勢（如人才集中化、薪資差距拉大）、勞資協(xié)議(CBA)及停擺危機(jī)等背景進(jìn)行分析。

這簡直是信息搜集的好幫手！學(xué)生黨查資料寫論文更省心了（doge）

此外，5.3 Instant的寫作風(fēng)格也更細(xì)膩了。

比如讓它寫一首觸動人心的短詩，主題是：

費城的一位郵遞員在退休那天完成了最后一次投遞工作。

舊模型開頭會加一句廢話：“這是一首篇幅雖短卻蘊含深刻情感的詩。”

然后才進(jìn)入正文，內(nèi)容中規(guī)中矩，但意象羅列較多，讀起來空泛，不夠深刻。

新模型的結(jié)果則更勝一籌，描繪了很多具體細(xì)節(jié)，比如“三月的陽光透過細(xì)雨灑在磚墻上”“默瑟街的女士揮手”等，更具生活氣息。

不過第二句的“by the way”還是有點出戲。

這款新模型還有一個值得關(guān)注的點：幻覺率降低了26.8%。

官方表示，內(nèi)部采用了兩套評估指標(biāo)：

一套針對醫(yī)療、法律、金融等高風(fēng)險領(lǐng)域；

另一套專門測試“幻覺”高發(fā)場景，樣本來自脫敏處理后、被用戶標(biāo)記為事實錯誤的真實對話記錄。

與前代相比，GPT-5.3 Instant使用網(wǎng)絡(luò)搜索時幻覺率減少26.8%；僅靠內(nèi)部知識作答時，幻覺率減少19.7%。

用戶反饋顯示，使用網(wǎng)絡(luò)搜索回答查詢時，幻覺減少了22.5%。

安全測試方面，GPT-5.3 Instant在性內(nèi)容、暴力等主題上的風(fēng)險得分較前代下降，能更好地拒絕非暴力非法活動請求，同時加強(qiáng)了對情感支持和心理健康對話的處理。

OpenAI還罕見地列出了新模型的局限性：比如對非英語語種的支持較生硬，在日語、韓語等語言中回復(fù)風(fēng)格可能略顯刻板，帶有直譯感。

另外，雖然GPT?5.3 Instant的回復(fù)語調(diào)理論上更流暢，但官方表示會持續(xù)監(jiān)控用戶反饋并優(yōu)化，讓回答更自然。

和谷歌側(cè)重跑分的發(fā)布不同，OpenAI這次相當(dāng)“務(wù)實”：

全程沒有提及任何benchmark，主打不卷性能卷體驗，只為讓模型更順手、用戶體驗更流暢。

額外消息

最近GPT-5.4意外泄露了信息。

泄露內(nèi)容顯示，GPT-5.4將支持200萬tokens的上下文窗口，還會引入“狀態(tài)化AI”技術(shù)，實現(xiàn)跨會話的持久記憶功能，保留用戶工作流和工具調(diào)用狀態(tài)。

此外，GPT-5.4可能新增功能開關(guān)，繞過傳統(tǒng)圖像壓縮機(jī)制，直接保留全分辨率原始圖像字節(jié)數(shù)據(jù)。

這意味著GPT-5.4可能具備像素級精準(zhǔn)的視覺分析能力。

官方也按捺不住，明確表示：5.4的到來“比你想象的要快”。

那么，GPT-5.4和DeepSeek V4，到底誰會先發(fā)布呢？

參考鏈接：

[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/[

2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf

本文來自微信公眾號 “量子位”（ID：QbitAI），作者：聽雨，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

《鏢人》武戲驚艷難挽武俠頹勢，江湖黃昏何尋俠義魂

維修費用堪比買車，人形機(jī)器人“看病”為何如此昂貴？

3·15未至，椰子水已陷“信任危機(jī)”？

京東MALL今晚開啟iPhone 17e預(yù)約疊加補(bǔ)貼最高可省千元

運營未滿一年騰訊曾投資的《黑色信標(biāo)》宣告停更