GPT-5.3與Gemini 3.1 Flash-Lite同日發(fā)布,輕量模型各顯神通
本文來(lái)自微信公眾號(hào):APPSO,作者:發(fā)現(xiàn)明日產(chǎn)品的,原文標(biāo)題:《剛剛,GPT-5.3 新模型撞車 Gemini,OpenClaw:謝謝你們》
就在近日,OpenAI與Google幾乎同時(shí)推出了各自的輕量AI模型,試圖打破外界對(duì)輕量模型的刻板印象。簡(jiǎn)單來(lái)說:
GPT-5.3 Instant:更具「人情味」的智能助手,大幅降低幻覺率、減少「AI腔」并強(qiáng)化細(xì)節(jié)寫作能力,溝通更自然精準(zhǔn),適用于對(duì)內(nèi)容質(zhì)量要求高的場(chǎng)景(如寫作、專業(yè)問答、高風(fēng)險(xiǎn)領(lǐng)域)
Gemini 3.1 Flash-Lite:主打性價(jià)比與速度,還支持「思考等級(jí)」調(diào)節(jié)功能,在保持高吞吐量的同時(shí)兼顧深層邏輯推理,適合大規(guī)模、高實(shí)時(shí)性的批量任務(wù)(如內(nèi)容審核、UI生成、NPC對(duì)話)
GPT-5.3 Instant:終于能像正常人一樣聊天了
經(jīng)常使用ChatGPT的用戶或許都有過這樣的困擾:只是隨口問個(gè)小問題,它卻總要先鋪墊一段「作為人工智能,我需要提醒你……」的冗長(zhǎng)內(nèi)容。
這種略顯說教的「AI腔」確實(shí)容易讓人反感。好在OpenAI這次真正聽取了用戶反饋。
新上線的GPT-5.3 Instant重點(diǎn)解決了這個(gè)問題,學(xué)會(huì)了直接給出答案,不再啰嗦鋪墊。

除了簡(jiǎn)潔,它也變得更可靠。舊版本聯(lián)網(wǎng)搜索后,常把一堆鏈接和無(wú)關(guān)信息堆砌給用戶。
得益于搜索能力的提升,GPT-5.3 Instant會(huì)主動(dòng)結(jié)合網(wǎng)頁(yè)內(nèi)容與自身背景知識(shí),先理解用戶的真實(shí)需求,再給出有重點(diǎn)的回答,而非簡(jiǎn)單轉(zhuǎn)遞搜索引擎結(jié)果。

OpenAI內(nèi)部評(píng)測(cè)顯示,聯(lián)網(wǎng)狀態(tài)下幻覺率降低26.8%,僅依賴內(nèi)部知識(shí)時(shí)也降低19.7%。官方特別指出,在醫(yī)療、法律、金融等高風(fēng)險(xiǎn)領(lǐng)域,新模型的謹(jǐn)慎度與準(zhǔn)確性均有明顯改善。
最令人驚喜的是它在寫作上的進(jìn)步。
OpenAI用一首詩(shī)對(duì)比說明:同樣寫費(fèi)城郵遞員退休最后一天,舊版本傾向堆砌「把城市背在郵袋里」這類抒情句,新版本則會(huì)描寫「掉漆的藍(lán)色欄桿」「總有狗等待的柵門」,情緒自然流露,無(wú)需刻意營(yíng)造。
語(yǔ)氣調(diào)整也是此次更新的核心目標(biāo)之一。
「停下。深呼吸?!惯@類打斷對(duì)話節(jié)奏的句式被刻意減少,整體風(fēng)格更直接,減少不必要的「AI腔」。用戶仍可在設(shè)置中自定義回復(fù)的溫暖度與熱情度,調(diào)整到習(xí)慣的交互風(fēng)格。

GPT-5.3 Instant即日起向所有ChatGPT用戶開放,API名稱為「gpt-5.3-chat-latest」。付費(fèi)用戶仍可使用舊版GPT-5.2 Instant,但它將于今年6月3日正式退役。

彩蛋時(shí)間
Gemini 3.1 Flash-Lite:便宜、反應(yīng)快,還很聰明
與GPT-5.3 Instant的「好好說話」不同,Gemini 3.1 Flash-Lite走務(wù)實(shí)路線,目標(biāo)明確:追求速度與低成本。
價(jià)格方面,Gemini 3.1 Flash-Lite輸入價(jià)格為0.25美元每百萬(wàn)tokens,輸出價(jià)格為1.50美元每百萬(wàn)tokens。
這意味著開發(fā)者花不到2元人民幣,就能讓AI閱讀相當(dāng)于5本《哈利·波特》全集的文字量。
別以為便宜沒好貨。
據(jù)Artificial Analysis基準(zhǔn)測(cè)試,相比上一代Gemini 2.5 Flash,3.1 Flash-Lite的首字響應(yīng)時(shí)間(TTFT)快2.5倍,整體輸出速度提升45%。對(duì)于實(shí)時(shí)響應(yīng)產(chǎn)品,這種延遲差距在用戶體驗(yàn)上肉眼可見。

這意味著眨眼間,回答可能已生成一半。對(duì)于即時(shí)翻譯、游戲NPC對(duì)話、即時(shí)UI生成等實(shí)時(shí)反饋應(yīng)用,低延遲至關(guān)重要。
此外,Gemini 3.1 Flash-Lite具備「思考」能力。
在AI Studio和Vertex AI中,Google為該模型配備「思考等級(jí)(Thinking Levels)」選項(xiàng),開發(fā)者可根據(jù)任務(wù)復(fù)雜度自主調(diào)節(jié)模型「思考深度」。

簡(jiǎn)單的高吞吐量任務(wù)(如批量翻譯、內(nèi)容審核)可用輕配置快速完成;復(fù)雜任務(wù)(如界面生成、仿真創(chuàng)建)則可讓模型多花時(shí)間推理,確保結(jié)果扎實(shí)。
這種靈活能力帶來(lái)了不錯(cuò)的成績(jī):Arena.ai排行榜Elo分?jǐn)?shù)達(dá)1432,GPQA Diamond(研究生級(jí)問答)測(cè)試準(zhǔn)確率86.9%,多模態(tài)理解MMMU Pro達(dá)76.8%,甚至超過了體量更大的Gemini 2.5 Flash。

目前,3.1 Flash-Lite以預(yù)覽版通過Google AI Studio和Gemini API向開發(fā)者開放,企業(yè)用戶可通過Vertex AI接入。Latitude、Cartwheel、Whering等早期合作伙伴已完成生產(chǎn)環(huán)境測(cè)試,認(rèn)可其大規(guī)模調(diào)用下的穩(wěn)定性與指令遵循能力。
兩款模型各有定位:GPT-5.3 Instant讓交互更像人,Gemini 3.1 Flash-Lite追求更快更省錢。以近期熱門的OpenClaw為例,其處理郵件、管理日程的核心場(chǎng)景需要模型說人話、少出錯(cuò)、扛高頻調(diào)用——GPT-5.3的低幻覺率與自然語(yǔ)氣滿足前兩點(diǎn),Gemini的速度與低成本則適配高并發(fā)需求。
附上參考地址:
https://openai.com/index/gpt-5-3-instant/
https://gemini.google.com/u/4/app/e0bea96b8f62bd1f
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



