欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

谷歌Gemini 3.1 Pro Preview:看似微小迭代,為何讓姚順宇直呼“不可阻擋”?

02-22 06:06
當OpenAI與Anthropic的掌門人因合作分歧而握拳相對的畫面仍被熱議時,谷歌悄然完成了一次模型迭代。



這次迭代從版本號看堪稱谷歌Gemini系列“最小”的一次——此前是Gemini 2.0到2.5的跨越,此次僅從3.0升級到3.1 Pro Preview。



但這“.1”的升級,進步幅度卻遠超預期。


谷歌CEO桑達爾·皮查伊(Sundar Pichai)指出,新模型在處理“超級復雜任務”上表現突出,比如復雜概念可視化、數據整合為單一視圖,或是將創(chuàng)意項目落地。



姚順宇也在X平臺發(fā)文力挺Gemini 3.1 Pro Preview,盛贊:


“Gemini不僅是一款優(yōu)秀模型,更出色的模型正以不可阻擋之勢而來?!?/strong>



值得注意的是,約一周前谷歌推出了針對科學、研究、工程等復雜開放式問題的“專用推理模式”Gemini 3 Deep Think,這是姚順宇從Anthropic跳槽至谷歌DeepMind后參與的首個項目。如今的Gemini 3.1 Pro Preview與Gemini 3 Deep Think聯系緊密,官方稱其“直接基于Gemini 3 Deep Think的經驗和技術構建”,相當于將Deep Think的核心推理提升技術“下放”到更廣泛可用的Pro模型中。


01


Gemini 3.1 Pro Preview的核心能力


既然新模型的優(yōu)勢在于處理“超級復雜”任務,谷歌官方博文重點展示了以下幾類應用場景:


其一,通過簡單提示詞生成高質量SVG動畫。


前代模型雖也具備此功能,但3.1 Pro的進步十分顯著。例如提示“生成SVG動畫,展現變色龍靜坐在樹枝上,眼睛隨鼠標光標移動”,Gemini 3 Pro生成的動畫背景單一、變色龍形象呆板,甚至出現一側兩只眼睛的錯誤;而3.1 Pro的作品擁有深綠色叢林背景,變色龍帶有黃色斑紋與圓點裝飾,眼睛立體、腿部姿勢自然。



再如提示“生成滑動切換開關SVG,鼠標懸停太陽圖標時變?yōu)榘l(fā)光月亮,背景從明亮平滑漸變至黑暗,采用簡潔扁平UI風格”,Gemini 3 Pro的圖標僅為缺角圓形,以黃白區(qū)分晝夜;3.1 Pro則呈現黃日白云與月牙繁星的絲滑切換,效果更精致。



簡言之,Gemini 3 Pro的動畫效果曾被調侃為“學了三年動畫”的水平,而3.1 Pro的SVG動畫已達到可直接使用的程度。



其二,構建工程級系統(tǒng)。


Gemini 3.1 Pro能依據復雜自然語言指令,生成融合3D渲染、實時太陽星歷計算、API異步拉取與物理光效的完整交互系統(tǒng),而非簡單演示頁面。例如用戶指令生成高保真可交互3D國際空間站軌道追蹤器,模型輸出了采用高分辨率Blue Marble紋理貼圖的精細3D地球模型。



其三,生成交互式創(chuàng)意系統(tǒng)。


谷歌展示了3.1 Pro編寫的復雜3D椋鳥群舞模擬,不僅生成視覺代碼,還構建了沉浸式體驗——用戶可通過手部追蹤操控鳥群,同時聆聽隨鳥群運動變化的生成式配樂,為研究人員與設計師提供了原型化感官豐富界面的有力工具。



其四,將文學主題轉化為可運行代碼。


這是普通人最易感知其強大的能力。當要求為艾米莉·勃朗特《呼嘯山莊》打造現代個人作品集網站時,模型并非簡單總結文本,而是基于小說氛圍與情緒推理,設計出簡潔且具當代感的界面,捕捉主人公精神內核。這種抽象推理能力的價值不言而喻。



02


性能究竟有多強?


新模型的性能提升在測試數據中得到充分體現。谷歌官方顯示,Gemini 3.1 Pro在ARC-AGI-2基準測試(評估模型解決全新邏輯模式的能力)中驗證得分達77.1%,推理性能較3 Pro提升超一倍。



此外,在GPQA Diamond(科學知識測試)中得分94.3%,智能體類基準MCP Atlas得分69.2%,真實網絡瀏覽與信息整合能力基準BrowseComp得分85.9%,均超過Anthropic的Sonnet 4.6、Opus 4.6及OpenAI的GPT-5.2與GPT-5.3-Codex。其在ARC抽象推理和BrowseComp搜索任務上的優(yōu)勢,顯示出明顯的智能體傾向,而非單純知識模型。


第三方評測機構也指出,Gemini 3.1 Pro在Artificial Analysis Intelligence Index的10項評測中領先6項,較3 Pro在推理與知識、代碼能力及降低幻覺方面進步顯著。



同時,3.1 Pro Preview保持較高token效率:運行完整Artificial Analysis Intelligence Index約需5700萬token(僅比3 Pro多100萬),低于Opus 4.6(max)和GPT-5.2(xhigh)等前沿模型。結合更低的單token定價,其成本優(yōu)勢明顯——運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,雖約為開源模型GLM-5的兩倍,但綜合性能仍具競爭力。


03


能力翻倍,價格不變


谷歌官方API定價顯示,Gemini 3 Pro與3.1 Pro Preview收費結構一致:小于200k tokens時,每百萬token輸入約2美元、輸出4美元;大于200k tokens時,輸入4美元、輸出18美元。上下文緩存方面,按提示詞規(guī)模每百萬token收0.20至0.40美元,另加每小時每百萬token4.50美元存儲費。


這一定價與上一代3 Pro持平,較Anthropic Opus系列(輸入/輸出單價約5美元/25美元)更具優(yōu)勢。結合其突出的模型能力,性價比十分可觀。目前該版本為“預覽版”,正式版即將推出,“.1”的迭代也暗示這只是谷歌的“小試牛刀”。


當前,開發(fā)者可在AI Studio、Gemini API、Gemini CLI、Google Antigravity及Android Studio使用3.1 Pro;企業(yè)用戶可通過Vertex AI和Gemini Enterprise使用;普通用戶在Gemini應用和NotebookLM(僅限Pro和Ultra訂閱用戶)也能體驗。


社區(qū)中已有不少開發(fā)者上手實踐,產出諸多驚艷成果:有人用3.1 Pro生成可交互3D機械級汽車懸架系統(tǒng)模擬器,整合機械工程建模、物理邏輯與3D可視化;有人制作“捉鬼獵人走過鬧鬼房子”的循環(huán)動畫,感嘆“Gemini所言非虛”。




谷歌此次迭代雖版本號變化微小,卻大幅提升了推理與代碼能力,且定價穩(wěn)定。社區(qū)的實踐熱情也印證了其能力與實用性。AI行業(yè)競爭已進入“性價比”新階段,企業(yè)與開發(fā)者更關注token的投入產出比。谷歌這一步不僅鞏固了自身地位,也將競爭推向更注重效率的方向。接下來,Anthropic、OpenAI等競爭對手將如何應對,值得期待。


本文來自微信公眾號“字母AI”,作者:小金牙,36氪經授權發(fā)布。


本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com