欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<rt id="7can4"></rt>

谷歌推“科研合伙人”模型Gemini 3 Deep Think，月費約1800元，物理奧賽金牌級推理能力

02-14 06:30

谷歌Gemini 3 Deep Think正式發(fā)布，推理能力大幅升級，專為科研與工程任務(wù)打造。

2月13日，谷歌推出了Gemini 3 Deep Think推理增強版本，這款“推理模式”產(chǎn)品聚焦科學(xué)研究與工程應(yīng)用場景，致力于拓寬智能系統(tǒng)在復(fù)雜任務(wù)中的能力范疇。

該版本在Gemini 3架構(gòu)的基礎(chǔ)上優(yōu)化了推理機制，新增“推理時計算”（Inference-time Compute）功能，能在處理復(fù)雜邏輯與系統(tǒng)級問題時開展多步驟推演，同時提升結(jié)構(gòu)一致性驗證及工程任務(wù)求解的精準(zhǔn)度。

由于Deep Think運行時需調(diào)用大量后臺算力資源，谷歌制定了差異化付費規(guī)則：

針對追求高效產(chǎn)出的個人專業(yè)用戶，Deep Think被納入最高級別的Google AI Ultra計劃。訂閱用戶每月需支付249.99美元（約合人民幣1800元），即可享受無限次深度推理權(quán)限、30TB超大存儲空間以及最高優(yōu)先級的算力響應(yīng)服務(wù)。

面向開發(fā)者與企業(yè)的API接入則采用按量計費模式：輸入百萬tokens收費2美元，輸出百萬tokens收費12美元。

01 智力基準(zhǔn)：從算法奧賽到前沿物理領(lǐng)域全面領(lǐng)先

Gemini 3 Deep Think的技術(shù)原型曾在2025年7月的國際數(shù)學(xué)奧林匹克競賽（IMO 2025）中嶄露頭角。

當(dāng)時，該原型在4.5小時的規(guī)定時間內(nèi)，僅通過純自然語言推理就完成了6道高難度題目中的5道，獲得35分，達到金牌選手水平。與以往需將題目轉(zhuǎn)化為計算機代碼的AI不同，Deep Think證明了AI可像人類數(shù)學(xué)家一樣，直接通過邏輯推演攻克頂級數(shù)學(xué)難題。

此次正式發(fā)布的Gemini 3 Deep Think推理增強版本，在延續(xù)頂尖推理能力的基礎(chǔ)上，進一步實現(xiàn)了跨學(xué)科應(yīng)用拓展：

在Codeforces競技編程平臺上，該模型取得3455 Elo的評分，躋身“Legendary Grandmaster”等級。這一評分表明其在復(fù)雜算法設(shè)計與高難度問題求解方面，已處于全球頂尖選手行列。

在被視為通用人工智能（AGI）檢驗標(biāo)準(zhǔn)的ARC-AGI-2測試中，Deep Think在無網(wǎng)絡(luò)環(huán)境下獲得84.6%的創(chuàng)紀(jì)錄成績，證明其已擺脫對語料庫的單純依賴，具備真正的少樣本抽象歸納與邏輯發(fā)現(xiàn)能力。

面對更高難度的跨學(xué)科挑戰(zhàn)，Deep Think在人類最終考試（Humanity's Last Exam, HLE）（48.4%）與CMT Benchmark（50.5%）中也表現(xiàn)優(yōu)異。

無論是深奧的跨學(xué)科悖論還是高階物理推演，該模型都展現(xiàn)出極強的結(jié)構(gòu)一致性與邏輯韌性。

這些亮眼數(shù)據(jù)背后，是Gemini 3 Deep Think推理模式的根本性轉(zhuǎn)變。

與傳統(tǒng)模型“即時生成”的機制不同，Deep Think引入“推理時計算”模式。在輸出結(jié)果前，它會在內(nèi)部構(gòu)建并模擬多種解題路徑，進行實時一致性自檢。一旦發(fā)現(xiàn)前提沖突或邏輯斷層，系統(tǒng)會立即回溯邏輯并重組推演鏈條。

這種“慢思考”機制，標(biāo)志著AI已從“對話工具”升級為“科研合伙人”，能為嚴(yán)謹(jǐn)?shù)目茖W(xué)研究與復(fù)雜工程任務(wù)提供更具確定性的智力支持。

02 官方演示：推理模式覆蓋科研與工程全流程

谷歌通過多項演示展示了Deep Think在科研與工程領(lǐng)域的實際應(yīng)用價值。

數(shù)學(xué)家Carbone借助Deep Think審閱專業(yè)數(shù)學(xué)論文

在科研場景中，羅格斯大學(xué)數(shù)學(xué)家Lisa Carbone使用Deep Think審閱一篇高度專業(yè)的數(shù)學(xué)論文。

Carbone的研究聚焦高能物理領(lǐng)域，旨在探索連接愛因斯坦引力理論與量子力學(xué)的數(shù)學(xué)結(jié)構(gòu)。在這個訓(xùn)練數(shù)據(jù)稀缺的領(lǐng)域，Deep Think發(fā)現(xiàn)了一處細微的邏輯缺陷，而這一問題此前未被同行評審察覺。該模型能將跨文檔信息整合到統(tǒng)一推理網(wǎng)絡(luò)中，對公式與結(jié)論進行一致性判斷，并生成標(biāo)注及分析報告供研究者參考。

這意味著AI正從“對話工具”逐步轉(zhuǎn)變?yōu)椤翱蒲泻匣锶恕?，并通過Aletheia（谷歌內(nèi)部用于數(shù)學(xué)探索的專業(yè)智能體架構(gòu)）等系統(tǒng)，實現(xiàn)從輔助檢索到自主邏輯發(fā)現(xiàn)的跨越。

杜克大學(xué)研究人員利用Deep Think優(yōu)化復(fù)雜晶體生長制造方法

在杜克大學(xué)，Wang Lab團隊借助Deep Think優(yōu)化復(fù)雜晶體生長的制造方法，以助力潛在半導(dǎo)體材料的研發(fā)。Deep Think設(shè)計出一套可生長厚度超100微米薄膜的實驗方案，達到了以往方法難以實現(xiàn)的精準(zhǔn)目標(biāo)，為材料研發(fā)提供了高效可行的實驗路徑。

工程應(yīng)用領(lǐng)域中，科學(xué)家用Deep Think加速物理組件設(shè)計

在工程應(yīng)用場景下，谷歌Platforms and Devices部門研發(fā)負(fù)責(zé)人、前Liftware CEO Anupam Pthak使用Deep Think加速物理組件設(shè)計。用戶上傳復(fù)雜機械結(jié)構(gòu)的手繪草圖后，模型能自動識別空間拓?fù)潢P(guān)系、幾何約束及關(guān)鍵尺寸，并生成可執(zhí)行的建模腳本，支持OpenSCAD與Python格式。

整個過程涵蓋幾何關(guān)系解析、尺寸推算、連接關(guān)系建模及最終輸出文件生成。在官方演示中，生成的腳本直接驅(qū)動3D打印設(shè)備，輸出符合設(shè)計要求的實物模型。

此外，Deep Think在多文件系統(tǒng)級代碼分析中也表現(xiàn)出色。模型可識別變量引用關(guān)系、函數(shù)調(diào)用依賴及潛在邊界條件問題，并提供可操作的修改建議。演示強調(diào)，該模型能處理復(fù)雜工程項目的整體架構(gòu)，為系統(tǒng)設(shè)計與代碼驗證提供可靠參考。

官方演示的亮點在于跨場景統(tǒng)一應(yīng)用：無論是科研論文分析、材料實驗設(shè)計、工程建模，還是復(fù)雜代碼系統(tǒng)驗證，Deep Think都能通過同一條推理鏈條完成邏輯推演與結(jié)果輸出，為科研和工程任務(wù)提供一套高效、統(tǒng)一的智能工具。

03 API與行業(yè)集成：科研與工業(yè)領(lǐng)域深度接入

隨著Deep Think發(fā)布，Gemini API早期訪問計劃（Early Access Program，EAP）同步啟動。企業(yè)與科研機構(gòu)可將該模型接入內(nèi)部數(shù)據(jù)庫，用于電路邏輯一致性檢查、數(shù)學(xué)推導(dǎo)輔助驗證、實驗數(shù)據(jù)結(jié)構(gòu)分析及軟件系統(tǒng)邊界條件排查。

谷歌表示，將優(yōu)先支持能源建模、新材料研發(fā)和生物醫(yī)藥領(lǐng)域的科研與工業(yè)團隊。

谷歌官方尚未公布完整開放時間表及后續(xù)功能擴展計劃，但通過早期訪問計劃，相關(guān)團隊將能率先體驗Deep Think在復(fù)雜科研和工程項目中的推理能力。

（特約編譯無忌對本文亦有貢獻）

本文來自“騰訊科技”，作者：蘇揚，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

短劇漫劇何時能擺脫“山寨”困局？

連虧七年終迎轉(zhuǎn)機：TVB借《新聞女王2》實現(xiàn)扭虧為盈廣告收入兩位數(shù)增長

東北與河南“霸總”老板齊發(fā)福利，累計發(fā)40億紅包引熱議

春節(jié)假期賞櫻指南：上海辰山植物園早櫻品種將次第迎來盛花期

二測PV播放破千萬，網(wǎng)易《遺忘之海》：以隨機性為核的設(shè)計巧思與待解之題

項目推薦

康小虎 · 健康小屋

康老板 · 氧療堂

<ruby id="y9mqe"><tbody id="y9mqe"><acronym id="y9mqe"></acronym></tbody></ruby>

<li id="y9mqe"></li>

<rt id="y9mqe"></rt>

<thead id="y9mqe"></thead>