欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

谷歌推“科研合伙人”模型Gemini 3 Deep Think,月費約1800元,物理奧賽金牌級推理能力

02-14 06:30
谷歌Gemini 3 Deep Think正式發(fā)布,推理能力大幅升級,專為科研與工程任務(wù)打造。

2月13日,谷歌推出了Gemini 3 Deep Think推理增強版本,這款“推理模式”產(chǎn)品聚焦科學(xué)研究與工程應(yīng)用場景,致力于拓寬智能系統(tǒng)在復(fù)雜任務(wù)中的能力范疇。


該版本在Gemini 3架構(gòu)的基礎(chǔ)上優(yōu)化了推理機制,新增“推理時計算”(Inference-time Compute)功能,能在處理復(fù)雜邏輯與系統(tǒng)級問題時開展多步驟推演,同時提升結(jié)構(gòu)一致性驗證及工程任務(wù)求解的精準(zhǔn)度。


由于Deep Think運行時需調(diào)用大量后臺算力資源,谷歌制定了差異化付費規(guī)則:


針對追求高效產(chǎn)出的個人專業(yè)用戶,Deep Think被納入最高級別的Google AI Ultra計劃。訂閱用戶每月需支付249.99美元(約合人民幣1800元),即可享受無限次深度推理權(quán)限、30TB超大存儲空間以及最高優(yōu)先級的算力響應(yīng)服務(wù)。


面向開發(fā)者與企業(yè)的API接入則采用按量計費模式:輸入百萬tokens收費2美元,輸出百萬tokens收費12美元。


01 智力基準(zhǔn):從算法奧賽到前沿物理領(lǐng)域全面領(lǐng)先


Gemini 3 Deep Think的技術(shù)原型曾在2025年7月的國際數(shù)學(xué)奧林匹克競賽(IMO 2025)中嶄露頭角。


當(dāng)時,該原型在4.5小時的規(guī)定時間內(nèi),僅通過純自然語言推理就完成了6道高難度題目中的5道,獲得35分,達到金牌選手水平。與以往需將題目轉(zhuǎn)化為計算機代碼的AI不同,Deep Think證明了AI可像人類數(shù)學(xué)家一樣,直接通過邏輯推演攻克頂級數(shù)學(xué)難題。



此次正式發(fā)布的Gemini 3 Deep Think推理增強版本,在延續(xù)頂尖推理能力的基礎(chǔ)上,進一步實現(xiàn)了跨學(xué)科應(yīng)用拓展:


在Codeforces競技編程平臺上,該模型取得3455 Elo的評分,躋身“Legendary Grandmaster”等級。這一評分表明其在復(fù)雜算法設(shè)計與高難度問題求解方面,已處于全球頂尖選手行列。


在被視為通用人工智能(AGI)檢驗標(biāo)準(zhǔn)的ARC-AGI-2測試中,Deep Think在無網(wǎng)絡(luò)環(huán)境下獲得84.6%的創(chuàng)紀(jì)錄成績,證明其已擺脫對語料庫的單純依賴,具備真正的少樣本抽象歸納與邏輯發(fā)現(xiàn)能力。


面對更高難度的跨學(xué)科挑戰(zhàn),Deep Think在人類最終考試(Humanity's Last Exam, HLE)(48.4%)與CMT Benchmark(50.5%)中也表現(xiàn)優(yōu)異。


無論是深奧的跨學(xué)科悖論還是高階物理推演,該模型都展現(xiàn)出極強的結(jié)構(gòu)一致性與邏輯韌性。


這些亮眼數(shù)據(jù)背后,是Gemini 3 Deep Think推理模式的根本性轉(zhuǎn)變。


與傳統(tǒng)模型“即時生成”的機制不同,Deep Think引入“推理時計算”模式。在輸出結(jié)果前,它會在內(nèi)部構(gòu)建并模擬多種解題路徑,進行實時一致性自檢。一旦發(fā)現(xiàn)前提沖突或邏輯斷層,系統(tǒng)會立即回溯邏輯并重組推演鏈條。


這種“慢思考”機制,標(biāo)志著AI已從“對話工具”升級為“科研合伙人”,能為嚴(yán)謹(jǐn)?shù)目茖W(xué)研究與復(fù)雜工程任務(wù)提供更具確定性的智力支持。


02 官方演示:推理模式覆蓋科研與工程全流程


谷歌通過多項演示展示了Deep Think在科研與工程領(lǐng)域的實際應(yīng)用價值。



數(shù)學(xué)家Carbone借助Deep Think審閱專業(yè)數(shù)學(xué)論文


在科研場景中,羅格斯大學(xué)數(shù)學(xué)家Lisa Carbone使用Deep Think審閱一篇高度專業(yè)的數(shù)學(xué)論文。


Carbone的研究聚焦高能物理領(lǐng)域,旨在探索連接愛因斯坦引力理論與量子力學(xué)的數(shù)學(xué)結(jié)構(gòu)。在這個訓(xùn)練數(shù)據(jù)稀缺的領(lǐng)域,Deep Think發(fā)現(xiàn)了一處細微的邏輯缺陷,而這一問題此前未被同行評審察覺。該模型能將跨文檔信息整合到統(tǒng)一推理網(wǎng)絡(luò)中,對公式與結(jié)論進行一致性判斷,并生成標(biāo)注及分析報告供研究者參考。


這意味著AI正從“對話工具”逐步轉(zhuǎn)變?yōu)椤翱蒲泻匣锶恕?,并通過Aletheia(谷歌內(nèi)部用于數(shù)學(xué)探索的專業(yè)智能體架構(gòu))等系統(tǒng),實現(xiàn)從輔助檢索到自主邏輯發(fā)現(xiàn)的跨越。



杜克大學(xué)研究人員利用Deep Think優(yōu)化復(fù)雜晶體生長制造方法


在杜克大學(xué),Wang Lab團隊借助Deep Think優(yōu)化復(fù)雜晶體生長的制造方法,以助力潛在半導(dǎo)體材料的研發(fā)。Deep Think設(shè)計出一套可生長厚度超100微米薄膜的實驗方案,達到了以往方法難以實現(xiàn)的精準(zhǔn)目標(biāo),為材料研發(fā)提供了高效可行的實驗路徑。



工程應(yīng)用領(lǐng)域中,科學(xué)家用Deep Think加速物理組件設(shè)計


在工程應(yīng)用場景下,谷歌Platforms and Devices部門研發(fā)負(fù)責(zé)人、前Liftware CEO Anupam Pthak使用Deep Think加速物理組件設(shè)計。用戶上傳復(fù)雜機械結(jié)構(gòu)的手繪草圖后,模型能自動識別空間拓?fù)潢P(guān)系、幾何約束及關(guān)鍵尺寸,并生成可執(zhí)行的建模腳本,支持OpenSCAD與Python格式。


整個過程涵蓋幾何關(guān)系解析、尺寸推算、連接關(guān)系建模及最終輸出文件生成。在官方演示中,生成的腳本直接驅(qū)動3D打印設(shè)備,輸出符合設(shè)計要求的實物模型。


此外,Deep Think在多文件系統(tǒng)級代碼分析中也表現(xiàn)出色。模型可識別變量引用關(guān)系、函數(shù)調(diào)用依賴及潛在邊界條件問題,并提供可操作的修改建議。演示強調(diào),該模型能處理復(fù)雜工程項目的整體架構(gòu),為系統(tǒng)設(shè)計與代碼驗證提供可靠參考。


官方演示的亮點在于跨場景統(tǒng)一應(yīng)用:無論是科研論文分析、材料實驗設(shè)計、工程建模,還是復(fù)雜代碼系統(tǒng)驗證,Deep Think都能通過同一條推理鏈條完成邏輯推演與結(jié)果輸出,為科研和工程任務(wù)提供一套高效、統(tǒng)一的智能工具。


03 API與行業(yè)集成:科研與工業(yè)領(lǐng)域深度接入


隨著Deep Think發(fā)布,Gemini API早期訪問計劃(Early Access Program,EAP)同步啟動。企業(yè)與科研機構(gòu)可將該模型接入內(nèi)部數(shù)據(jù)庫,用于電路邏輯一致性檢查、數(shù)學(xué)推導(dǎo)輔助驗證、實驗數(shù)據(jù)結(jié)構(gòu)分析及軟件系統(tǒng)邊界條件排查。


谷歌表示,將優(yōu)先支持能源建模、新材料研發(fā)和生物醫(yī)藥領(lǐng)域的科研與工業(yè)團隊。


谷歌官方尚未公布完整開放時間表及后續(xù)功能擴展計劃,但通過早期訪問計劃,相關(guān)團隊將能率先體驗Deep Think在復(fù)雜科研和工程項目中的推理能力。


(特約編譯無忌對本文亦有貢獻)


本文來自“騰訊科技”,作者:蘇揚,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com