欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

97.6%近乎滿(mǎn)分!Claude最強(qiáng)模型發(fā)布卻暫不開(kāi)放:安全風(fēng)險(xiǎn)成關(guān)鍵考量

04-10 06:39
地球最強(qiáng)AI模型,何時(shí)能為公眾所用?

昨夜,Anthropic最新推出的Claude Mythos(神話(huà))預(yù)覽版,再度引爆整個(gè)AI領(lǐng)域。


Claude Mythos預(yù)覽版被官方稱(chēng)作「迄今為止最強(qiáng)大的AI模型」,其能力達(dá)到全新層級(jí),甚至大幅超越了此前Anthropic自家的最強(qiáng)模型Claude Opus 4.6。


從目前呈現(xiàn)的數(shù)據(jù)與結(jié)果來(lái)看,這并非營(yíng)銷(xiāo)噱頭,而是真正實(shí)現(xiàn)了質(zhì)的飛躍。首先,在幾乎所有公開(kāi)基準(zhǔn)測(cè)試中,Claude Mythos預(yù)覽版均位居榜首,更令人驚嘆的是其進(jìn)步幅度:


面向軟件工程的SWE-bench Verified測(cè)試,從Opus 4.6的80.8%飆升至93.9%;SWE-bench Pro測(cè)試則從53.4%躍升至77.8%;在高難度數(shù)學(xué)推理測(cè)試USAMO 2026中,成績(jī)更是從42.3%直接提升至97.6%——近乎滿(mǎn)分。



可以說(shuō),它是目前全球范圍內(nèi)最強(qiáng)大的AI模型。


這還只是部分「小」案例,更令人震撼的是,Anthropic在過(guò)去幾周的實(shí)際測(cè)試中發(fā)現(xiàn),Mythos預(yù)覽版能在主流操作系統(tǒng)與主流瀏覽器中自主識(shí)別出數(shù)千個(gè)高危零日漏洞(zero-day),涉及Linux內(nèi)核、OpenBSD、Firefox瀏覽器、FFmpeg等核心組件。


其中不少漏洞連人類(lèi)安全團(tuán)隊(duì)審核十幾年甚至二十年都未發(fā)現(xiàn),例如在以安全性著稱(chēng)的OpenBSD系統(tǒng)中,Mythos預(yù)覽版就找到了一個(gè)隱藏27年未被察覺(jué)的遠(yuǎn)程崩潰漏洞。Anthropic官方甚至明確表示,Mythos預(yù)覽版在網(wǎng)絡(luò)安全能力上遠(yuǎn)超其他任何AI模型。


這并非一個(gè)「更好用的Claude」,它在代碼編寫(xiě)、推理分析、網(wǎng)絡(luò)安全等方面,都達(dá)到了前所未有的自主性與深度。開(kāi)發(fā)者們本期待著「徹底解放生產(chǎn)力」,但結(jié)果卻是:


Anthropic直接關(guān)閉了公眾使用的大門(mén)。


沒(méi)錯(cuò),至少目前,Claude Mythos預(yù)覽版不對(duì)公眾開(kāi)放。根據(jù)官方說(shuō)法,Mythos預(yù)覽版目前僅用于「防御性網(wǎng)絡(luò)安全」,且只有12家合作伙伴(包括AWS、蘋(píng)果、博通、思科、CrowdStrike、Google、摩根大通、Linux基金會(huì)、微軟、英偉達(dá)、Palo Alto Networks等)以及40多個(gè)構(gòu)建或維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織,擁有其訪問(wèn)和使用權(quán)限。



這正是Anthropic同步推出的Project Glasswing(玻璃翼計(jì)劃)。Anthropic甚至提供了1億美元的額度,支持40多家額外組織使用Mythos預(yù)覽版維護(hù)開(kāi)源生態(tài)的「基礎(chǔ)架構(gòu)」。


但為何一個(gè)「最強(qiáng)模型」要如此「藏著掖著」,不向公眾開(kāi)放呢?


能力過(guò)強(qiáng),需平穩(wěn)過(guò)渡


首先需要明確的是,Claude Mythos預(yù)覽版或類(lèi)似水平的超級(jí)大模型,未來(lái)一定會(huì)向公眾開(kāi)放。Anthropic官方表述得十分直白:


「雖然我們目前沒(méi)有向公眾開(kāi)放Claude Mythos預(yù)覽版的計(jì)劃,但最終目標(biāo)是讓用戶(hù)能夠安全地大規(guī)模部署Mythos級(jí)別的模型——這不僅是為了網(wǎng)絡(luò)安全,也是為了這類(lèi)功能強(qiáng)大的模型將帶來(lái)的無(wú)數(shù)其他益處?!?/p>



正如官方博客字里行間所透露的,這個(gè)模型「過(guò)于危險(xiǎn)」。


去年年底,Google Threat Intelligence Group(GTIG)就發(fā)現(xiàn)了PromptFlux和PromptSteal兩個(gè)真實(shí)案例:它們?cè)谶\(yùn)行時(shí)連接商業(yè)大模型(如Gemini API)時(shí),會(huì)動(dòng)態(tài)生成惡意腳本、實(shí)時(shí)混淆自身代碼,還能根據(jù)目標(biāo)環(huán)境「現(xiàn)場(chǎng)」創(chuàng)建新功能,完全繞過(guò)傳統(tǒng)簽名檢測(cè)發(fā)起攻擊。


這并非個(gè)例。根據(jù)市場(chǎng)研究機(jī)構(gòu)SQmagazine的報(bào)告,全球報(bào)道的AI驅(qū)動(dòng)網(wǎng)絡(luò)攻擊數(shù)量增長(zhǎng)了47%,預(yù)計(jì)超過(guò)2800萬(wàn)起。


再看Mythos預(yù)覽版,其漏洞查找能力已初露鋒芒。尤其對(duì)比此前Claude最強(qiáng)模型Opus 4.6自主發(fā)現(xiàn)并利用漏洞的成功率接近0%,Mythos預(yù)覽版的表現(xiàn)堪稱(chēng)「逆天」。


以Mozilla Firefox 147 JavaScript引擎中已修復(fù)的漏洞為例,Claude Opus 4.6在利用該漏洞時(shí)嘗試了數(shù)百次,僅成功2次;而Claude Mythos預(yù)覽版在相同測(cè)試中成功利用漏洞181次。



此外,從測(cè)試報(bào)告來(lái)看,在過(guò)去幾周的內(nèi)部紅隊(duì)測(cè)試中,Mythos預(yù)覽版展現(xiàn)出的攻擊能力已遠(yuǎn)超人類(lèi)頂尖安全專(zhuān)家。它不僅「能找漏洞」,還能自主發(fā)現(xiàn)、鏈?zhǔn)嚼脭?shù)千個(gè)高危零日漏洞。


眾所周知,黑客分為白帽與黑帽。白帽黑客發(fā)現(xiàn)安全漏洞后通常會(huì)提醒項(xiàng)目管理者,在開(kāi)源項(xiàng)目中甚至?xí)鲃?dòng)修補(bǔ);但黑帽黑客則可能利用漏洞攻擊系統(tǒng)。


Mythos預(yù)覽版兼具攻擊與防御能力,但其攻擊潛力大到令人擔(dān)憂(yōu)。一旦落入別有用心之人手中,就能瞬間構(gòu)建起AI級(jí)別的攻擊鏈。Anthropic自己也承認(rèn),這并非普通的前沿模型,其通用能力已強(qiáng)大到能將網(wǎng)絡(luò)戰(zhàn)直接推向新維度。


計(jì)算機(jī)安全領(lǐng)域的攻防戰(zhàn)向來(lái)是「魔高一丈,道高一尺」,過(guò)去兩年圍繞AI大模型的安全攻防戰(zhàn)也是行業(yè)(尤其是大廠)關(guān)注的重點(diǎn)之一。國(guó)內(nèi)的字節(jié)跳動(dòng)、螞蟻集團(tuán)等企業(yè),近兩年也舉辦過(guò)類(lèi)似的AI大模型攻防戰(zhàn),通過(guò)紅(攻擊方)、藍(lán)(防御方)對(duì)抗來(lái)發(fā)現(xiàn)并解決AI時(shí)代的安全挑戰(zhàn)。



不過(guò)Anthropic也指出,長(zhǎng)遠(yuǎn)來(lái)看,像Mythos預(yù)覽版這樣強(qiáng)大的語(yǔ)言模型更有利于「藍(lán)隊(duì)」進(jìn)行防御。但短期內(nèi),如果開(kāi)放公眾使用,Mythos預(yù)覽版很快會(huì)被攻擊者利用,以前所未有的效率攻擊當(dāng)前全球網(wǎng)絡(luò)。關(guān)鍵問(wèn)題在于,防御行為更被動(dòng),攻擊行為更主動(dòng),考慮到利益驅(qū)動(dòng),攻擊方更有動(dòng)力積極使用Mythos預(yù)覽版這類(lèi)模型。


因此,為實(shí)現(xiàn)「平穩(wěn)過(guò)渡」,Anthropic推出了「玻璃翼計(jì)劃」。


值得一提的是,該項(xiàng)目名稱(chēng)靈感來(lái)源于廣泛分布在美洲的寬紋黑脈綃蝶,因其透明翅膀常被稱(chēng)為「玻璃翼蝶」。盡管看似脆弱,但其翅膀能承載相當(dāng)于自身體重40倍的重量。



「玻璃翼計(jì)劃」的邏輯很簡(jiǎn)單:讓防御方先掌握這一「武器」,在攻擊方獲得同級(jí)別AI之前,先將漏洞全部修復(fù),并學(xué)會(huì)基于先進(jìn)AI的安全防御方法。


從這個(gè)角度看,Claude最強(qiáng)模型暫不向公眾開(kāi)放是正確的選擇。不僅如此,即使從普通Claude用戶(hù)的角度出發(fā),暫時(shí)不開(kāi)放Claude Mythos預(yù)覽版也是利大于弊。


最強(qiáng)模型不開(kāi)放,Claude反而更易用?


許多人看到Mythos預(yù)覽版不開(kāi)放,第一反應(yīng)是失望:這么強(qiáng)大的模型,為何不讓大家使用?


但如果你是普通Claude用戶(hù),或是每天依賴(lài)Claude Code編寫(xiě)代碼、開(kāi)展項(xiàng)目的開(kāi)發(fā)者,可能會(huì)發(fā)現(xiàn)一個(gè)看似反直覺(jué)的事實(shí):暫時(shí)不開(kāi)放Mythos預(yù)覽版,對(duì)我們反而更有利。


先談?wù)劷诖蠹腋惺茏蠲黠@的痛點(diǎn)。


大約從今年2月起,Claude和Claude Code迎來(lái)了「史詩(shī)級(jí)性能下滑」。Reddit的r/ClaudeCode和r/ClaudeAI板塊中,相關(guān)吐槽帖子刷屏,有人直接發(fā)帖《4.6 Regression is real!》,有人抱怨「Claude Code在過(guò)去1.5到2天里變得很笨」。



還有開(kāi)發(fā)者通過(guò)數(shù)據(jù)追蹤發(fā)現(xiàn),文件讀取次數(shù)從之前的6-7次降至僅2次左右,復(fù)雜任務(wù)中模型越來(lái)越「懶惰」,思考深度明顯變淺,經(jīng)常直接進(jìn)行「edit-first」操作而非先調(diào)研。


AMD AI總監(jiān)Stella Laurenzo甚至公開(kāi)表示,Claude Code變得「更笨、更懶」,無(wú)法信任它完成復(fù)雜工程任務(wù)。


Claude Code團(tuán)隊(duì)成員Boris在Hacker News上回復(fù)稱(chēng),承認(rèn)部分智能體(agentic)用例出現(xiàn)性能倒退,核心原因是2月引入的「redact-thinking」和Adaptive Thinking機(jī)制,讓模型自主決定思考時(shí)長(zhǎng),導(dǎo)致復(fù)雜任務(wù)的思考深度下降約67%。



類(lèi)似的抱怨在X平臺(tái)也層出不窮,開(kāi)發(fā)者吐槽Claude Code已退化成需要全程監(jiān)督的「實(shí)習(xí)生」。


為何會(huì)出現(xiàn)這種情況?


超大參數(shù)模型訓(xùn)練的規(guī)律擺在眼前:每當(dāng)大廠全力研發(fā)下一代「最強(qiáng)模型」時(shí),都需要海量算力。Gemini在推出3.0/3.1版本前,2.5 Pro就多次被開(kāi)發(fā)者吐槽靜默更新后性能下降,出現(xiàn)長(zhǎng)上下文內(nèi)容遺忘、邏輯任務(wù)失敗率上升等問(wèn)題;GPT-5發(fā)布前,4o也出現(xiàn)過(guò)輸出變短、變懶、復(fù)雜指令機(jī)械化等「降智」反饋。


算力是有限的,訓(xùn)練Mythos這類(lèi)全新層級(jí)的模型成本極高,只能從現(xiàn)有資源中「擠」出空間,通過(guò)動(dòng)態(tài)負(fù)載均衡、自適應(yīng)算力降低甚至輕度優(yōu)化等方式實(shí)現(xiàn),但結(jié)果就是用戶(hù)感受到的「變笨、變懶」。


此外,Claude Code用戶(hù)量增長(zhǎng)遠(yuǎn)超預(yù)期,基礎(chǔ)設(shè)施多次面臨壓力,而Mythos預(yù)覽版(內(nèi)部代號(hào)Capybara)的訓(xùn)練和測(cè)試又需優(yōu)先占用頂級(jí)GPU。因此,當(dāng)Mythos預(yù)覽版發(fā)布卻不向公眾開(kāi)放時(shí),無(wú)需擔(dān)心算力被進(jìn)一步稀釋?zhuān)瑢?dǎo)致Claude或Claude Code的質(zhì)量繼續(xù)下滑。


對(duì)普通Claude用戶(hù)而言,使用體驗(yàn)反而會(huì)更穩(wěn)定。



另一方面,Anthropic通過(guò)「玻璃翼計(jì)劃」讓Mythos幫助大廠和開(kāi)源項(xiàng)目修復(fù)漏洞,這些漏洞修復(fù)后最終也會(huì)間接惠及所有用戶(hù)。


等Anthropic將風(fēng)險(xiǎn)控制和基礎(chǔ)設(shè)施準(zhǔn)備得更充分,再安全地大規(guī)模部署Mythos級(jí)模型時(shí),普通用戶(hù)才能獲得真正穩(wěn)定、強(qiáng)大且不會(huì)頻繁「降智」的使用體驗(yàn),而非現(xiàn)在急于開(kāi)放后,大家一同承受算力擠占的陣痛。


寫(xiě)在最后


Claude Mythos預(yù)覽版的出現(xiàn),將一個(gè)殘酷卻現(xiàn)實(shí)的問(wèn)題擺在所有人面前:AI越強(qiáng)大,風(fēng)險(xiǎn)就越真實(shí)。


當(dāng)最強(qiáng)模型的攻擊能力已遠(yuǎn)超當(dāng)前防御體系時(shí),Anthropic選擇「暫不開(kāi)放」并非保守,而是為整個(gè)行業(yè)爭(zhēng)取時(shí)間,讓防守方先加固基礎(chǔ),讓普通用戶(hù)先擁有相對(duì)穩(wěn)定的Claude體驗(yàn),而非一同卷入算力擠占和安全失控的混亂。


對(duì)大多數(shù)人而言,這或許就是當(dāng)下最好的安排。


本文來(lái)自微信公眾號(hào)「雷科技」,作者:雷科技,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com