欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<li id="ecy2w"><object id="ecy2w"></object></li>

<fieldset id="ecy2w"><tbody id="ecy2w"></tbody></fieldset>

<menu id="ecy2w"><object id="ecy2w"></object></menu>

<option id="ecy2w"></option>

<fieldset id="ecy2w"></fieldset>

<fieldset id="ecy2w"></fieldset>

97.6%近乎滿(mǎn)分！Claude最強(qiáng)模型發(fā)布卻暫不開(kāi)放：安全風(fēng)險(xiǎn)成關(guān)鍵考量

04-10 06:39

地球最強(qiáng)AI模型，何時(shí)能為公眾所用？

昨夜，Anthropic最新推出的Claude Mythos（神話(huà)）預(yù)覽版，再度引爆整個(gè)AI領(lǐng)域。

Claude Mythos預(yù)覽版被官方稱(chēng)作「迄今為止最強(qiáng)大的AI模型」，其能力達(dá)到全新層級(jí)，甚至大幅超越了此前Anthropic自家的最強(qiáng)模型Claude Opus 4.6。

從目前呈現(xiàn)的數(shù)據(jù)與結(jié)果來(lái)看，這并非營(yíng)銷(xiāo)噱頭，而是真正實(shí)現(xiàn)了質(zhì)的飛躍。首先，在幾乎所有公開(kāi)基準(zhǔn)測(cè)試中，Claude Mythos預(yù)覽版均位居榜首，更令人驚嘆的是其進(jìn)步幅度：

面向軟件工程的SWE-bench Verified測(cè)試，從Opus 4.6的80.8%飆升至93.9%；SWE-bench Pro測(cè)試則從53.4%躍升至77.8%；在高難度數(shù)學(xué)推理測(cè)試USAMO 2026中，成績(jī)更是從42.3%直接提升至97.6%——近乎滿(mǎn)分。

可以說(shuō)，它是目前全球范圍內(nèi)最強(qiáng)大的AI模型。

這還只是部分「小」案例，更令人震撼的是，Anthropic在過(guò)去幾周的實(shí)際測(cè)試中發(fā)現(xiàn)，Mythos預(yù)覽版能在主流操作系統(tǒng)與主流瀏覽器中自主識(shí)別出數(shù)千個(gè)高危零日漏洞（zero-day），涉及Linux內(nèi)核、OpenBSD、Firefox瀏覽器、FFmpeg等核心組件。

其中不少漏洞連人類(lèi)安全團(tuán)隊(duì)審核十幾年甚至二十年都未發(fā)現(xiàn)，例如在以安全性著稱(chēng)的OpenBSD系統(tǒng)中，Mythos預(yù)覽版就找到了一個(gè)隱藏27年未被察覺(jué)的遠(yuǎn)程崩潰漏洞。Anthropic官方甚至明確表示，Mythos預(yù)覽版在網(wǎng)絡(luò)安全能力上遠(yuǎn)超其他任何AI模型。

這并非一個(gè)「更好用的Claude」，它在代碼編寫(xiě)、推理分析、網(wǎng)絡(luò)安全等方面，都達(dá)到了前所未有的自主性與深度。開(kāi)發(fā)者們本期待著「徹底解放生產(chǎn)力」，但結(jié)果卻是：

Anthropic直接關(guān)閉了公眾使用的大門(mén)。

沒(méi)錯(cuò)，至少目前，Claude Mythos預(yù)覽版不對(duì)公眾開(kāi)放。根據(jù)官方說(shuō)法，Mythos預(yù)覽版目前僅用于「防御性網(wǎng)絡(luò)安全」，且只有12家合作伙伴（包括AWS、蘋(píng)果、博通、思科、CrowdStrike、Google、摩根大通、Linux基金會(huì)、微軟、英偉達(dá)、Palo Alto Networks等）以及40多個(gè)構(gòu)建或維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織，擁有其訪問(wèn)和使用權(quán)限。

這正是Anthropic同步推出的Project Glasswing（玻璃翼計(jì)劃）。Anthropic甚至提供了1億美元的額度，支持40多家額外組織使用Mythos預(yù)覽版維護(hù)開(kāi)源生態(tài)的「基礎(chǔ)架構(gòu)」。

但為何一個(gè)「最強(qiáng)模型」要如此「藏著掖著」，不向公眾開(kāi)放呢？

能力過(guò)強(qiáng)，需平穩(wěn)過(guò)渡

首先需要明確的是，Claude Mythos預(yù)覽版或類(lèi)似水平的超級(jí)大模型，未來(lái)一定會(huì)向公眾開(kāi)放。Anthropic官方表述得十分直白：

「雖然我們目前沒(méi)有向公眾開(kāi)放Claude Mythos預(yù)覽版的計(jì)劃，但最終目標(biāo)是讓用戶(hù)能夠安全地大規(guī)模部署Mythos級(jí)別的模型——這不僅是為了網(wǎng)絡(luò)安全，也是為了這類(lèi)功能強(qiáng)大的模型將帶來(lái)的無(wú)數(shù)其他益處?！?/p>

正如官方博客字里行間所透露的，這個(gè)模型「過(guò)于危險(xiǎn)」。

去年年底，Google Threat Intelligence Group（GTIG）就發(fā)現(xiàn)了PromptFlux和PromptSteal兩個(gè)真實(shí)案例：它們?cè)谶\(yùn)行時(shí)連接商業(yè)大模型（如Gemini API）時(shí)，會(huì)動(dòng)態(tài)生成惡意腳本、實(shí)時(shí)混淆自身代碼，還能根據(jù)目標(biāo)環(huán)境「現(xiàn)場(chǎng)」創(chuàng)建新功能，完全繞過(guò)傳統(tǒng)簽名檢測(cè)發(fā)起攻擊。

這并非個(gè)例。根據(jù)市場(chǎng)研究機(jī)構(gòu)SQmagazine的報(bào)告，全球報(bào)道的AI驅(qū)動(dòng)網(wǎng)絡(luò)攻擊數(shù)量增長(zhǎng)了47%，預(yù)計(jì)超過(guò)2800萬(wàn)起。

再看Mythos預(yù)覽版，其漏洞查找能力已初露鋒芒。尤其對(duì)比此前Claude最強(qiáng)模型Opus 4.6自主發(fā)現(xiàn)并利用漏洞的成功率接近0%，Mythos預(yù)覽版的表現(xiàn)堪稱(chēng)「逆天」。

以Mozilla Firefox 147 JavaScript引擎中已修復(fù)的漏洞為例，Claude Opus 4.6在利用該漏洞時(shí)嘗試了數(shù)百次，僅成功2次；而Claude Mythos預(yù)覽版在相同測(cè)試中成功利用漏洞181次。

此外，從測(cè)試報(bào)告來(lái)看，在過(guò)去幾周的內(nèi)部紅隊(duì)測(cè)試中，Mythos預(yù)覽版展現(xiàn)出的攻擊能力已遠(yuǎn)超人類(lèi)頂尖安全專(zhuān)家。它不僅「能找漏洞」，還能自主發(fā)現(xiàn)、鏈?zhǔn)嚼脭?shù)千個(gè)高危零日漏洞。

眾所周知，黑客分為白帽與黑帽。白帽黑客發(fā)現(xiàn)安全漏洞后通常會(huì)提醒項(xiàng)目管理者，在開(kāi)源項(xiàng)目中甚至?xí)鲃?dòng)修補(bǔ)；但黑帽黑客則可能利用漏洞攻擊系統(tǒng)。

Mythos預(yù)覽版兼具攻擊與防御能力，但其攻擊潛力大到令人擔(dān)憂(yōu)。一旦落入別有用心之人手中，就能瞬間構(gòu)建起AI級(jí)別的攻擊鏈。Anthropic自己也承認(rèn)，這并非普通的前沿模型，其通用能力已強(qiáng)大到能將網(wǎng)絡(luò)戰(zhàn)直接推向新維度。

計(jì)算機(jī)安全領(lǐng)域的攻防戰(zhàn)向來(lái)是「魔高一丈，道高一尺」，過(guò)去兩年圍繞AI大模型的安全攻防戰(zhàn)也是行業(yè)（尤其是大廠）關(guān)注的重點(diǎn)之一。國(guó)內(nèi)的字節(jié)跳動(dòng)、螞蟻集團(tuán)等企業(yè)，近兩年也舉辦過(guò)類(lèi)似的AI大模型攻防戰(zhàn)，通過(guò)紅（攻擊方）、藍(lán)（防御方）對(duì)抗來(lái)發(fā)現(xiàn)并解決AI時(shí)代的安全挑戰(zhàn)。

不過(guò)Anthropic也指出，長(zhǎng)遠(yuǎn)來(lái)看，像Mythos預(yù)覽版這樣強(qiáng)大的語(yǔ)言模型更有利于「藍(lán)隊(duì)」進(jìn)行防御。但短期內(nèi)，如果開(kāi)放公眾使用，Mythos預(yù)覽版很快會(huì)被攻擊者利用，以前所未有的效率攻擊當(dāng)前全球網(wǎng)絡(luò)。關(guān)鍵問(wèn)題在于，防御行為更被動(dòng)，攻擊行為更主動(dòng)，考慮到利益驅(qū)動(dòng)，攻擊方更有動(dòng)力積極使用Mythos預(yù)覽版這類(lèi)模型。

因此，為實(shí)現(xiàn)「平穩(wěn)過(guò)渡」，Anthropic推出了「玻璃翼計(jì)劃」。

值得一提的是，該項(xiàng)目名稱(chēng)靈感來(lái)源于廣泛分布在美洲的寬紋黑脈綃蝶，因其透明翅膀常被稱(chēng)為「玻璃翼蝶」。盡管看似脆弱，但其翅膀能承載相當(dāng)于自身體重40倍的重量。

「玻璃翼計(jì)劃」的邏輯很簡(jiǎn)單：讓防御方先掌握這一「武器」，在攻擊方獲得同級(jí)別AI之前，先將漏洞全部修復(fù)，并學(xué)會(huì)基于先進(jìn)AI的安全防御方法。

從這個(gè)角度看，Claude最強(qiáng)模型暫不向公眾開(kāi)放是正確的選擇。不僅如此，即使從普通Claude用戶(hù)的角度出發(fā)，暫時(shí)不開(kāi)放Claude Mythos預(yù)覽版也是利大于弊。

最強(qiáng)模型不開(kāi)放，Claude反而更易用？

許多人看到Mythos預(yù)覽版不開(kāi)放，第一反應(yīng)是失望：這么強(qiáng)大的模型，為何不讓大家使用？

但如果你是普通Claude用戶(hù)，或是每天依賴(lài)Claude Code編寫(xiě)代碼、開(kāi)展項(xiàng)目的開(kāi)發(fā)者，可能會(huì)發(fā)現(xiàn)一個(gè)看似反直覺(jué)的事實(shí)：暫時(shí)不開(kāi)放Mythos預(yù)覽版，對(duì)我們反而更有利。

先談?wù)劷诖蠹腋惺茏蠲黠@的痛點(diǎn)。

大約從今年2月起，Claude和Claude Code迎來(lái)了「史詩(shī)級(jí)性能下滑」。Reddit的r/ClaudeCode和r/ClaudeAI板塊中，相關(guān)吐槽帖子刷屏，有人直接發(fā)帖《4.6 Regression is real!》，有人抱怨「Claude Code在過(guò)去1.5到2天里變得很笨」。

還有開(kāi)發(fā)者通過(guò)數(shù)據(jù)追蹤發(fā)現(xiàn)，文件讀取次數(shù)從之前的6-7次降至僅2次左右，復(fù)雜任務(wù)中模型越來(lái)越「懶惰」，思考深度明顯變淺，經(jīng)常直接進(jìn)行「edit-first」操作而非先調(diào)研。

AMD AI總監(jiān)Stella Laurenzo甚至公開(kāi)表示，Claude Code變得「更笨、更懶」，無(wú)法信任它完成復(fù)雜工程任務(wù)。

Claude Code團(tuán)隊(duì)成員Boris在Hacker News上回復(fù)稱(chēng)，承認(rèn)部分智能體（agentic）用例出現(xiàn)性能倒退，核心原因是2月引入的「redact-thinking」和Adaptive Thinking機(jī)制，讓模型自主決定思考時(shí)長(zhǎng)，導(dǎo)致復(fù)雜任務(wù)的思考深度下降約67%。

類(lèi)似的抱怨在X平臺(tái)也層出不窮，開(kāi)發(fā)者吐槽Claude Code已退化成需要全程監(jiān)督的「實(shí)習(xí)生」。

為何會(huì)出現(xiàn)這種情況？

超大參數(shù)模型訓(xùn)練的規(guī)律擺在眼前：每當(dāng)大廠全力研發(fā)下一代「最強(qiáng)模型」時(shí)，都需要海量算力。Gemini在推出3.0/3.1版本前，2.5 Pro就多次被開(kāi)發(fā)者吐槽靜默更新后性能下降，出現(xiàn)長(zhǎng)上下文內(nèi)容遺忘、邏輯任務(wù)失敗率上升等問(wèn)題；GPT-5發(fā)布前，4o也出現(xiàn)過(guò)輸出變短、變懶、復(fù)雜指令機(jī)械化等「降智」反饋。

算力是有限的，訓(xùn)練Mythos這類(lèi)全新層級(jí)的模型成本極高，只能從現(xiàn)有資源中「擠」出空間，通過(guò)動(dòng)態(tài)負(fù)載均衡、自適應(yīng)算力降低甚至輕度優(yōu)化等方式實(shí)現(xiàn)，但結(jié)果就是用戶(hù)感受到的「變笨、變懶」。

此外，Claude Code用戶(hù)量增長(zhǎng)遠(yuǎn)超預(yù)期，基礎(chǔ)設(shè)施多次面臨壓力，而Mythos預(yù)覽版（內(nèi)部代號(hào)Capybara）的訓(xùn)練和測(cè)試又需優(yōu)先占用頂級(jí)GPU。因此，當(dāng)Mythos預(yù)覽版發(fā)布卻不向公眾開(kāi)放時(shí)，無(wú)需擔(dān)心算力被進(jìn)一步稀釋?zhuān)瑢?dǎo)致Claude或Claude Code的質(zhì)量繼續(xù)下滑。

對(duì)普通Claude用戶(hù)而言，使用體驗(yàn)反而會(huì)更穩(wěn)定。

另一方面，Anthropic通過(guò)「玻璃翼計(jì)劃」讓Mythos幫助大廠和開(kāi)源項(xiàng)目修復(fù)漏洞，這些漏洞修復(fù)后最終也會(huì)間接惠及所有用戶(hù)。

等Anthropic將風(fēng)險(xiǎn)控制和基礎(chǔ)設(shè)施準(zhǔn)備得更充分，再安全地大規(guī)模部署Mythos級(jí)模型時(shí)，普通用戶(hù)才能獲得真正穩(wěn)定、強(qiáng)大且不會(huì)頻繁「降智」的使用體驗(yàn)，而非現(xiàn)在急于開(kāi)放后，大家一同承受算力擠占的陣痛。

寫(xiě)在最后

Claude Mythos預(yù)覽版的出現(xiàn)，將一個(gè)殘酷卻現(xiàn)實(shí)的問(wèn)題擺在所有人面前：AI越強(qiáng)大，風(fēng)險(xiǎn)就越真實(shí)。

當(dāng)最強(qiáng)模型的攻擊能力已遠(yuǎn)超當(dāng)前防御體系時(shí)，Anthropic選擇「暫不開(kāi)放」并非保守，而是為整個(gè)行業(yè)爭(zhēng)取時(shí)間，讓防守方先加固基礎(chǔ)，讓普通用戶(hù)先擁有相對(duì)穩(wěn)定的Claude體驗(yàn)，而非一同卷入算力擠占和安全失控的混亂。

對(duì)大多數(shù)人而言，這或許就是當(dāng)下最好的安排。

本文來(lái)自微信公眾號(hào)「雷科技」，作者：雷科技，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

胖東來(lái)緣何未布局全國(guó)？

關(guān)注前額葉健康？健身人先從守護(hù)睡眠開(kāi)始

注意力稀缺時(shí)代，購(gòu)物中心如何重塑運(yùn)營(yíng)邏輯？

耀速科技完成2億人民幣融資，推動(dòng)“AI+器官芯片”融入新藥研發(fā)

西南將添全國(guó)第三座貨運(yùn)機(jī)場(chǎng)，內(nèi)江機(jī)場(chǎng)定位明確

項(xiàng)目推薦

康小虎 · 健康小屋

康老板 · 氧療堂

<ul id="2koc4"><tr id="2koc4"></tr></ul>