欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

純Python開源Hermes首次擊敗OpenAI Codex,解釋型語言實現(xiàn)逆襲

2天前

一個完全由Python編寫的開源項目,居然打敗了OpenAI用Rust開發(fā)的王牌產(chǎn)品!最終對決比分6比5,Hermes用實打?qū)嵉墓こ虄?yōu)化上演逆襲,一直被詬病性能偏弱的解釋型語言,這次終于實現(xiàn)了突破。


一個純Python開源項目擊潰OpenAI王牌產(chǎn)品的消息,今天直接刷爆了整個科技圈:


在針對真實場景命令行任務(wù)的11項基準(zhǔn)測試中,Hermes Agent以6:5的比分,成功超越了OpenAI的Codex。



在這場對比測試中,Hermes Agent展現(xiàn)出了非常驚艷的底層優(yōu)化能力。


通過一系列精準(zhǔn)的工程調(diào)整,它成功把項目啟動時間從原本的701ms壓縮到了258ms。



更讓業(yè)內(nèi)意外的是,Hermes全程采用純Python開發(fā),而Codex則是性能優(yōu)勢顯著的Rust編寫。


這一次,Python贏了Rust!


在編程領(lǐng)域,這絕對算得上是一次顛覆性的突破。




三項工程優(yōu)化,砍掉63%啟動耗時


在這次優(yōu)化之前,Hermes對Codex的戰(zhàn)績還是5勝6負(fù)處于下風(fēng)。


這次的逆轉(zhuǎn)既沒有更換大模型,也沒有堆砌額外算力,完全依靠三個純工程層面的優(yōu)化實現(xiàn),每一步都精準(zhǔn)命中了性能瓶頸。



我們來看看這些優(yōu)化具體是怎么實現(xiàn)的:


第一步:新增Bitwarden磁盤緩存


優(yōu)化前Hermes每次啟動,都需要調(diào)用Bitwarden Secrets Manager的API拉取憑據(jù),單次就需要消耗380毫秒。


之前的緩存只存在于進(jìn)程內(nèi)部,哪怕連續(xù)兩次執(zhí)行hermes chat -q命令,第二次啟動仍然需要重新拉取憑據(jù),造成了大量不必要的耗時。


開發(fā)團(tuán)隊給出的解決方案,就是新增二級磁盤緩存。


緩存文件權(quán)限設(shè)置為最安全的0600,存放在/cache/bws_cache.json路徑下,默認(rèn)有效期為300秒。


另外,訪問令牌本身不會寫入磁盤,同樣默認(rèn)300秒有效期,過期后才會重新拉取。


這一步優(yōu)化,直接砍掉了380毫秒的啟動耗時。



第二步:模型目錄延遲加載


hermes_cli.models._PROVIDER_MODELS是一個存儲了所有AI服務(wù)商模型信息的大型字典。


優(yōu)化前這個字典會在模塊加載階段就提前導(dǎo)入,直接占用了約55毫秒的啟動時間。


但實際上,只有和model_flow相關(guān)的處理函數(shù)才會用到這個字典。


開發(fā)團(tuán)隊借助PEP 562規(guī)范的模塊級getattr實現(xiàn)了懶加載,只有當(dāng)真正需要訪問模型目錄的時候,才會執(zhí)行導(dǎo)入操作。


這一步,又節(jié)省了55毫秒。


第三步:配置文件讀取去重


優(yōu)化前main.py文件開頭,重復(fù)讀取了兩次config.yaml配置文件。


第一次調(diào)用yaml.safe_load是為了實現(xiàn)密鑰脫敏橋接,第二次調(diào)用完整的load_config()方法(包含深度合并邏輯)僅僅是為了讀取一個布爾值。


開發(fā)團(tuán)隊把兩次讀取合并為一次,又省下了17毫秒。


三項優(yōu)化加起來,Hermes的啟動時間從701ms大幅降到258ms,降幅高達(dá)63%。


不得不說,這就是實打?qū)嵉墓こ虄?yōu)化美學(xué):依靠性能分析找到瓶頸,再一步步把冗余開銷全部砍掉。



最終6:5,Hermes成功實現(xiàn)翻盤

測試結(jié)果不會說謊,優(yōu)化前后的表現(xiàn)對比非常明顯。


優(yōu)化之前,Hermes對陣Codex的總戰(zhàn)績是5勝6負(fù):單輪任務(wù)被Codex壓制,多輪任務(wù)雖然略占優(yōu)勢,但優(yōu)勢并不突出。


完成優(yōu)化之后,整個局面徹底反轉(zhuǎn)。


單輪任務(wù)(共8項):Hermes的中位框架開銷降到了和Codex持平,甚至部分場景還要更低。原本被Codex拉開差距的啟動劣勢,被徹底抹平。


多輪任務(wù)(共3項):優(yōu)化前Hermes在5輪對話的總開銷上就已經(jīng)領(lǐng)先,優(yōu)化完成后優(yōu)勢進(jìn)一步擴(kuò)大。



最終總比分定格在6:5,Hermes成功實現(xiàn)反超。


這意味著,一個純Python編寫的開源項目,在框架開銷——這個最考驗底層開發(fā)功力的維度,擊敗了用Rust編寫、背靠萬億市值科技公司的閉源產(chǎn)品。



Python憑什么贏下Rust?


這件事最反常識的點就是:Python怎么可能贏過Rust?


長期以來,Python在性能討論中幾乎一直處于弱勢:解釋型語言、GIL全局鎖、動態(tài)類型開銷……種種標(biāo)簽都讓大家默認(rèn)它性能不如編譯型語言。


當(dāng)初OpenAI選擇用Rust開發(fā)Codex CLI的時候,業(yè)內(nèi)所有人都覺得順理成章——Rust本身就是為高性能設(shè)計的。



但Hermes這次逆襲,恰恰說明了一個關(guān)鍵結(jié)論:在AI Agent賽道,框架層面的架構(gòu)選擇,比編程語言本身的原始性能更加重要。


開發(fā)者netrunner的評論一針見血:「Python在多輪任務(wù)上打贏Rust,本質(zhì)上是架構(gòu)決策的勝利,而不是語言速度的勝利」,他還補(bǔ)充道「Codex很可能在上下文處理環(huán)節(jié),做了過度工程化的設(shè)計」。



有不少人提出疑問:「為什么不把Hermes也遷移到Rust?那樣不是更快嗎?」


Hermes聯(lián)合創(chuàng)始人兼首席科學(xué)家Teknium給出的回答非常直接:「那樣就沒法快速編輯代碼,也沒辦法做實時改進(jìn)和迭代了」。


換句話說,Python的核心優(yōu)勢本身就不是速度,而是靈活易用、快速迭代。



對于需要持續(xù)進(jìn)化、能從每次交互中學(xué)習(xí)的AI Agent來說,對開發(fā)者友好的特性和快速迭代能力,本身就是最大的優(yōu)勢。


上線三月星標(biāo)破16萬,硬剛巨頭的開源項目


Hermes Agent的增長速度本身就足夠驚人:從2026年2月25日上線到現(xiàn)在,僅僅過去三個月,GitHub星標(biāo)就已經(jīng)突破16.7萬。


日活Token消耗量達(dá)到3530億,接近同類項目OpenClaw的兩倍。可以說,它是2026年增長速度最快的開源Agent框架,沒有之一。



GitHub開源地址:https://github.com/nousresearch/hermes-agent


Hermes的核心優(yōu)勢,是一套閉環(huán)自主學(xué)習(xí)架構(gòu):


每次完成復(fù)雜任務(wù)之后,Agent都會自動把解決方案提煉成可以重復(fù)使用的Skill技能。下次遇到同類任務(wù),直接調(diào)用已有技能即可,不需要從頭開始推理。


NousResearch內(nèi)部基準(zhǔn)測試顯示:當(dāng)Hermes積累了20個以上自主生成的技能后,完成同類任務(wù)的速度比全新實例快40%。



更驚艷的是v0.12版本新增的自治Curator模塊:這是一個在后臺自動運(yùn)行的Agent,會定期對技能庫進(jìn)行評分、修剪和合并。


換句話說,Hermes不光能自主學(xué)習(xí)技能,還能自己整理歸納學(xué)到的內(nèi)容,不斷優(yōu)化自身技能庫。


編程語言不是天花板,架構(gòu)才是


Python贏了Rust這件事,看起來像是編程語言之間的逆襲爽文,但它背后揭示的道理其實更加深刻。


在AI Agent領(lǐng)域,底層編程語言的性能差異,其實已經(jīng)變得越來越不重要。


Hermes這次優(yōu)化總共擠出了443毫秒,已經(jīng)是框架層面能做到的極限了。而一次大語言模型調(diào)用的延遲,動輒就是幾百毫秒甚至好幾秒。


這意味著,在通向通用人工智能的路上,真正的核心競爭從來都不是「用什么語言寫」,而是「怎么讓Agent越用越聰明」。


而Hermes這次用純Python干翻Rust開發(fā)的Codex,恰恰證明了一件事:在Agent進(jìn)化的賽道上,開放、可編輯、可快速迭代的架構(gòu),比「跑得更快」更接近通用人工智能的本質(zhì)需求。


Rust確實是一款性能優(yōu)秀的工具,但通用人工智能需要的,從來都不只是一把更快的刀。


參考資料:


https://x.com/Teknium/status/2058885472513065471?s=20


https://github.com/NousResearch/hermes-agent/pull/31968


本文來自微信公眾號“新智元”,作者:ASI啟示錄,編輯:桃子 David,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com