欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

Claude緩存策略引發(fā)爭(zhēng)議:關(guān)閉遙測(cè)致性能驟降,開發(fā)者集體聲討

4分鐘前
從緩存時(shí)長(zhǎng)大幅縮短到使用成本飆升,Claude的性能表現(xiàn)接連下滑。Anthropic解釋稱這并非刻意懲罰,而是架構(gòu)設(shè)計(jì)耦合所致,但實(shí)際數(shù)據(jù)顯示:2月高效緩存讓用戶體驗(yàn)良好,3月策略回退后用戶成本顯著增加。這場(chǎng)隱私保護(hù)與性能體驗(yàn)的博弈中,用戶是否成了最終的受損方?

4月13日,一條推文在開發(fā)者群體中迅速發(fā)酵。


開發(fā)者Can Vardar發(fā)文質(zhì)疑:


Claude Code會(huì)因?yàn)殛P(guān)閉遙測(cè)而“懲罰”用戶嗎?


關(guān)閉遙測(cè)后,Anthropic將緩存時(shí)長(zhǎng)從1小時(shí)縮減至5分鐘,隱私保護(hù)竟要付出12倍的性能代價(jià)……這是真的嗎?




該推文轉(zhuǎn)發(fā)量很快突破萬(wàn)次。


這并非技術(shù)漏洞,而是Anthropic以隱私換取性能的隱性規(guī)則。


你以為關(guān)閉數(shù)據(jù)收集只是保護(hù)個(gè)人信息?


事實(shí)是,Claude Code會(huì)直接影響長(zhǎng)上下文會(huì)話體驗(yàn)。Pro用戶原本5小時(shí)的使用時(shí)長(zhǎng)僅剩2條提示詞額度,月付200美元的Max訂閱者1.5小時(shí)就會(huì)耗盡額度。



這種情況令人匪夷所思。


Claude性能持續(xù)下滑!


從緩存縮短到成本激增


實(shí)際情況清晰可見。


開發(fā)者發(fā)現(xiàn),只要在環(huán)境變量中添加DISABLE_TELEMETRY=1,Claude Code的提示詞緩存生存時(shí)間(TTL)就會(huì)從1小時(shí)驟減至5分鐘。


數(shù)據(jù)顯示,緩存時(shí)長(zhǎng)直接縮短了12倍。


在GitHub上,Claude Code用戶分享的日志顯示:開啟遙測(cè)時(shí),ephemeral_1h_input_tokens輕松超過(guò)3萬(wàn);關(guān)閉遙測(cè)后,1小時(shí)緩存數(shù)據(jù)直接歸零,全部使用5分鐘緩存。同一段代碼的緩存未命中率飆升12倍。



緩存對(duì)長(zhǎng)上下文會(huì)話至關(guān)重要。


當(dāng)啟用提示詞緩存發(fā)送請(qǐng)求時(shí),系統(tǒng)會(huì)先檢查:從指定緩存分隔點(diǎn)往前的提示詞開頭部分,是否在最近請(qǐng)求中已被存儲(chǔ)。


如果命中緩存,直接調(diào)用現(xiàn)成版本,時(shí)間和成本大幅降低。


未命中的話,就需要完整處理整個(gè)提示詞,在生成回復(fù)時(shí)將開頭部分存入緩存。


緩存一旦過(guò)期,系統(tǒng)就得重新處理,寫入成本是讀取成本的12.5倍。5分鐘的TTL意味著用戶稍作停頓(比如思考思路、泡咖啡),回來(lái)就需要重新處理,成本驟增。


更嚴(yán)重的問(wèn)題還在后面。


另一位開發(fā)者Sean Swanson提供了更詳實(shí)的證據(jù)。


他分析了2026年1月11日至4月11日的119,866次API調(diào)用日志,清晰展示了緩存策略的變化:


2月,1小時(shí)TTL全面應(yīng)用,緩存浪費(fèi)率僅1.1%;


3月6日左右,系統(tǒng)悄然回退到5分鐘TTL,浪費(fèi)率飆升至25.9%


結(jié)果是,同一會(huì)話中cache_create操作頻率暴增5-12倍。



cache_create寫入成本更高,5分鐘緩存寫入成本是基礎(chǔ)輸入的1.25倍,1小時(shí)緩存是2倍,但頻繁重建導(dǎo)致總token消耗大幅增加。



Pro用戶抱怨:以前一天能輕松用完額度,現(xiàn)在1.5小時(shí)就耗盡了。Max計(jì)劃每月200美元,修兩個(gè)bug、寫個(gè)計(jì)劃就把額度用完了。




企業(yè)團(tuán)隊(duì)面臨的問(wèn)題更嚴(yán)重。


Hacker News上有用戶表示,3月底后Claude性能“肉眼可見地下降”,長(zhǎng)會(huì)話頻繁卡頓,token額度消耗極快。



4月13日,國(guó)外科技媒體直接發(fā)文《Anthropic在削弱Claude嗎?》。



Anthropic的回應(yīng)


并非懲罰,而是技術(shù)架構(gòu)問(wèn)題


面對(duì)大量質(zhì)疑,Anthropic的兩位關(guān)鍵人物作出回應(yīng)。


Claude Code的創(chuàng)造者Boris Cherny在回帖中承認(rèn),關(guān)閉遙測(cè)會(huì)導(dǎo)致實(shí)驗(yàn)性優(yōu)化失效,使緩存回退到5分鐘默認(rèn)值。


簡(jiǎn)單來(lái)說(shuō),機(jī)制是這樣的:


1小時(shí)緩存是“實(shí)驗(yàn)性”優(yōu)化,通過(guò)客戶端實(shí)驗(yàn)網(wǎng)關(guān)推送。只有開啟遙測(cè),網(wǎng)關(guān)才能獲取最新策略。



但他強(qiáng)調(diào)這并非刻意懲罰,而是架構(gòu)設(shè)計(jì)中的耦合問(wèn)題。


Cherny同時(shí)解釋了緩存策略的設(shè)計(jì)邏輯:Anthropic在后臺(tái)持續(xù)測(cè)試不同緩存策略組合,目標(biāo)是優(yōu)化整體緩存命中率、Token消耗和延遲表現(xiàn)。



關(guān)閉遙測(cè)后,客戶端會(huì)直接讀取默認(rèn)值——5分鐘。


這不是惡意行為,而是“技術(shù)副作用”。


5分鐘緩存在某些場(chǎng)景下更經(jīng)濟(jì),比如子智能體調(diào)用,這類請(qǐng)求通常是一次性的,緩存很少被重復(fù)讀取,用1小時(shí)TTL反而會(huì)浪費(fèi)2倍寫入成本。


不過(guò),他也承認(rèn):“大量技能、多個(gè)智能體或后臺(tái)自動(dòng)化任務(wù)同時(shí)運(yùn)行時(shí),Token消耗確實(shí)很大,尤其是使用大量插件時(shí)?!?/p>


受影響的用戶數(shù)量不少,Anthropic正在改進(jìn):


(a) 優(yōu)化用戶體驗(yàn),讓用戶更清楚了解情況;


(b) 更智能地截?cái)唷⒕?jiǎn)和調(diào)度非主任務(wù),避免意外的Token消耗。



Anthropic另一位工程師、Bun運(yùn)行時(shí)的創(chuàng)造者Jarred Sumner回應(yīng)了3月的TTL回退問(wèn)題。


他認(rèn)為5分鐘TTL對(duì)整體而言“更便宜而非更貴”,因?yàn)椤跋喈?dāng)一部分Claude Code請(qǐng)求是一次性調(diào)用,緩存上下文只用一次就不再訪問(wèn)”。



從技術(shù)層面看,這個(gè)解釋有一定道理,但用戶并不買賬。


問(wèn)題在于,Swanson的數(shù)據(jù)直接反駁了這一點(diǎn):2月份1小時(shí)TTL下的浪費(fèi)率僅1.1%,如果大多數(shù)請(qǐng)求真的是一次性的,2月應(yīng)該出現(xiàn)大量寫入浪費(fèi)才對(duì)。



行業(yè)深層問(wèn)題


AI的Token計(jì)價(jià)缺乏透明度


從更宏觀的角度看,這不僅僅是Anthropic一家公司的問(wèn)題。


目前,AI編碼工具的按使用量計(jì)費(fèi)完全依賴用戶信任。


開發(fā)者看不到計(jì)費(fèi)的具體過(guò)程,無(wú)法審計(jì)每個(gè)請(qǐng)求的Token用量,無(wú)法驗(yàn)證緩存狀態(tài),無(wú)法確認(rèn)應(yīng)用的定價(jià)層級(jí),也無(wú)法檢查高峰期倍數(shù)因子是否生效。



與其他開發(fā)者付費(fèi)使用的基礎(chǔ)設(shè)施相比:


  • AWS EC2:按秒計(jì)費(fèi),提供完整的實(shí)例可見性、CloudWatch指標(biāo)、賬單警報(bào)和成本分析工具
  • Stripe:按交易計(jì)費(fèi),每筆費(fèi)用都有日志記錄且可審計(jì),提供實(shí)時(shí)儀表盤
  • Vercel:按調(diào)用計(jì)費(fèi),提供函數(shù)級(jí)指標(biāo)、支出限額和自動(dòng)警報(bào)
  • Claude Code:按Token計(jì)費(fèi),無(wú)單次請(qǐng)求用量明細(xì),無(wú)緩存命中可見性,無(wú)支出警報(bào),無(wú)實(shí)時(shí)成本跟蹤

這種信息不對(duì)稱令人震驚。同價(jià)位的其他開發(fā)者工具都能讓用戶詳細(xì)了解費(fèi)用構(gòu)成,而AI編程助手只給用戶一個(gè)限額進(jìn)度條,全憑信任。


這種不對(duì)稱平時(shí)對(duì)服務(wù)提供商有利,一旦出現(xiàn)問(wèn)題,就會(huì)給用戶帶來(lái)嚴(yán)重?fù)p失。


AI計(jì)費(fèi)沒(méi)有第三方審計(jì),沒(méi)有Token用量報(bào)告的開源標(biāo)準(zhǔn),也沒(méi)有針對(duì)提示詞成本的云端分析工具。


這不是合理的計(jì)費(fèi)模式,更像是讓用戶盲目信任的冒險(xiǎn)。


參考資料:


https://x.com/icanvardar/status/2043652025339023845


https://github.com/anthropics/claude-code/issues/45381


https://x.com/bcherny/status/2043715713551212834


https://platform.claude.com/docs/en/build-with-claude/prompt-caching#pricing


https://www.theregister.com/2026/04/13/claude_code_cache_confusion/


本文來(lái)自微信公眾號(hào)“新智元”,作者:新智元,編輯:KingHZ,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com