AI按需智能:實(shí)習(xí)生執(zhí)行+總監(jiān)指導(dǎo)的新競(jìng)爭(zhēng)維度
真的想隔空喊Anthropic別再卷了,他們又雙叒叕推出新功能了:

Advisor策略已納入Claude的API工具庫(kù),當(dāng)Sonnet或Haiku在運(yùn)行中遇到難題時(shí),會(huì)向Opus咨詢解決方案,隨后繼續(xù)運(yùn)行,所有操作都在一次API請(qǐng)求內(nèi)完成。
說(shuō)實(shí)話,這種做法在開發(fā)者社區(qū)里一點(diǎn)都不新鮮,很多(預(yù)算有限的)開發(fā)者在自己的工作流中就是這么操作的:用低成本模型處理簡(jiǎn)單任務(wù),僅在需要深度推理時(shí)才調(diào)用高價(jià)模型,只是需要手動(dòng)切換模型。如今Anthropic將這個(gè)「經(jīng)濟(jì)型」工作流產(chǎn)品化,變成了一行代碼就能啟用的官方功能。
「實(shí)習(xí)生」執(zhí)行任務(wù),「總監(jiān)」提供指導(dǎo)
在常規(guī)的AI agent架構(gòu)中,常見的做法是讓最強(qiáng)的模型擔(dān)任指揮,將任務(wù)拆解成小塊,分配給低成本模型執(zhí)行。強(qiáng)模型在上層管理,弱模型在下層執(zhí)行,呈現(xiàn)自上而下的結(jié)構(gòu)。
而Anthropic的advisor策略卻反其道而行之,讓弱模型作為主力,強(qiáng)模型充當(dāng)顧問(wèn)。

具體來(lái)說(shuō),Sonnet(或更便宜的Haiku)作為「執(zhí)行者」全程處理任務(wù)——調(diào)用工具、讀取結(jié)果、迭代操作。當(dāng)它遇到自己不確定的決策點(diǎn)時(shí),比如代碼架構(gòu)的選擇,用方案A還是方案B?它不會(huì)盲目猜測(cè),而是主動(dòng)發(fā)起一次「舉手提問(wèn)」的tool call,把當(dāng)前上下文和具體問(wèn)題發(fā)送給Opus。
Opus作為「顧問(wèn)」查看后,不會(huì)直接參與執(zhí)行,不編寫代碼也不修改邏輯,僅返回簡(jiǎn)短建議(通常400-700個(gè)token):「選擇方案A,原因是XYZ,注意Z部分?!筍onnet收到建議后繼續(xù)執(zhí)行。整個(gè)過(guò)程對(duì)用戶不可見。

換個(gè)通俗的比喻:這就像實(shí)習(xí)生工作時(shí)遇到難題,舉手向總監(jiān)請(qǐng)教??偙O(jiān)指明方向后,實(shí)習(xí)生繼續(xù)工作。總監(jiān)按總監(jiān)的薪資標(biāo)準(zhǔn)計(jì)費(fèi)(Opus價(jià)格),但只說(shuō)了幾句話,所以費(fèi)用不高;實(shí)習(xí)生全程工作(Sonnet/Haiku價(jià)格),但單價(jià)較低,因此總成本很低。
Anthropic自身的測(cè)試數(shù)據(jù)顯示:
- Sonnet+Opus advisor在SWE-bench Multilingual上的表現(xiàn)比單獨(dú)使用Sonnet高2.7個(gè)百分點(diǎn),同時(shí)成本降低11.9%;- Haiku+Opus advisor在BrowseComp上得分41.2%,是單獨(dú)使用Haiku(19.7%)的兩倍多,但成本僅為Sonnet的15%;- Bolt的CEO評(píng)價(jià):「復(fù)雜任務(wù)的架構(gòu)決策明顯更優(yōu),簡(jiǎn)單任務(wù)完全沒有額外開銷」;- Eve Legal的機(jī)器學(xué)習(xí)工程師表示:「在結(jié)構(gòu)化文檔提取任務(wù)中,Haiku通過(guò)advisor動(dòng)態(tài)提升智能,達(dá)到前沿模型質(zhì)量,成本降低5倍」。

即使是實(shí)習(xí)生也不能太笨拙
這個(gè)模式有一個(gè)容易被忽視的前提:實(shí)習(xí)生必須足夠聰明,能準(zhǔn)確判斷自己何時(shí)能力不足。
這本質(zhì)上是advisor功能的核心支撐,是整個(gè)功能能運(yùn)作的前提。一個(gè)真正能力差的模型,根本不知道自己不懂,還可能自信地選擇錯(cuò)誤方案,無(wú)知者無(wú)畏。這種情況下不會(huì)觸發(fā)advisor調(diào)用,比直接用差模型全程運(yùn)行更危險(xiǎn):由于對(duì)話僅在模型間進(jìn)行,不會(huì)推送給用戶,你以為Opus掌控全局無(wú)需擔(dān)心,實(shí)際上它從未被調(diào)用過(guò)。
這就是為什么Anthropic的advisor工具目前只支持Sonnet和Haiku作為執(zhí)行者,而非任意模型。這兩個(gè)模型在Claude家族內(nèi)部經(jīng)過(guò)充分訓(xùn)練,知道何時(shí)該求助、何時(shí)能獨(dú)立完成。

這個(gè)策略的好處很明顯:降低用戶門檻,無(wú)需懂工程就能采用最佳實(shí)踐。但它也有一個(gè)微妙的副作用:省了錢,但沒有完全省到位。
當(dāng)開發(fā)者自己搭建模型路由時(shí),可以自由組合任何公司的模型:用DeepSeek做篩選,用GPT-5做推理,用Gemini做摘要,哪家便宜用哪家。這是一種開放、完全自主設(shè)計(jì)、跨平臺(tái)的省錢策略。
但advisor工具僅支持Claude家族內(nèi)部的模型,執(zhí)行者必須是「嫡系」的Sonnet或Haiku,顧問(wèn)必須是Opus。不能用GPT當(dāng)顧問(wèn),也不能用Gemini當(dāng)執(zhí)行者。
理論上任何模型都可以通過(guò)tool call調(diào)用另一個(gè)模型,Anthropic這樣做完全出于產(chǎn)品策略。
既然思路并非原創(chuàng),自己動(dòng)手做一個(gè)類似的,組合不同模型可行嗎?Advisor工具是模型間有交互的場(chǎng)景,假設(shè)希望DeepSeek作為主力,遇到難題時(shí)把上下文發(fā)給Claude咨詢建議,Claude返回后DeepSeek繼續(xù)執(zhí)行,可能會(huì)出現(xiàn)幾個(gè)問(wèn)題:
- 輸出格式:Claude返回建議時(shí)的結(jié)構(gòu)化方式(比如用XML標(biāo)簽包裹計(jì)劃步驟),DeepSeek不一定能準(zhǔn)確解析和遵循。嫡系模型之間的格式是對(duì)齊的。
-「語(yǔ)言」差異:每個(gè)模型有自己偏好的思考和表達(dá)方式。Opus給Sonnet的建議,措辭和邏輯結(jié)構(gòu)是Sonnet最容易理解和執(zhí)行的。Claude給DeepSeek的建議,DeepSeek能讀懂,但執(zhí)行精準(zhǔn)度會(huì)打折扣——就像英語(yǔ)母語(yǔ)者給英語(yǔ)很好但非母語(yǔ)的人下指令,大部分情況沒問(wèn)題,但在細(xì)微之處會(huì)有理解偏差。
- tool use格式不兼容:不同廠商的function calling格式有細(xì)微差異。Claude的tool use和DeepSeek的tool use在JSON schema、參數(shù)傳遞方式上不完全相同??鐝S商構(gòu)建agent鏈路時(shí),中間的格式轉(zhuǎn)換是個(gè)難題。
使用官方原生功能自然最好,但一旦工作流加入advisor,就意味著被鎖定在Claude生態(tài)中。這是一個(gè)精妙的商業(yè)設(shè)計(jì),Anthropic沒有阻止用戶省錢,顯然還幫用戶省錢,但它把「省錢」這個(gè)行為本身用作加固平臺(tái)黏性的手段。
那性價(jià)比真的高嗎?畢竟,DeepSeek再怎么說(shuō)花的也是人民幣,Claude燒的可是美金啊。
社區(qū)先實(shí)現(xiàn),Anthropic只是加了個(gè)按鈕
Advisor的思路并不新鮮,更像是Anthropic把已存在的實(shí)踐包裝成官方產(chǎn)品。
開發(fā)者社區(qū)中最常見的省錢技巧就是「模型路由」(model routing):用低成本模型處理簡(jiǎn)單任務(wù)(分類、摘要、格式化),僅在需要深度推理時(shí)調(diào)用高價(jià)模型,有大量開源項(xiàng)目實(shí)現(xiàn)這種模式。

現(xiàn)在我們常用的很多功能,都曾是開發(fā)者社區(qū)手動(dòng)組裝的:如今各家AI幾乎標(biāo)配的「Project」項(xiàng)目空間,曾是開發(fā)者在API層面手動(dòng)拼接system prompt+文檔上下文,所有內(nèi)容圍繞一個(gè)項(xiàng)目;Artifacts的雛形也是開發(fā)者用Claude/GPT/Gemini生成HTML/React組件,然后手動(dòng)粘貼到預(yù)覽器運(yùn)行,現(xiàn)在這個(gè)功能也能在各家終端實(shí)現(xiàn)。
最近的一次是Anthropic推出Dispatch(手機(jī)遙控桌面)和Channels(IM集成),這就是Claude自己的OpenClaw,隨后卻轉(zhuǎn)頭「卸磨殺驢」,禁用了OpenClaw。

從產(chǎn)品策略來(lái)看,剛發(fā)布的Advisor策略反映出在算力緊張的情況下,性價(jià)比不僅是用戶的追求,也是企業(yè)的痛點(diǎn),是AI定價(jià)模式的一大趨勢(shì)。
常規(guī)的AI定價(jià)很簡(jiǎn)單,選一個(gè)模型,按token付費(fèi):要頂級(jí)質(zhì)量就用Opus,要便宜就用Haiku,選定后就是固定價(jià)格。本質(zhì)上是在賣「算力時(shí)間」,即購(gòu)買了多少token的處理能力。
Advisor模式更靈活,不再選擇固定的智能級(jí)別,而是讓系統(tǒng)根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)分配智能,廠商也能更靈活地分配算力資源。
對(duì)最終用戶而言,這是好事:不用為僅需2分難度的任務(wù),支付需要深度推理的100%Opus價(jià)格。但對(duì)AI企業(yè)來(lái)說(shuō),這也意味著新的競(jìng)爭(zhēng)維度,不再只是單一的參數(shù)、價(jià)格比拼,而是轉(zhuǎn)向智能性價(jià)比的競(jìng)爭(zhēng)。
本文來(lái)自微信公眾號(hào)“APPSO”,作者:Selina,編輯:李超凡,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






