欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

Token工業(yè)化競爭:成本賬本重構(gòu)下的新戰(zhàn)局

2天前

本文來自微信公眾號: 未盡研究 ,作者:未盡研究



硅谷現(xiàn)在突然開始嫌Token太貴了。



有很長一段時間,整個AI行業(yè)都沉浸在智能體會遞歸進化到通用人工智能(AGI)的樂觀情緒里。在Anthropic打造的行業(yè)敘事中,性能更強的高價Token永遠有它的存在價值。但就在過去一周,三個幾乎同時出現(xiàn)的行業(yè)信號,撕開了表層樂觀敘事下,另一個完全不同的行業(yè)現(xiàn)實。



第一個信號,微軟內(nèi)部開始大規(guī)模限制Claude Code的使用。原因很簡單:它用起來太貴了。微軟旗下負責Windows、Microsoft 365、Outlook、Teams和Surface的“體驗+設(shè)備”部門,要求必須在6月底之前停用Claude Code,把所有開發(fā)工作流遷移到微軟自家的GitHub Copilot CLI上。



但這件事很難簡單歸結(jié)為內(nèi)部產(chǎn)品和外部產(chǎn)品的競爭。據(jù)業(yè)內(nèi)消息,這次停用決策里,財務部門起到了關(guān)鍵作用。雖然開發(fā)團隊用得順手,一致反饋Claude Code能大幅提升開發(fā)生產(chǎn)力;但管預算的高管們,并沒有看到代碼規(guī)模增長,給對應軟件帶來收入暴漲——你到處都能看到AI的影子,唯獨在公司的營收報表上看不到。



更值得玩味的是,就在上個月,微軟面向外部客戶的GitHub Copilot,剛剛宣布全面改成按量計費模式。智能體在持續(xù)不斷消耗Token,哪怕是微軟面對自己的外部客戶,也不想白白被“薅羊毛”。對內(nèi)“停用”是節(jié)流,對客戶“調(diào)價”是開源,本質(zhì)上都是為了重新對齊成本和價值的賬本。在智能體主導的Token消耗浪潮面前,哪怕是微軟這樣資金雄厚的科技巨頭,也已經(jīng)感受到了壓力,AI成本已經(jīng)正式進入企業(yè)的預算約束范圍。



現(xiàn)在行業(yè)里有兩個明確趨勢:一方面,前沿大模型的單位Token價格正在持續(xù)上漲。硅谷三大巨頭都在試探API客戶的價格承受力。谷歌最新發(fā)布的Gemini-3.5-Flash,價格明顯上漲,是同類產(chǎn)品Gemini-3.1-Flash-Lite的6倍,已經(jīng)接近Gemini-3.1-Pro的價格;OpenAI的GPT-5.5價格是GPT-5.4的兩倍;如果考慮新分詞器的影響,Claude-Opus-4.7的價格大約是Opus-4.6的1.46倍。



另一方面,智能體及其配套框架正在重塑Token經(jīng)濟學。智能體追求更高性能、更快響應速度,這本身就意味著更高的單位Token成本;而且Token越來越多地承擔系統(tǒng)控制功能,代價就是額外的調(diào)度復雜度、Token消耗和延遲累積,顯著推高了整體消耗。在用戶開始輸入提示詞之前,智能體就會提前預加載很多內(nèi)容,現(xiàn)在智能體單次任務的Token負載中位數(shù),已經(jīng)來到了10萬Token的量級。





現(xiàn)在,所有大模型廠商都在向智能體廠商轉(zhuǎn)型。OpenAI聯(lián)合創(chuàng)始人Greg Brockman就認為,單單一個模型,已經(jīng)不能構(gòu)成完整的產(chǎn)品了。未來的Token經(jīng)濟學,就會在這個轉(zhuǎn)型趨勢下展開。



第二個信號,是DeepSeek宣布V4-Pro永久降價75%。這不是短期促銷,不是新用戶補貼,也不是互聯(lián)網(wǎng)行業(yè)常見的燒錢換規(guī)模。這次降價意味著DeepSeek已經(jīng)跑通了某種結(jié)構(gòu)性的成本優(yōu)勢。硅谷風投YCombinator的合伙人非常好奇,模型優(yōu)化和芯片協(xié)同,在這個成本優(yōu)勢里起到了多大作用。



根據(jù)Artficial Intellgence的統(tǒng)計,運行指定測評任務時,DeepSeek V4 Pro的成本僅約為Gemini-3.1-Pro-Preview的三分之一,GPT-5.5的十二分之一,Claude-Opus-4.7的十九分之一。



今年年初,DeepSeek在DualPath論文中披露,在Agentic AI場景下,它的KV緩存命中率可以高達95%。壓縮和管理KV緩存,不只是降低單位Token成本的關(guān)鍵,還把AI的成本函數(shù)從“和上下文長度線性相關(guān)”重構(gòu)為“僅和新增決策相關(guān)”。這就讓智能體可以在長時間、多輪交互中持續(xù)運行,不會因為歷史上下文膨脹導致成本失控,也把AI從“被調(diào)用的工具”變成了“持續(xù)運行的進程”。



DeepSeek的深度推理創(chuàng)新,用DualPath為智能體壓榨帶寬|筆記



2026/02/27完整閱讀>




這也會影響模型下游的產(chǎn)品設(shè)計。雖然DeepSeek的模型性能,仍然比硅谷頂尖模型落后半年左右,但它依然在快速搶占市場。在OpenRouter平臺上,調(diào)用V4-Flash模型的請求一直在增長,甚至已經(jīng)出現(xiàn)了基于V4的“原生”智能體產(chǎn)品。Reasonix就專門針對DeepSeek的緩存機制,打造了一套智能體框架,核心目標就是“節(jié)省Token成本”?,F(xiàn)在DeepSeek還在招募框架工程師,未來它很可能成為這個新領(lǐng)域的“價格屠夫”。





第三個信號,是華為對“韜(τ)定律”的探索和落地。在這個技術(shù)框架下,當晶體管密度提升遇到瓶頸時,華為開始從底層器件、電路、芯片到系統(tǒng)層面,同步壓縮數(shù)據(jù)傳輸?shù)臅r間和能耗。華為已經(jīng)圍繞超節(jié)點,同步推進統(tǒng)一總線UB-Mesh、Hi-ONE近封裝光學、背面供電以及近存計算等技術(shù),還在嘗試把鯤鵬和昇騰做“邏輯折疊”,在單位算力的Token吞吐量上實現(xiàn)“時間擴展”。



如何理解華為的韜定律與時間擴展定律



2026/05/26完整閱讀>




是邏輯折疊,而不是簡單堆疊。這意味著它和當前行業(yè)常見的2.5D封裝不同,是在Z軸方向、單元層面完成邏輯和計算拓撲的重構(gòu)。不管是半導體專家還是金融分析師,美國都非常關(guān)注華為這次戰(zhàn)略方向選擇。Bernstein直接評價這是又一個“DeepSeek時刻”。





在近期IEEE中國的直播活動中,華為進一步介紹,鯤鵬950是第一代折疊技術(shù)打造的“超級CPU”。在其他條件基本不變的情況下,鯤鵬950通過重新組織CPU核和互聯(lián)結(jié)構(gòu),讓關(guān)鍵路徑長度明顯縮短。垂直折疊之后,微架構(gòu)投影面積減少了大約40%,平均線延遲下降約8%,僅這一項就帶來了約468MHz的頻率增益;而時鐘樹縮短和時鐘偏差優(yōu)化,又進一步貢獻了接近100MHz的額外提升。最終,這顆原本運行在2.6GHz的CPU核,被直接提升到了3.2GHz,同時能效提升超過10%。華為已經(jīng)在規(guī)劃鯤鵬960,升級會更加激進,CPU內(nèi)核會直接參與邏輯折疊。



除此之外,最近華為還展示了基于自研板上裸片封裝(DoB)技術(shù)的大容量SSD系列,目前已經(jīng)量產(chǎn)61.44TB和122.88TB兩款產(chǎn)品,245TB版本也在規(guī)劃當中。華為還有自研的高帶寬內(nèi)存HiBL 1.0。



這不由得讓人聯(lián)想,DeepSeek已經(jīng)深度適配了昇騰950,未來也會受益于整個超節(jié)點體系的“時間擴展”效應。DeepSeek的降價,或許已經(jīng)暗示了中國本土AI算力生態(tài)的推進進度。在這次的V4版本里,DeepSeek還沒有把Engram等技術(shù)融入模型,融入后就能更高效地把“記憶”按照訪問頻次依次卸載到對應存儲層級。外界甚至傳言V4.1很快就會推出。



從DSA到Engram,一年來DeepSeek層層勾勒V4架構(gòu)創(chuàng)新



2026/01/14完整閱讀>




三條線索匯總到一起,指向了一場更深層次的行業(yè)競爭:Token正在從一個“技術(shù)單元”轉(zhuǎn)變?yōu)椤吧a(chǎn)要素”,它的成本邏輯,正在被納入工業(yè)化的競爭框架。



在這場競爭中,本質(zhì)上有兩條同步推進的效率邊界。一條在AI算力工廠內(nèi)部,圍繞吞吐量、延遲和成本的三角尋找最優(yōu)解;另一條在工廠之外,在“更貴但更強”和“夠用但廉價”之間爭奪市場的最優(yōu)點。



第一條,是AI工廠自身的效率邊界。在黃仁勛的框架里,推理階段的Token經(jīng)濟學,是一條在吞吐量(TPS/兆瓦)和交互性(TPS/用戶)之間展開的價值曲線。吞吐量越高,能響應的用戶越多,單位Token價格就越低,但響應速度也就越慢;而對延遲要求極高的高價值場景,硬件成本就需要分攤給更少的并發(fā)用戶,單價自然更高。



在固定算力和能源約束下,同時實現(xiàn)更大的Token吞吐量、更低的推理延遲和更低的單位成本,是一個“不可能三角”。整個行業(yè)都在努力拓展帕累托最優(yōu)的邊界,也就是把整體瓶頸往上推,然后再在三者之間做新一輪權(quán)衡。這也是為什么,在財報電話會議上,黃仁勛越來越多地談論Groq LPU與Vera CPU;他也非常擔心華為這個擁有完整垂直整合能力的競爭對手。



第二條邊界,存在于AI供給和市場需求之間。更高智能、更高成本的模型,和“足夠智能、足夠便宜”的模型之間,存在一個不斷移動的市場最優(yōu)點。雖然高價值Token對應著更快的產(chǎn)品迭代速度,但能承受這個預算的客戶,規(guī)模并非沒有上限;而大量低價Token服務于更廣泛的市場,反而會創(chuàng)造出總量更大的市場空間。



昂貴的Token,仍然需要在AI應用的最后一環(huán)證明自己的價值。如果AI真的能創(chuàng)造規(guī)模增量市場,那么科技巨頭更可能在保持原有員工規(guī)模大致不變的基礎(chǔ)上,借助AI大幅擴張市場,而不是大規(guī)模裁員,或是為AI轉(zhuǎn)型騰挪預算和編制。用AI替代員工,在很大程度上只能說明,整個需求市場并沒有對應Token成本的大幅擴張。



AI三巨頭的萬億IPO前夜,應用與技術(shù)債務



2026/05/22完整閱讀>




DeepSeek真正的市場競爭力,在于它在中國建立起了一套可復制、可擴展的“AI工廠”路線圖,把“有效智能”拉到了工業(yè)化產(chǎn)品的價格區(qū)間里。編碼軟件公司Replit的首席執(zhí)行官也說,中國研究者實際上公開分享了真正的人工智能突破,讓所有人都受益,包括美國的小型甚至大型實驗室。幾十年來,很多“低技術(shù)”實體經(jīng)濟沒辦法完成有意義的數(shù)字化,不是不想做,而是行業(yè)利潤率承受不住對應的AI成本。



杰文斯悖論成立的前提,是成本不斷下降。但硅谷現(xiàn)在發(fā)生的一切,并不是這樣。行業(yè)價值主要沿著前沿模型廠商、云巨頭、芯片巨頭、能源巨頭集中,也向和監(jiān)管深度綁定的平臺集中;現(xiàn)在全球萬億美元市值上市公司已經(jīng)有12家,其中9家都是在2023年之后躋身這個俱樂部的。它們幾乎都受益于這一輪AI浪潮,但AI之外的其他行業(yè),都被擠到了這場盛宴之外。



黃仁勛在電話會議上,把ACIE業(yè)務的市場錨定在全球工業(yè)和企業(yè)經(jīng)濟活動約50-80萬億美元的宏觀底盤上;馬斯克在SpaceX招股書中,把AI企業(yè)服務的可觸達市場空間鎖定在約22.7萬億美元;中國在“人工智能+”行動中,把2030年新一代智能終端、智能體等應用的普及率目標設(shè)定在90%以上。這些數(shù)字指向的,正是Token經(jīng)濟學工業(yè)化競爭的未來。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com