欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<sub id="jgvuz"></sub>

<tt id="jgvuz"></tt>

Token工業(yè)化競爭：成本賬本重構(gòu)下的新戰(zhàn)局

2天前

本文來自微信公眾號：未盡研究，作者：未盡研究

硅谷現(xiàn)在突然開始嫌Token太貴了。

有很長一段時間，整個AI行業(yè)都沉浸在智能體會遞歸進化到通用人工智能（AGI）的樂觀情緒里。在Anthropic打造的行業(yè)敘事中，性能更強的高價Token永遠有它的存在價值。但就在過去一周，三個幾乎同時出現(xiàn)的行業(yè)信號，撕開了表層樂觀敘事下，另一個完全不同的行業(yè)現(xiàn)實。

第一個信號，微軟內(nèi)部開始大規(guī)模限制Claude Code的使用。原因很簡單：它用起來太貴了。微軟旗下負責Windows、Microsoft 365、Outlook、Teams和Surface的“體驗+設(shè)備”部門，要求必須在6月底之前停用Claude Code，把所有開發(fā)工作流遷移到微軟自家的GitHub Copilot CLI上。

但這件事很難簡單歸結(jié)為內(nèi)部產(chǎn)品和外部產(chǎn)品的競爭。據(jù)業(yè)內(nèi)消息，這次停用決策里，財務部門起到了關(guān)鍵作用。雖然開發(fā)團隊用得順手，一致反饋Claude Code能大幅提升開發(fā)生產(chǎn)力；但管預算的高管們，并沒有看到代碼規(guī)模增長，給對應軟件帶來收入暴漲——你到處都能看到AI的影子，唯獨在公司的營收報表上看不到。

更值得玩味的是，就在上個月，微軟面向外部客戶的GitHub Copilot，剛剛宣布全面改成按量計費模式。智能體在持續(xù)不斷消耗Token，哪怕是微軟面對自己的外部客戶，也不想白白被“薅羊毛”。對內(nèi)“停用”是節(jié)流，對客戶“調(diào)價”是開源，本質(zhì)上都是為了重新對齊成本和價值的賬本。在智能體主導的Token消耗浪潮面前，哪怕是微軟這樣資金雄厚的科技巨頭，也已經(jīng)感受到了壓力，AI成本已經(jīng)正式進入企業(yè)的預算約束范圍。

現(xiàn)在行業(yè)里有兩個明確趨勢：一方面，前沿大模型的單位Token價格正在持續(xù)上漲。硅谷三大巨頭都在試探API客戶的價格承受力。谷歌最新發(fā)布的Gemini-3.5-Flash，價格明顯上漲，是同類產(chǎn)品Gemini-3.1-Flash-Lite的6倍，已經(jīng)接近Gemini-3.1-Pro的價格；OpenAI的GPT-5.5價格是GPT-5.4的兩倍；如果考慮新分詞器的影響，Claude-Opus-4.7的價格大約是Opus-4.6的1.46倍。

另一方面，智能體及其配套框架正在重塑Token經(jīng)濟學。智能體追求更高性能、更快響應速度，這本身就意味著更高的單位Token成本；而且Token越來越多地承擔系統(tǒng)控制功能，代價就是額外的調(diào)度復雜度、Token消耗和延遲累積，顯著推高了整體消耗。在用戶開始輸入提示詞之前，智能體就會提前預加載很多內(nèi)容，現(xiàn)在智能體單次任務的Token負載中位數(shù)，已經(jīng)來到了10萬Token的量級。

現(xiàn)在，所有大模型廠商都在向智能體廠商轉(zhuǎn)型。OpenAI聯(lián)合創(chuàng)始人Greg Brockman就認為，單單一個模型，已經(jīng)不能構(gòu)成完整的產(chǎn)品了。未來的Token經(jīng)濟學，就會在這個轉(zhuǎn)型趨勢下展開。

第二個信號，是DeepSeek宣布V4-Pro永久降價75%。這不是短期促銷，不是新用戶補貼，也不是互聯(lián)網(wǎng)行業(yè)常見的燒錢換規(guī)模。這次降價意味著DeepSeek已經(jīng)跑通了某種結(jié)構(gòu)性的成本優(yōu)勢。硅谷風投YCombinator的合伙人非常好奇，模型優(yōu)化和芯片協(xié)同，在這個成本優(yōu)勢里起到了多大作用。

根據(jù)Artficial Intellgence的統(tǒng)計，運行指定測評任務時，DeepSeek V4 Pro的成本僅約為Gemini-3.1-Pro-Preview的三分之一，GPT-5.5的十二分之一，Claude-Opus-4.7的十九分之一。

今年年初，DeepSeek在DualPath論文中披露，在Agentic AI場景下，它的KV緩存命中率可以高達95%。壓縮和管理KV緩存，不只是降低單位Token成本的關(guān)鍵，還把AI的成本函數(shù)從“和上下文長度線性相關(guān)”重構(gòu)為“僅和新增決策相關(guān)”。這就讓智能體可以在長時間、多輪交互中持續(xù)運行，不會因為歷史上下文膨脹導致成本失控，也把AI從“被調(diào)用的工具”變成了“持續(xù)運行的進程”。

DeepSeek的深度推理創(chuàng)新，用DualPath為智能體壓榨帶寬|筆記

2026/02/27完整閱讀>

這也會影響模型下游的產(chǎn)品設(shè)計。雖然DeepSeek的模型性能，仍然比硅谷頂尖模型落后半年左右，但它依然在快速搶占市場。在OpenRouter平臺上，調(diào)用V4-Flash模型的請求一直在增長，甚至已經(jīng)出現(xiàn)了基于V4的“原生”智能體產(chǎn)品。Reasonix就專門針對DeepSeek的緩存機制，打造了一套智能體框架，核心目標就是“節(jié)省Token成本”?，F(xiàn)在DeepSeek還在招募框架工程師，未來它很可能成為這個新領(lǐng)域的“價格屠夫”。

第三個信號，是華為對“韜（τ）定律”的探索和落地。在這個技術(shù)框架下，當晶體管密度提升遇到瓶頸時，華為開始從底層器件、電路、芯片到系統(tǒng)層面，同步壓縮數(shù)據(jù)傳輸?shù)臅r間和能耗。華為已經(jīng)圍繞超節(jié)點，同步推進統(tǒng)一總線UB-Mesh、Hi-ONE近封裝光學、背面供電以及近存計算等技術(shù)，還在嘗試把鯤鵬和昇騰做“邏輯折疊”，在單位算力的Token吞吐量上實現(xiàn)“時間擴展”。

如何理解華為的韜定律與時間擴展定律

2026/05/26完整閱讀>

是邏輯折疊，而不是簡單堆疊。這意味著它和當前行業(yè)常見的2.5D封裝不同，是在Z軸方向、單元層面完成邏輯和計算拓撲的重構(gòu)。不管是半導體專家還是金融分析師，美國都非常關(guān)注華為這次戰(zhàn)略方向選擇。Bernstein直接評價這是又一個“DeepSeek時刻”。

在近期IEEE中國的直播活動中，華為進一步介紹，鯤鵬950是第一代折疊技術(shù)打造的“超級CPU”。在其他條件基本不變的情況下，鯤鵬950通過重新組織CPU核和互聯(lián)結(jié)構(gòu)，讓關(guān)鍵路徑長度明顯縮短。垂直折疊之后，微架構(gòu)投影面積減少了大約40%，平均線延遲下降約8%，僅這一項就帶來了約468MHz的頻率增益；而時鐘樹縮短和時鐘偏差優(yōu)化，又進一步貢獻了接近100MHz的額外提升。最終，這顆原本運行在2.6GHz的CPU核，被直接提升到了3.2GHz，同時能效提升超過10%。華為已經(jīng)在規(guī)劃鯤鵬960，升級會更加激進，CPU內(nèi)核會直接參與邏輯折疊。

除此之外，最近華為還展示了基于自研板上裸片封裝（DoB）技術(shù)的大容量SSD系列，目前已經(jīng)量產(chǎn)61.44TB和122.88TB兩款產(chǎn)品，245TB版本也在規(guī)劃當中。華為還有自研的高帶寬內(nèi)存HiBL 1.0。

這不由得讓人聯(lián)想，DeepSeek已經(jīng)深度適配了昇騰950，未來也會受益于整個超節(jié)點體系的“時間擴展”效應。DeepSeek的降價，或許已經(jīng)暗示了中國本土AI算力生態(tài)的推進進度。在這次的V4版本里，DeepSeek還沒有把Engram等技術(shù)融入模型，融入后就能更高效地把“記憶”按照訪問頻次依次卸載到對應存儲層級。外界甚至傳言V4.1很快就會推出。

從DSA到Engram，一年來DeepSeek層層勾勒V4架構(gòu)創(chuàng)新

2026/01/14完整閱讀>

三條線索匯總到一起，指向了一場更深層次的行業(yè)競爭：Token正在從一個“技術(shù)單元”轉(zhuǎn)變?yōu)椤吧a(chǎn)要素”，它的成本邏輯，正在被納入工業(yè)化的競爭框架。

在這場競爭中，本質(zhì)上有兩條同步推進的效率邊界。一條在AI算力工廠內(nèi)部，圍繞吞吐量、延遲和成本的三角尋找最優(yōu)解；另一條在工廠之外，在“更貴但更強”和“夠用但廉價”之間爭奪市場的最優(yōu)點。

第一條，是AI工廠自身的效率邊界。在黃仁勛的框架里，推理階段的Token經(jīng)濟學，是一條在吞吐量（TPS/兆瓦）和交互性（TPS/用戶）之間展開的價值曲線。吞吐量越高，能響應的用戶越多，單位Token價格就越低，但響應速度也就越慢；而對延遲要求極高的高價值場景，硬件成本就需要分攤給更少的并發(fā)用戶，單價自然更高。

在固定算力和能源約束下，同時實現(xiàn)更大的Token吞吐量、更低的推理延遲和更低的單位成本，是一個“不可能三角”。整個行業(yè)都在努力拓展帕累托最優(yōu)的邊界，也就是把整體瓶頸往上推，然后再在三者之間做新一輪權(quán)衡。這也是為什么，在財報電話會議上，黃仁勛越來越多地談論Groq LPU與Vera CPU；他也非常擔心華為這個擁有完整垂直整合能力的競爭對手。

第二條邊界，存在于AI供給和市場需求之間。更高智能、更高成本的模型，和“足夠智能、足夠便宜”的模型之間，存在一個不斷移動的市場最優(yōu)點。雖然高價值Token對應著更快的產(chǎn)品迭代速度，但能承受這個預算的客戶，規(guī)模并非沒有上限；而大量低價Token服務于更廣泛的市場，反而會創(chuàng)造出總量更大的市場空間。

昂貴的Token，仍然需要在AI應用的最后一環(huán)證明自己的價值。如果AI真的能創(chuàng)造規(guī)模增量市場，那么科技巨頭更可能在保持原有員工規(guī)模大致不變的基礎(chǔ)上，借助AI大幅擴張市場，而不是大規(guī)模裁員，或是為AI轉(zhuǎn)型騰挪預算和編制。用AI替代員工，在很大程度上只能說明，整個需求市場并沒有對應Token成本的大幅擴張。

AI三巨頭的萬億IPO前夜，應用與技術(shù)債務

2026/05/22完整閱讀>

DeepSeek真正的市場競爭力，在于它在中國建立起了一套可復制、可擴展的“AI工廠”路線圖，把“有效智能”拉到了工業(yè)化產(chǎn)品的價格區(qū)間里。編碼軟件公司Replit的首席執(zhí)行官也說，中國研究者實際上公開分享了真正的人工智能突破，讓所有人都受益，包括美國的小型甚至大型實驗室。幾十年來，很多“低技術(shù)”實體經(jīng)濟沒辦法完成有意義的數(shù)字化，不是不想做，而是行業(yè)利潤率承受不住對應的AI成本。

杰文斯悖論成立的前提，是成本不斷下降。但硅谷現(xiàn)在發(fā)生的一切，并不是這樣。行業(yè)價值主要沿著前沿模型廠商、云巨頭、芯片巨頭、能源巨頭集中，也向和監(jiān)管深度綁定的平臺集中；現(xiàn)在全球萬億美元市值上市公司已經(jīng)有12家，其中9家都是在2023年之后躋身這個俱樂部的。它們幾乎都受益于這一輪AI浪潮，但AI之外的其他行業(yè)，都被擠到了這場盛宴之外。

黃仁勛在電話會議上，把ACIE業(yè)務的市場錨定在全球工業(yè)和企業(yè)經(jīng)濟活動約50-80萬億美元的宏觀底盤上；馬斯克在SpaceX招股書中，把AI企業(yè)服務的可觸達市場空間鎖定在約22.7萬億美元；中國在“人工智能+”行動中，把2030年新一代智能終端、智能體等應用的普及率目標設(shè)定在90%以上。這些數(shù)字指向的，正是Token經(jīng)濟學工業(yè)化競爭的未來。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

網(wǎng)傳高考將禁用AI相關(guān)功能引討論多家主流AI平臺給出最新回應

電子板塊成交額突破萬億，A股主力資金整體大幅凈流出

韜定律的誕生：華為以系統(tǒng)論重構(gòu)半導體行業(yè)邏輯

OPPO Reno16系列新品登場，京東MALL現(xiàn)已開啟預訂通道

劉強東持續(xù)加碼線下商業(yè)：京東天地比京東MALL更趨近于真正的購物中心

項目推薦