斯坦福權(quán)威報告:阿里AI貢獻(xiàn)全球第三、中國第一
中美頂級大模型差距幾近抹平,阿里AI貢獻(xiàn)全球第三
4月16日消息,斯坦福大學(xué)人工智能研究所發(fā)布了最新一期《2026年人工智能指數(shù)報告》,阿里巴巴位列2025年全球知名模型貢獻(xiàn)榜第三名,同時也是入選重要模型最多的中國科技公司。該報告指出,當(dāng)前中美知名大模型差距“實質(zhì)性消除”,頭部模型間表現(xiàn)相當(dāng),呈并跑態(tài)勢。報告顯示,在前20的AI機(jī)構(gòu)中,中國11家超過美國位居首位。

據(jù)了解,《人工智能指數(shù)報告》由斯坦福大學(xué)人工智能研究所于2017年推出,每年聯(lián)合全球?qū)W術(shù)、產(chǎn)業(yè)與政策領(lǐng)域?qū)<覍Ξ?dāng)前人工智能行業(yè)的技術(shù)進(jìn)步、經(jīng)濟(jì)影響和社會影響提供嚴(yán)謹(jǐn)客觀的分析,是業(yè)界公認(rèn)的AI領(lǐng)域最權(quán)威的年度報告之一。
報告指出,目前中美仍是全球AI最具影響力的兩大國家,雙方差距已“實質(zhì)性消除”(effectively closed),呈現(xiàn)并跑態(tài)勢。2025年,美國發(fā)布了50個重要模型,中國發(fā)布了30個。其中僅阿里巴巴就貢獻(xiàn)了11個,在國產(chǎn)模型中占比接近40%,僅次于Open AI 的19個和Google的12個,連續(xù)第二年位居全球第三。在Arena排行榜上,美國的Anthropic、xAI、Google、OpenAI和中國的阿里巴巴、DeepSeek等六家企業(yè)共同構(gòu)成頭部梯隊,彼此間競爭焦灼,且競爭焦點逐漸從性能比拼轉(zhuǎn)向成本、可靠性與真實世界實用性。
斯坦福報告還顯示,在多項細(xì)分能力評測中,阿里千問系列均有亮眼表現(xiàn)。比如,在聚焦真實工作流中工具調(diào)用與智能體交互能力的τ-bench基準(zhǔn)測試中,Qwen3.5以68.4%的任務(wù)成功率,位列全球第三;在體現(xiàn)小語種能力的HELM阿拉伯語測試中,Qwen3以0.79的平均得分(Mean Score)位居中國模型首位,也是最懂阿拉伯語的大模型之一;在考察多學(xué)科知識理解與推理能力的MMLU-Pro中,Qwen3.5以87.8%的準(zhǔn)確率,媲美Gemini 3.1 Pro、Claude Opus 4.6等國外知名模型。
此外,報告中還特別指出,自2023年以來,全球開源AI生態(tài)呈爆發(fā)式增長。數(shù)據(jù)顯示,GitHub平臺上的開源AI項目已突破560萬個,Hugging Face社區(qū)的模型上傳量在兩年內(nèi)增長到3倍。以阿里巴巴、DeepSeek為代表的中國企業(yè)在其中表現(xiàn)突出,截至目前,阿里千問大模型共開源400多款,全球衍生模型數(shù)量超20萬,全球下載量破10億,是全球第一的開源模型家族。據(jù)了解,千問3.6系列也即將推出新的開源模型。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



