營(yíng)收過(guò)億,這個(gè)多模態(tài)生成式AI黑馬開(kāi)啟新一程
在多模態(tài)落地應(yīng)用加速的當(dāng)下,智象未來(lái)還潛藏著怎樣的商業(yè)潛力?
距離OpenAI發(fā)布文生視頻模型Sora已過(guò)去近兩年,中美兩地的AIGC企業(yè)卻呈現(xiàn)出截然不同的發(fā)展?fàn)顟B(tài):一面是成本居高不下,始終無(wú)法鋪開(kāi)量的Sora2,和留存率幾乎為零的SoraApp;另一面,是扎根在廣闊的應(yīng)用土壤上,漸入佳境的中國(guó)企業(yè),在商業(yè)化上迎來(lái)全面爆發(fā)的局面。
《智能涌現(xiàn)》近日獲悉,專注于視覺(jué)多模態(tài)的生成式AI創(chuàng)企智象未來(lái)2025年的全能營(yíng)收已過(guò)1億元。其C端產(chǎn)品vivago.ai同樣在近期迎來(lái)了下載最高峰,其中,1月新增近千萬(wàn)用戶,在全球100+國(guó)家和地區(qū)進(jìn)入Google Play“視頻播放與編輯”類別榜前10,已呈現(xiàn)出巨大的商業(yè)發(fā)展?jié)摿Α?/p>
自創(chuàng)辦以來(lái),智象未來(lái)先后發(fā)布了HiDream-I1圖像生成大模型與HiDream-E1交互編輯模型,并在2025年4月全面開(kāi)源,開(kāi)源24小時(shí)內(nèi)即登頂國(guó)際權(quán)威AI測(cè)評(píng)榜單Artificial Analysis。
這家從合肥出發(fā)的企業(yè),通過(guò)自研的超百億參數(shù)大模型、全球首創(chuàng)的擴(kuò)散自回歸架構(gòu),在生成質(zhì)量與效率上找到了完美平衡?,F(xiàn)階段,其產(chǎn)品已在文創(chuàng)、影視、廣告等領(lǐng)域廣泛應(yīng)用。
《智能涌現(xiàn)》獨(dú)家獲悉,智象未來(lái)融資進(jìn)程再提速:B輪融資已進(jìn)入交割階段,下一輪TS已提前落袋,接近公司的核心知情人士透露,兩輪融資均為數(shù)億元量級(jí)。在AI視覺(jué)生成賽道競(jìng)爭(zhēng)加劇的當(dāng)下,智象未來(lái)憑借硬核技術(shù)實(shí)力與清晰的商業(yè)化路徑,持續(xù)獲得頭部資本的重倉(cāng)布局。
在多模態(tài)落地應(yīng)用加速的當(dāng)下,智象未來(lái)還潛藏著怎樣的商業(yè)潛力?
最產(chǎn)業(yè)化的科學(xué)家,最落地的浪漫
從創(chuàng)立之初,智象未來(lái)就找到了一種務(wù)實(shí)的浪漫。創(chuàng)始人梅濤是加拿大工程院外籍院士,此前曾在微軟任職長(zhǎng)達(dá)12年。在多媒體分析和計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)表論文300多篇,先后15次榮獲最佳國(guó)際論文獎(jiǎng)。
但梅濤的經(jīng)歷又不止于學(xué)術(shù)。2018年,梅濤加入京東,任京東探索研究院副院長(zhǎng)。這段職業(yè),讓他看到了從技術(shù)到商業(yè)化落地的通路。
在決定創(chuàng)辦智象未來(lái)時(shí),梅濤有過(guò)清晰的構(gòu)想。一方面,多模態(tài)是實(shí)現(xiàn)通用AGI的最可能路徑,這種觀點(diǎn)后來(lái)也成為了行業(yè)共識(shí)。與此同時(shí),在商業(yè)化前景上,多模態(tài)又比純語(yǔ)言模型有著更為廣闊的空間。“當(dāng)前全球AIGC收入的50%-60%來(lái)自圖片和視頻相關(guān)應(yīng)用,高于純文本模型。2023年我們創(chuàng)業(yè)決策時(shí),像Midjourney這樣的多模態(tài)公司已通過(guò)SaaS工具證明了強(qiáng)大的商業(yè)化能力,清晰的驗(yàn)證了產(chǎn)品的市場(chǎng)契合度?!泵窛?025年中對(duì)36氪表示。
而這恰恰是梅濤的主戰(zhàn)場(chǎng),在計(jì)算機(jī)視覺(jué)(CV)和多模態(tài)領(lǐng)域有著深厚的積淀。
不過(guò),對(duì)于當(dāng)時(shí)的中國(guó)創(chuàng)新企業(yè)來(lái)說(shuō),初入戰(zhàn)場(chǎng),Sora是擺在面前的一座大山,考慮到其對(duì)物理世界的還原程度和實(shí)現(xiàn)的驚艷效果,當(dāng)時(shí)業(yè)內(nèi)頗為期待的是,中國(guó)創(chuàng)企能否拿出可以與之匹敵的生成結(jié)果。
一場(chǎng)競(jìng)逐就此開(kāi)啟。在Sora發(fā)布后,僅用了半年時(shí)間,智象未來(lái)就發(fā)布自主研發(fā)的多模態(tài)大模型,2025年4月,智象未來(lái)更是一口氣開(kāi)源了圖像生成大模型HiDream-I1與交互編輯模型HiDream-E1,打通從對(duì)話到圖像創(chuàng)作的閉環(huán)。HiDream-I1在權(quán)威榜單Artificial Analysis中24小時(shí)內(nèi)登頂,成為首個(gè)躋身全球第一梯隊(duì)的中國(guó)自研生成式AI模型,并在圖像質(zhì)量、語(yǔ)義理解、藝術(shù)表現(xiàn)三大維度刷新行業(yè)紀(jì)錄。

不過(guò),多位創(chuàng)業(yè)者事后都復(fù)盤(pán),覺(jué)得Sora在架構(gòu)創(chuàng)新層面反倒有些落后。梅濤當(dāng)時(shí)也感覺(jué),Sora整體功能與預(yù)期相近。就在此后半年,隨著智象未來(lái)等初創(chuàng)企業(yè)的入局,在當(dāng)前的視頻生成領(lǐng)域,OpenAI已不具備太大優(yōu)勢(shì)。特別是從產(chǎn)品落地角度來(lái)看,無(wú)論是海外還是國(guó)內(nèi)的其他產(chǎn)品,其實(shí)都已經(jīng)相差無(wú)幾。
與此同時(shí),在探索多模態(tài)架構(gòu)范式上,智象未來(lái)甚至還走在了前列,公司最早研發(fā)了生成和理解雙模型,而后則規(guī)劃理解生成一體化,這被看作是通往物理世界的最佳路徑。
智象未來(lái)也一直走在突破行業(yè)難題的路上。2025年,隨著最新模型的開(kāi)源以及vivago2.0等產(chǎn)品的發(fā)布,梅濤也告訴36氪,DiT(編輯注:Diffusion Transformer)架構(gòu)利用Transformer的強(qiáng)大能力處理視頻數(shù)據(jù),讓AI模型能高效建模時(shí)空關(guān)系并靈活生成不同分辨率的視頻,這是一個(gè)重要的進(jìn)步。然而,對(duì)整個(gè)生成式AI領(lǐng)域而言,復(fù)雜物理現(xiàn)象的逼真還原仍是懸而未決的難題——飛濺的水珠軌跡、物體碰撞的力學(xué)反饋等人類直覺(jué)可感的動(dòng)態(tài)細(xì)節(jié),仍處于“形似而神不似”的探索階段,在相關(guān)場(chǎng)景中仍常出現(xiàn)視覺(jué)違和感。
智象未來(lái)通過(guò)Sparse DiT架構(gòu)讓模型在生成效果和運(yùn)行速度之間找到了優(yōu)異的平衡點(diǎn)。再通過(guò)對(duì)抗蒸餾技術(shù)在增加推理效率的同時(shí),極大地增強(qiáng)了畫(huà)面的細(xì)節(jié)和美感。這最終促成了智象未來(lái)旗下HiDream-I1模型的多個(gè)創(chuàng)造性成績(jī)。
在算法上另辟蹊徑,解決好最后一公里的問(wèn)題
和大廠卷基模、搞參數(shù)的邏輯不同,小廠更講究創(chuàng)新與落地,在梅濤看來(lái),這也是智象未來(lái)的價(jià)值,解決好AI最后一公里的落地問(wèn)題。
其曾對(duì)36氪表示,“從我們創(chuàng)業(yè)第一天起,我們就非常有危機(jī)感意識(shí),就想著怎么樣去找PMF。我們?cè)谏虡I(yè)化方面走得比較早,也比較快。雖然我們?nèi)诘腻X并不是最多的,但是花的每分錢、招的每個(gè)人、我們都是想明白的?!?/p>
在成立早期,智象未來(lái)就形成了“1+3+N”布局,即一個(gè)核心多模態(tài)大模型,驅(qū)動(dòng)創(chuàng)作工具平臺(tái)、互動(dòng)營(yíng)銷內(nèi)容工具和一站式視頻創(chuàng)作Agent三大產(chǎn)品。截至目前,其服務(wù)已覆蓋全球超2000萬(wàn)個(gè)人用戶和超4萬(wàn)企業(yè)用戶。
做好定位之后,核心是怎么做好交付,服務(wù)好客戶,讓AI真正產(chǎn)生價(jià)值。
梅濤告訴36氪,智象未來(lái)有國(guó)內(nèi)最全的多模態(tài)版權(quán)語(yǔ)料、數(shù)十萬(wàn)小時(shí)版權(quán)視頻素材以及上萬(wàn)個(gè)授權(quán)IP。不僅涵蓋了國(guó)內(nèi)70%影視數(shù)據(jù),且已形成上億條AIGC二創(chuàng)素材,目前在影視、文旅、營(yíng)銷等場(chǎng)景得到廣泛應(yīng)用。
“在微軟研究院,我們就經(jīng)常說(shuō),從一個(gè)技術(shù)到一個(gè)產(chǎn)品,可能需要一百個(gè)工程師;要把產(chǎn)品賣好,可能還需要一百個(gè)解決方案專家或BD,可見(jiàn)中間的Gap有多大。當(dāng)時(shí)我就想,我一定要找個(gè)地方去把鏈條打通?!?/p>
也正是這份從技術(shù)到落地的全鏈條能力,讓智象未來(lái)自誕生至今一直頗受資本看好。
2024年,智象未來(lái)完成數(shù)億元A輪融資,由合肥產(chǎn)投集團(tuán)領(lǐng)投,安徽省人工智能母基金等機(jī)構(gòu)參與。2025年底,京東集團(tuán)作為戰(zhàn)略投資方對(duì)智象未來(lái)進(jìn)行加碼,其背后的物流、零售、健康、工業(yè)等龐大業(yè)務(wù)場(chǎng)景,恰恰是多模態(tài)AI技術(shù)絕佳的落地試驗(yàn)田和應(yīng)用沃土。
隨后,便有知情人士透露,智象未來(lái)緊鑼密鼓地啟動(dòng)了B輪融資的籌備工作,并計(jì)劃于2026年初完成交割。
36氪近期了解到,智象未來(lái)已順利拿到下一輪TS,其中,老股東持續(xù)加持,新股東有產(chǎn)業(yè)資本、業(yè)務(wù)能深度合作的上市公司和知名投資機(jī)構(gòu),目前B輪融資金額已達(dá)到數(shù)億元人民幣。
上海敦鴻資產(chǎn)CEO袁國(guó)良在評(píng)價(jià)智象未來(lái)時(shí)如是表達(dá),“我們堅(jiān)定看好視頻生成技術(shù)作為新一代生產(chǎn)力工具,將全面賦能千行百業(yè)。尤其在電商領(lǐng)域,視頻已成為連接商品與消費(fèi)者的核心媒介,而HiDream已通過(guò)產(chǎn)品初步驗(yàn)證了其在電商場(chǎng)景下的應(yīng)用價(jià)值與商業(yè)化潛力,體現(xiàn)了團(tuán)隊(duì)不僅懂技術(shù),更懂行業(yè)。同時(shí),我們認(rèn)為其技術(shù)架構(gòu)與演進(jìn)方向,具備向更具通用性與認(rèn)知深度的世界模型拓展的可能性,這是一種底層能力的躍遷。我們期待與團(tuán)隊(duì)共同探索技術(shù)與產(chǎn)業(yè)融合的長(zhǎng)期路徑,助力推動(dòng)多模態(tài)生成成為普適且智能的行業(yè)基礎(chǔ)設(shè)施?!?/p>

兼具商業(yè)化實(shí)力與架構(gòu)創(chuàng)新的最佳標(biāo)的
2025年是中國(guó)多模態(tài)生成式AI的爆發(fā)元年。隨著AIGC技術(shù)的日趨成熟,生產(chǎn)力與創(chuàng)造力顯著提升,驅(qū)動(dòng)應(yīng)用市場(chǎng)呈爆發(fā)式增長(zhǎng)態(tài)勢(shì)。根據(jù)IDC數(shù)據(jù),全球生成式AI市場(chǎng)規(guī)模未來(lái)五年復(fù)合增長(zhǎng)率預(yù)計(jì)高達(dá)63.8%,到2028年將達(dá)2842億美元,占AI總投資的35%。而智象未來(lái)憑借極強(qiáng)的技術(shù)實(shí)力與產(chǎn)業(yè)化落地思維成為其中的獲益者。公司商業(yè)化進(jìn)程迅速,36氪獲悉,智象未來(lái)2025年的全年?duì)I收已過(guò)億。
在競(jìng)爭(zhēng)激烈的多模態(tài)生成領(lǐng)域能快速實(shí)現(xiàn)這樣的成績(jī),得益于智象未來(lái)獨(dú)特的商業(yè)模式思考與強(qiáng)勢(shì)的底層創(chuàng)新能力,可以說(shuō),智象未來(lái)是行業(yè)里為數(shù)不多的,商業(yè)化與技術(shù)創(chuàng)新兩手抓的企業(yè)。
在智象未來(lái)創(chuàng)立的三年時(shí)間里,經(jīng)歷了不同的商業(yè)模式。2023年的模式是MaaS,賣模型和API,類似于云計(jì)算的PaaS模式。2024年的模式是SaaS,主要賣工具,讓用戶在智象未來(lái)的平臺(tái)上使用工具生產(chǎn)內(nèi)容。
現(xiàn)如今,其已升級(jí)模式,正式轉(zhuǎn)變?yōu)镽aaS,即交付結(jié)果、以用戶價(jià)值為導(dǎo)向的商業(yè)模式,包括工具、內(nèi)容素材、限額視頻制作/投放只收少量的基礎(chǔ)費(fèi)用,主要是賺取客戶的GMV提升后的分傭。據(jù)梅濤表述,其認(rèn)為這樣的客戶價(jià)值相對(duì)清晰,可以基本上實(shí)現(xiàn)零風(fēng)險(xiǎn)投入,增量收益共享。
隨著創(chuàng)業(yè)漸入佳境,梅濤也表示,其已經(jīng)找到了商業(yè)回報(bào)和能力提升的平衡點(diǎn)。一方面是不斷加大水位,做好垂類基礎(chǔ)模型的研究,而一個(gè)更強(qiáng)大、方法更先進(jìn)的底層架構(gòu),必定能為模型能力打下更好的基礎(chǔ)。除了閉門自研,智象未來(lái)也通過(guò)開(kāi)源擁抱更廣闊的生態(tài),提升成功的可能性。另一方面,依舊是解決最后一公里問(wèn)題,深入到用戶的實(shí)際場(chǎng)景需求里,打通更多垂類數(shù)據(jù),如教育、電商和文旅等行業(yè),做精調(diào),真正解決行業(yè)問(wèn)題。
《智能涌現(xiàn)》還了解到,智象未來(lái)目前也在研發(fā)新一代具備多模態(tài)推理驅(qū)動(dòng)和無(wú)限記憶的多模態(tài)生成架構(gòu),將在大幅提升模型推理能力的同時(shí)實(shí)現(xiàn)更高水平的多任務(wù)間橫向scaling up。
現(xiàn)如今,隨著技術(shù)、市場(chǎng)和政策層面的共振,行業(yè)側(cè)也正在意識(shí)到,AI視頻不再是極客的玩具,而是能直接產(chǎn)生現(xiàn)金流的生產(chǎn)力工具。去年以來(lái),由AI生成的“貓狗運(yùn)動(dòng)會(huì)”“刀切玻璃水果”等爆款A(yù)IGC視頻走紅社交平臺(tái),也讓越來(lái)越多創(chuàng)作者入局,是從頭部玩家到C端普通用戶的共同選擇,最終加速了視頻生成賽道的商業(yè)化進(jìn)程。
據(jù)國(guó)際調(diào)研機(jī)構(gòu)Fortune Business Insights數(shù)據(jù),2024年,AI視頻生成的全球規(guī)模約6.2億美金,預(yù)計(jì)在2032年達(dá)到25.6億美金,2025—2032年間的復(fù)合增速為20%。
現(xiàn)階段,在營(yíng)銷與特定內(nèi)容領(lǐng)域AIGC已經(jīng)是主流選擇,更可觀的暢想是,隨著模型能穩(wěn)定解決角色一致性和長(zhǎng)時(shí)序連貫性問(wèn)題時(shí),AIGC將在影視、游戲等高端應(yīng)用引爆市場(chǎng)。而當(dāng)模型突破理解生成一致性的問(wèn)題,其便真正能認(rèn)識(shí)物理世界,生成更真實(shí)可控的內(nèi)容與細(xì)節(jié),屆時(shí),才是視頻生成賽道真正的爆發(fā)時(shí)刻。在這場(chǎng)競(jìng)速之中,智象未來(lái)已走在了前列。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






