欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

開(kāi)源與閉源爭(zhēng)論的背后,是大模型未來(lái)商業(yè)生態(tài)演進(jìn)的嚴(yán)肅思考

商界觀察
2024-04-24

“開(kāi)源模型會(huì)越來(lái)越落后?!盋reate 2024百度AI開(kāi)發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏的這句話,以及在大會(huì)上發(fā)布的PPT,在網(wǎng)絡(luò)上廣為流傳,并引起了科技圈關(guān)于大模型開(kāi)源vs閉源的辯論。

 

引起對(duì)大模型是否要開(kāi)源的系統(tǒng)性討論的,還有李彥宏發(fā)表的關(guān)于大模型開(kāi)源的多個(gè)看法:

 

“開(kāi)源模型已經(jīng)很多了,不缺百度一家。”

 

“大家以前用開(kāi)源覺(jué)得開(kāi)源便宜,其實(shí)在大模型場(chǎng)景下,開(kāi)源是最貴的。”

 

“而且模型開(kāi)源也不是一個(gè)眾人拾柴火焰高的情況。這跟傳統(tǒng)的軟件開(kāi)源一比如Linux、安卓等等很不一樣,由于是模型帶來(lái)的開(kāi)源,我們也不知道參數(shù)為什么變成了那個(gè)樣子,這種情況下很難實(shí)現(xiàn)眾人拾柴火焰高。雖然Llama也鼓勵(lì)大家去貢獻(xiàn)各種各樣的數(shù)據(jù)、代碼,但是實(shí)際上大家明白最主要的開(kāi)發(fā)者就是Meta這些人,它并不是一個(gè)真正由大家一起來(lái)協(xié)同開(kāi)發(fā)的產(chǎn)品?!?/p>

 

 

360創(chuàng)始人周鴻祎一直是開(kāi)源的信徒,很巧的是,他4月13號(hào)在哈佛有個(gè)演講,在演講中也提到了關(guān)于開(kāi)源的態(tài)度“沒(méi)有開(kāi)源就沒(méi)有Linux,沒(méi)有PHP,沒(méi)有MySQL,甚至沒(méi)有互聯(lián)網(wǎng)。包括在人工智能的發(fā)展上,如果沒(méi)有當(dāng)初谷歌開(kāi)源Transformer,就不會(huì)有OpenAI和GPT。我們都是受益于開(kāi)源成長(zhǎng)起來(lái)的個(gè)人和公司。”

 

網(wǎng)民猜測(cè)周鴻祎在“暗懟”李彥宏。周鴻祎隨后在4月20日再次發(fā)文澄清,“這兩天有人挑事兒,說(shuō)我攻擊李廠長(zhǎng),我不是針對(duì)李廠長(zhǎng),我還是從產(chǎn)業(yè)發(fā)展的角度來(lái)看開(kāi)源和閉源?!?/p>

 

其實(shí),兩位科技企業(yè)的創(chuàng)始人關(guān)于大模型開(kāi)源vs閉源的爭(zhēng)論,不是簡(jiǎn)簡(jiǎn)單單的開(kāi)源好、還是閉源好的二元論問(wèn)題,而是一個(gè)關(guān)于復(fù)雜系統(tǒng)的爭(zhēng)論,涉及到多個(gè)問(wèn)題:

 

① 在大模型領(lǐng)域,開(kāi)源模型的能力是否永遠(yuǎn)會(huì)落后于閉源模型的能力?

 

② 開(kāi)源模型,是否可能有商業(yè)化落地的閉環(huán)?

 

③ 當(dāng)真正應(yīng)用大模型的時(shí)候,究竟是開(kāi)源還是閉源性價(jià)比更高?

 

④ 從科技發(fā)展的角度來(lái)講,大模型的開(kāi)源和傳統(tǒng)意義的開(kāi)源,究竟有什么不同?

 

開(kāi)源不僅是開(kāi)放源代碼這么簡(jiǎn)單

 

開(kāi)源(Open Source)的起源可以追溯到計(jì)算機(jī)技術(shù)初期,那時(shí)候軟件和硬件就像是一對(duì)連體嬰,用戶常常得自己動(dòng)手編寫(xiě)或修改軟件來(lái)解決問(wèn)題。到1955年,IBM為了讓大家都能深入研究他們的操作系統(tǒng),搞了一個(gè)“IBM用戶組分享”。

 

70年代中葉,隨著計(jì)算機(jī)技術(shù)的發(fā)展,軟件開(kāi)始成為一種商品,而不再免費(fèi)地與硬件一起提供。這種變化導(dǎo)致了軟件的共享文化開(kāi)始受到限制。為了反對(duì)這種趨勢(shì),自由軟件運(yùn)動(dòng)(Free Software Movement)開(kāi)始興起,Richard Stallman在1983年發(fā)起了GNU項(xiàng)目,并在1985年創(chuàng)立了自由軟件基金會(huì)(Free Software Foundation, FSF),推動(dòng)自由軟件的發(fā)展。

 

1998年,Eric Raymond和Bruce Perens成立了開(kāi)源促進(jìn)會(huì)(Open Source Initiative, OSI),并提出了“開(kāi)源定義”(Open Source Definition),這是對(duì)開(kāi)源軟件的正式定義。OSI的目標(biāo)是推廣開(kāi)源軟件,并為開(kāi)源項(xiàng)目提供認(rèn)證。

 

按照開(kāi)源促進(jìn)會(huì)的說(shuō)法,開(kāi)源軟件不光是把源代碼公開(kāi)那么簡(jiǎn)單,它還得滿足一些條件,比如允許大家自由地用、改和分享這個(gè)軟件,甚至基于它創(chuàng)造新的東西。但是,開(kāi)源軟件也不是啥都不管,它得在某種開(kāi)源許可證下發(fā)布,比如我們常聽(tīng)到的GPL、Apache、BSD和MIT這些許可證。

 

為何周鴻祎會(huì)特別提到,沒(méi)有開(kāi)源就沒(méi)有Linux、PHP、和MySQL,這三者和開(kāi)源的關(guān)系是什么?和現(xiàn)在的科技產(chǎn)業(yè)又有什么關(guān)系?

 

●Linux:Linux是一個(gè)開(kāi)源的操作系統(tǒng)內(nèi)核,由Linus Torvalds在1991年首次發(fā)布。 L inux內(nèi)核是許多現(xiàn)代操作系統(tǒng)的基礎(chǔ),包括Android和大多數(shù)服務(wù)器操作系統(tǒng)。 Linux的開(kāi)發(fā)模式——開(kāi)放源代碼、社區(qū)驅(qū)動(dòng)、協(xié)作開(kāi)發(fā)——成為了開(kāi)源軟件運(yùn)動(dòng)的一個(gè)標(biāo)志性案例。

 

●Apache HTTP Server:一個(gè)強(qiáng)大的Web服務(wù)器軟件,處理HTTP請(qǐng)求并提供Web頁(yè)面。Apache HTTP Server是互聯(lián)網(wǎng)上最常用的Web服務(wù)器之一,以其性能和可配置性而受到青睞。

 

●PHP:PHP是一種開(kāi)源的服務(wù)器端腳本語(yǔ)言,特別適用于Web開(kāi)發(fā),并且是創(chuàng)建動(dòng)態(tài)網(wǎng)站和Web應(yīng)用的常用工具。PHP的開(kāi)源特性允許開(kāi)發(fā)者自由地使用、修改和增強(qiáng)其功能,從而推動(dòng)了Web開(kāi)發(fā)技術(shù)的發(fā)展。

 

●MySQL:MySQL是一個(gè)流行的開(kāi)源關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS),廣泛用于網(wǎng)站和在線應(yīng)用的數(shù)據(jù)存儲(chǔ)。MySQL的開(kāi)源性質(zhì)使得它能夠被社區(qū)廣泛采用和定制,成為許多網(wǎng)站和網(wǎng)絡(luò)應(yīng)用后端的關(guān)鍵組件。

 

這三者共同構(gòu)成了所謂的LAMP(Linux, Apache, MySQL, PHP/Python/Perl)棧的一部分,這是創(chuàng)建動(dòng)態(tài)網(wǎng)站和網(wǎng)絡(luò)應(yīng)用的常用技術(shù)組合。Linux作為操作系統(tǒng),Apache作為Web服務(wù)器,MySQL作為數(shù)據(jù)庫(kù),而PHP(或其他語(yǔ)言如Python或Perl)作為腳本語(yǔ)言,共同支持了互聯(lián)網(wǎng)上的大量網(wǎng)站和應(yīng)用。

 

用通俗的語(yǔ)言解釋就是,LAMP就像是一個(gè)團(tuán)隊(duì),里面有打地基的Linux,接待用戶的Apache,管理數(shù)據(jù)的MySQL,還有寫(xiě)代碼的PHP(或Python、Perl)。這個(gè)團(tuán)隊(duì)合作無(wú)間,可以說(shuō)是互聯(lián)網(wǎng)世界的基礎(chǔ)。

 

除了這些技術(shù)的發(fā)展和普及,開(kāi)源還為全球開(kāi)發(fā)者社區(qū)提供了一個(gè)共享知識(shí)、協(xié)作創(chuàng)新的平臺(tái)。通過(guò)開(kāi)放源代碼,這些項(xiàng)目能夠快速迭代,聚集全球開(kāi)發(fā)者的智慧,形成了強(qiáng)大的生態(tài)系統(tǒng),推動(dòng)了整個(gè)軟件行業(yè)的進(jìn)步。

 

來(lái)到大模型時(shí)代,開(kāi)源變了嗎?

 

那么,來(lái)到大模型時(shí)代,開(kāi)源有什么不同了嗎?在早期的軟件時(shí)代,開(kāi)源主要是由個(gè)人和小型團(tuán)隊(duì)推動(dòng)的,重點(diǎn)在于共享代碼和協(xié)作解決問(wèn)題。開(kāi)源項(xiàng)目通常是由愛(ài)好者和志愿者社區(qū)維護(hù)的,商業(yè)化程度較低。例如,Linux操作系統(tǒng)的誕生和GNU項(xiàng)目的推動(dòng),都是這一時(shí)期開(kāi)源生態(tài)的代表。

 

隨著互聯(lián)網(wǎng)的興起,開(kāi)源生態(tài)開(kāi)始加速發(fā)展,開(kāi)源項(xiàng)目開(kāi)始得到更廣泛的認(rèn)可和使用,如上文提到的LAMP,它們成為了構(gòu)建網(wǎng)站和網(wǎng)絡(luò)應(yīng)用的基石。此外,開(kāi)源也開(kāi)始與商業(yè)模式相結(jié)合,如通過(guò)提供技術(shù)服務(wù)和支持來(lái)盈利。

 

到了云計(jì)算時(shí)代,云服務(wù)提供商開(kāi)始大量采用和貢獻(xiàn)開(kāi)源技術(shù),如OpenStack和Docker等,它們成為了云計(jì)算基礎(chǔ)設(shè)施的重要組成部分。開(kāi)源軟件開(kāi)始與云服務(wù)緊密結(jié)合,提供更加靈活和可擴(kuò)展的解決方案。同時(shí),云服務(wù)商通過(guò)提供基于開(kāi)源軟件的云服務(wù)來(lái)創(chuàng)造商業(yè)價(jià)值,如AWS、Azure等。

 

大模型的技術(shù)浪潮,某種程度上也是由開(kāi)源開(kāi)啟,谷歌開(kāi)源了Transformer,才有了后來(lái)OpenAI引爆行業(yè)的ChatGPT。

 

但OpenAI不再Open,谷歌也不再那么Open,大模型的開(kāi)源大旗,反而被Meta以其Llama系列模型扛起,馬斯克開(kāi)源Grok模型,位于法國(guó)巴黎的Mistral AI,成為另外兩股最被關(guān)注的大模型開(kāi)源力量。

 

但是,Llama2剛剛發(fā)布后不久,就有批評(píng)說(shuō),Llama2并不符合開(kāi)源促進(jìn)會(huì)(OSI)設(shè)定的定義,Llama2的許可證包含了一定的限制,比如禁止使用Llama2去訓(xùn)練其它語(yǔ)言模型,如果該模型用于每月用戶超過(guò)7億的應(yīng)用程序和服務(wù),則需要獲得Meta的特殊許可證。

 

大模型時(shí)代的開(kāi)源,也變得更加復(fù)雜。

 

首先是開(kāi)源的方式,單單從最具代表性的Llama系列模型和Mistral系列模型,它們的開(kāi)源方式就不太相同。一位熟悉開(kāi)源生態(tài)的專家表示,它們的區(qū)別主要在于Restrict License(限制許可)VS Apache。Llama的開(kāi)源屬于前者,從前面描述的Llama2的限制方式可以看出,這種開(kāi)源方式是指在開(kāi)放源代碼的同時(shí),對(duì)使用、修改和分發(fā)該模型的行為施加一定的限制。

 

這與完全開(kāi)放的開(kāi)源許可證(如MIT、Apache 2.0等)不同,后者通常允許用戶在幾乎不設(shè)限的情況下使用和修改軟件,而Mistral、谷歌的開(kāi)源模型Gemma都采取了這種方式,既開(kāi)源了模型的權(quán)重也開(kāi)源了模型的架構(gòu)。但是對(duì)于訓(xùn)練的數(shù)據(jù)和訓(xùn)練過(guò)程并不開(kāi)源。

 

除了開(kāi)源方式的不同,訓(xùn)練一個(gè)大模型通常需要大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí)來(lái)進(jìn)行訓(xùn)練和優(yōu)化,這些資源往往只有大型科技公司或研究機(jī)構(gòu)才能提供。所以,大模型時(shí)代的開(kāi)源主體,往往是大型科技公司,或者資源優(yōu)勢(shì)強(qiáng)的創(chuàng)業(yè)公司,而不是個(gè)體;這也造成了,開(kāi)源雖然可能吸引更廣泛的社區(qū)參與,但由于技術(shù)門(mén)檻和資源需求,實(shí)際貢獻(xiàn)可能集中在有限的專家群體中;某些大公司的開(kāi)源,還有著占據(jù)競(jìng)爭(zhēng)生態(tài)位的考量,所以對(duì)于開(kāi)源條款的設(shè)計(jì),也會(huì)有更加復(fù)雜的考慮。

 

這些變化呼應(yīng)了文章開(kāi)頭提到的李彥宏的觀點(diǎn),“模型開(kāi)源不是一個(gè)眾人拾柴火焰高的情況。這跟Linux、安卓等傳統(tǒng)的軟件開(kāi)源很不一樣,由于是模型帶來(lái)的開(kāi)源,我們也不知道參數(shù)為什么變成了那個(gè)樣子。雖然Llama也鼓勵(lì)大家去貢獻(xiàn)各種各樣的數(shù)據(jù)、代碼,但是實(shí)際上大家明白最主要的開(kāi)發(fā)者就是Meta這些人,它并不是一個(gè)真正由大家一起來(lái)協(xié)同開(kāi)發(fā)的產(chǎn)品。

 

但是大模型的生態(tài)剛剛萌芽,從目前看來(lái),確實(shí)是能夠獲取有限資源的少部分人,推動(dòng)了大部分的技術(shù)進(jìn)步,但是隨著算力資源成本的降低及門(mén)檻的下降,是否未來(lái)還能呈現(xiàn)“眾人拾柴火焰高”的情況,目前也無(wú)法下定論。

 

但是,大模型的生態(tài)發(fā)展究竟會(huì)如何演變?相對(duì)于開(kāi)源歷史,又會(huì)呈現(xiàn)出哪些不同的特點(diǎn)?這是值得科技界長(zhǎng)期關(guān)注和深度討論的問(wèn)題。

 

從Benchmark來(lái)看,開(kāi)源閉源模型的能力對(duì)比

 

基于大模型開(kāi)源生態(tài)的演進(jìn),還有一個(gè)討論的焦點(diǎn),“開(kāi)源大模型的能力,真的會(huì)越來(lái)越落后嗎?”

 

被稱為最強(qiáng)開(kāi)源大模型的Llama3在4月19日發(fā)布,有8B和70B的版本,并預(yù)告大版本的超過(guò)4000億參數(shù)的模型也將在晚些時(shí)候發(fā)布。Llama 3 在多項(xiàng)性能基準(zhǔn)上展現(xiàn)了最先進(jìn)的性能,提供了包括改進(jìn)的推理能力在內(nèi)的新功能。

 

從Benchmark看,僅僅70B的Llama 3在各項(xiàng)指標(biāo)上已經(jīng)能和據(jù)推測(cè)參數(shù)量為175B的Gemini Pro1.5相抗衡,聯(lián)合Claude 3給出的數(shù)據(jù),70B的Llama3即使對(duì)敵GPT4,在各項(xiàng)benchmark上比較也已經(jīng)非常接近。這還是在Llama3未進(jìn)行微調(diào)的情況下達(dá)成的,這說(shuō)明它后續(xù)還有很大的提升空間。

 

同樣的,開(kāi)源界的另外兩個(gè)巨頭Mistreal 和 Grok近期放出的模型也都展示出與GPT-4“同代”的水平。Grok1.5V具有多模態(tài)能力,且各項(xiàng)指標(biāo)與GPT4不分伯仲。Mistreal近期流出的基于Llama2訓(xùn)練的Miqu 70B模型據(jù)EQbenchmark測(cè)試也和GPT4能力相近。

 

 

2023年,外國(guó)媒體報(bào)道谷歌曾經(jīng)流出一份文件,主題是“我們沒(méi)有『護(hù)城河』,OpenAI 也沒(méi)有。當(dāng)我們還在爭(zhēng)吵時(shí),第三方已經(jīng)悄悄地?fù)屃宋覀兊娘埻搿_(kāi)源?!?/strong>

 

這份文件認(rèn)為,現(xiàn)在的一些開(kāi)源和閉源模型的差距正在以驚人的速度縮小。開(kāi)源模型更快、可定制性更強(qiáng)、更私密,而且功能性也不落下風(fēng)?!皫缀跞魏稳硕寄馨凑兆约旱南敕▽?shí)現(xiàn)模型微調(diào),到時(shí)候一天之內(nèi)的訓(xùn)練周期將成為常態(tài)。以這樣的速度,微調(diào)的累積效應(yīng)將很快幫助小模型克服體量上的劣勢(shì)。

 

連谷歌都不得不面對(duì)這樣的難題,開(kāi)源模型,正在從能力上不斷接近閉源模型,而從商業(yè)上,也在蠶食威脅閉源模型的護(hù)城河。

 

從技術(shù)發(fā)展的歷史規(guī)律來(lái)看。技術(shù)發(fā)展的曲線必然會(huì)經(jīng)歷從陡峭到放緩的階段,這就意味著,即使領(lǐng)先者一開(kāi)始“遙遙領(lǐng)先”,后來(lái)者也會(huì)逐漸追上,并逐漸縮短與領(lǐng)先者的差距。

 

隨著Llama3一起發(fā)布的,還有扎克伯格的一個(gè)專訪,他對(duì)于大模型的Scaling law這條路持有比較悲觀的態(tài)度,他認(rèn)為從現(xiàn)在開(kāi)始,進(jìn)展將是漸進(jìn)式的。2025年前不會(huì)有通用人工智能(AGI)出現(xiàn)。

 

這也就意味著大模型技術(shù)迭代速度可能會(huì)慢下來(lái),是否開(kāi)源也會(huì)慢下來(lái)?開(kāi)源和閉源之間的差距,會(huì)縮小嗎?

 

開(kāi)源還是閉源,究竟如何選?

 

選擇開(kāi)源還是閉源?對(duì)于企業(yè)用戶來(lái)講,最優(yōu)先的問(wèn)題只有一個(gè),哪個(gè)性價(jià)比更高?

 

清華大學(xué)汪玉教授曾經(jīng)在一次公開(kāi)演講上給出了使用GPT系列模型的推理成本,如下圖所示:

 

如果使用閉源模型做API運(yùn)營(yíng),假設(shè)GPT-4 Turbo每天要為10億活躍用戶提供服務(wù),每年的算力成本可能超過(guò)兩千億。目前很多公司的收入規(guī)模也就在億級(jí),即使用戶規(guī)模不會(huì)有這么大,但是算力的成本也很難支撐自身業(yè)務(wù),從而形成有盈利的商業(yè)閉環(huán)。

 

但如果用GPT3.5的話,推理價(jià)格會(huì)大大降低。OpenAI在定價(jià)策略上為了打壓競(jìng)爭(zhēng)對(duì)手,將GPT3.5的定價(jià)定的非常低廉,100萬(wàn)token只需要1美元,而與其對(duì)應(yīng)的同水平Llama2 70B模型在大多數(shù)情況下使用快速API,定價(jià)都要1美元/100萬(wàn)token乃至更高。Mixtral-8x7b的價(jià)格也要0.7美元/100萬(wàn)token,相對(duì)OpenAI的報(bào)價(jià)優(yōu)勢(shì)有限。當(dāng)然開(kāi)源模型還有本地部署的優(yōu)勢(shì)。在本地運(yùn)行的情況下,其成本就只有硬件費(fèi)用和電費(fèi)了,這對(duì)于有云服務(wù)能力或者硬件基礎(chǔ)的大公司來(lái)說(shuō)肯定是最經(jīng)濟(jì)的選擇。當(dāng)然這種底子并非人人都有。

 

對(duì)于初創(chuàng)企業(yè)來(lái)講,想做個(gè)性化應(yīng)用,更多是先要擁有自己的專有微調(diào)模型。這就涉及到微調(diào)訓(xùn)練費(fèi)用的問(wèn)題。在開(kāi)源模型上進(jìn)行相應(yīng)的訓(xùn)練和微調(diào)的話,Llama2 的優(yōu)勢(shì)就很明顯了。云服務(wù)商Anyscale 提供的價(jià)格中,70b版本只需4美元/100萬(wàn)token。GPT3.5則比它整整貴一倍要8美元/100萬(wàn)token。所以當(dāng)你想真正為自己的業(yè)務(wù)建構(gòu)專用模型時(shí),從成本角度看,開(kāi)源模型還是有一定優(yōu)勢(shì)的。

 

 

在節(jié)省成本這方面,創(chuàng)業(yè)公司還能再精細(xì)化一步。很多公司都選擇了多種模型混用。通用大模型的性能固然出色,但是在實(shí)際應(yīng)用中,使用中小型開(kāi)源模型,并用特定數(shù)據(jù)微調(diào),最終達(dá)到的效果可能更好。

 

如果用閉源模型,100萬(wàn)token消耗速度很快,成本遠(yuǎn)高于0.6美元每小時(shí)。LeptonAI創(chuàng)始人賈揚(yáng)清曾經(jīng)在一次閉門(mén)活動(dòng)中分享過(guò):在北美,很多企業(yè)都是先用閉源大模型來(lái)做實(shí)驗(yàn)(比如OpenAI的模型)。實(shí)驗(yàn)規(guī)模大概在幾百個(gè)million(百萬(wàn)token),成本大概為幾千美元。一旦數(shù)據(jù)飛輪運(yùn)轉(zhuǎn)起來(lái),再把已有數(shù)據(jù)存下來(lái),用較小的開(kāi)源模型微調(diào)自己的模型?,F(xiàn)在這已經(jīng)變成了相對(duì)比較標(biāo)準(zhǔn)的模式。

 

國(guó)內(nèi)另外一家使用大模型構(gòu)建業(yè)務(wù)的公司的相關(guān)負(fù)責(zé)人也表示,“企業(yè)級(jí)應(yīng)用,不太會(huì)用到單一模型,現(xiàn)在已經(jīng)開(kāi)始按照應(yīng)用目的分模型了,但是跨系統(tǒng)調(diào)度的帶寬成本更高。所以,一個(gè)系統(tǒng)里面,有高中低(參數(shù))模型混合的模式是企業(yè)應(yīng)用現(xiàn)在合理的方案。

 

開(kāi)源與閉源,并不是企業(yè)考慮的最核心因素,最優(yōu)性價(jià)比、企業(yè)的數(shù)據(jù)安全,能助力企業(yè)未來(lái)戰(zhàn)略的發(fā)展,可能才是選擇的優(yōu)先點(diǎn)。

 

開(kāi)源閉源之爭(zhēng),爭(zhēng)論的到底是什么?

 

李彥宏的開(kāi)源觀點(diǎn),之所以引起這么大的關(guān)注,也是因?yàn)?,目前各家企業(yè)都在探索在大模型時(shí)代,如何找到PMF(Product Market Fit)。

 

百度對(duì)于公有大模型生態(tài)的布局,是比較早的,對(duì)于百度來(lái)說(shuō),模型本身也是產(chǎn)品。

 

據(jù)媒體消息,金沙江創(chuàng)投主管合伙人朱嘯虎在行業(yè)微信群中表示:“GPT-4能實(shí)現(xiàn)90%以上的商業(yè)需求,開(kāi)閉源無(wú)所謂了,以后大模型API就是自來(lái)水的價(jià)格。但是用戶需要的是純凈水,氣泡水,烏龍茶……”

 

純凈水、氣泡水、烏龍茶是多樣化的產(chǎn)品形態(tài)思考,針對(duì)了用戶多樣化的需求。

 

發(fā)布會(huì)的第二天,賈揚(yáng)清在朋友圈發(fā)表了一個(gè)觀點(diǎn)“我覺(jué)得Robin這點(diǎn)說(shuō)得非常對(duì),在初始的應(yīng)用嘗試過(guò)去之后,模型的特化會(huì)是一個(gè)從效果上和從性價(jià)比上更加make sense的選擇。”普通大眾的關(guān)注點(diǎn),可能是李彥宏在發(fā)布會(huì)上究竟說(shuō)得對(duì)不對(duì),產(chǎn)業(yè)內(nèi)的人,關(guān)注的其實(shí)是,開(kāi)源閉源爭(zhēng)論的背后,以模型作為產(chǎn)品的公司,究竟如何打造商業(yè)閉環(huán),未來(lái)的增長(zhǎng)空間在哪里?!耙云脚_(tái)化產(chǎn)品,實(shí)現(xiàn)模型的特化部署、從訓(xùn)練到商業(yè)化落地、到模型迭代再訓(xùn)練,實(shí)現(xiàn)最高效率和最優(yōu)性價(jià)比?!?/p>

 

 

而開(kāi)源模型的頭部企業(yè),如Meta,提供的是未經(jīng)封裝的更原始的技術(shù)創(chuàng)新。他們本身有雄厚的算力資源、研發(fā)團(tuán)隊(duì)及資金實(shí)力,能夠以技術(shù)影響力,實(shí)現(xiàn)生態(tài)布局。最終帶來(lái)商業(yè)價(jià)值的,可能不是產(chǎn)品本身,而是基于生態(tài)衍生出來(lái)的更多的技術(shù)服務(wù)費(fèi)用、咨詢費(fèi)用等。

 

扎克伯格專訪中表示,如果模型本身就是產(chǎn)品, Meta會(huì)考慮停止開(kāi)源,“也許模型最終更像是產(chǎn)品本身。我認(rèn)為這時(shí)候,是否開(kāi)源就是一個(gè)更棘手的經(jīng)濟(jì)考量了。”

 

堅(jiān)持Scaling law的閉源模型面對(duì)一個(gè)難解的矛盾,一方面,scaling law(規(guī)模定律)的路還沒(méi)走到盡頭,巨大的投入還將持續(xù),而且不能公開(kāi)技術(shù)的秘密;另一方面,免費(fèi)、高質(zhì)量、有極高性價(jià)比的開(kāi)源模型,又讓持續(xù)燒錢(qián)的閉源大模型壓力巨大。

 

就在最近,OpenAI頂著壓力修改了API付費(fèi)模式,從先用后付,改成了pre-paid。對(duì)OpenAI來(lái)說(shuō),這樣的模式減少了壞賬率、增加了資金回籠的速度,從某些方面來(lái)講,可以稍稍緩解資金的壓力。但是從應(yīng)用API的企業(yè)來(lái)講,按照之前的最長(zhǎng)60天左右的賬期,等于企業(yè)增加了60天的資金占用成本。OpenAI變相漲價(jià)了。

 

在這個(gè)定價(jià)策略推出不久,Llama3就發(fā)布了中小規(guī)模版本。一個(gè)能和GPT-4差不多,而且優(yōu)化過(guò)性能,可以在小算力硬件下運(yùn)行的模型,甚至直接給閉源模型帶來(lái)了一堆競(jìng)爭(zhēng)對(duì)手。

 

性能優(yōu)秀的大規(guī)模開(kāi)源模型,為其它科研機(jī)構(gòu)及有更宏大目標(biāo)的商業(yè)機(jī)構(gòu),提供了更好的技術(shù)參考路徑,可能大大提高科研效率、縮短到達(dá)目標(biāo)的時(shí)間。而中小規(guī)模模型,確是商業(yè)上閉源大模型的競(jìng)爭(zhēng)對(duì)手。

 

企業(yè)看到了基于開(kāi)源中小模型,自己擁有私有模型、保障數(shù)據(jù)安全、搭建應(yīng)用、上下游通吃,完成自我閉環(huán)的希望。

 

這全部的鏈條,其實(shí)也可以在模型公司的平臺(tái)上一站式完成,這部分的市場(chǎng),其實(shí)被開(kāi)源模型“無(wú)心”地侵占了很多。

 

從競(jìng)爭(zhēng)的角度來(lái)講,如果Meta采取閉源的策略,在同一個(gè)賽道上,可能永遠(yuǎn)都不能顛覆OpenAI成為引領(lǐng)者,而另辟蹊徑的開(kāi)源策略,讓Meta搶到了開(kāi)源大模型的頭把交椅,暫時(shí)坐穩(wěn)了另外一個(gè)生態(tài)的王座。而迅速開(kāi)源Grok模型的馬斯克,也許暫時(shí)只是想給“Closed AI”和Sam Altman制造另外一個(gè)的競(jìng)爭(zhēng)對(duì)手……

 

 

這場(chǎng)開(kāi)源與閉源之爭(zhēng)的另外一個(gè)焦點(diǎn)人物是,“開(kāi)源的堅(jiān)決擁護(hù)者”周鴻祎。 其實(shí)周鴻祎和李彥宏,兩個(gè)人根本不存在對(duì)立的觀點(diǎn)。 周鴻祎主要從產(chǎn)業(yè)發(fā)展的宏觀方向來(lái)講,“我們要善用開(kāi)源、利用開(kāi)源,通過(guò)開(kāi)源來(lái)學(xué)習(xí),快速提高人工智能的核心能力。 ”他也補(bǔ)充了自己的觀點(diǎn),開(kāi)源和閉源是兩種不同的商業(yè)模式,沒(méi)有必要相互貶低。 安卓和iOS,Linux和Windows都是一個(gè)開(kāi)源一個(gè)閉源,也都活得很好。 ”

 

從商業(yè)角度來(lái)講,360并不是一家模型公司,而模型也不是360的主要產(chǎn)品,這和百度是有本質(zhì)區(qū)別的。360目前推出了AI瀏覽器,和AI辦公全家桶等基于模型的應(yīng)用。開(kāi)源生態(tài)越繁榮,這意味著,公司可以有更多樣的選擇。

 

也有公司選擇了既開(kāi)源又閉源的雙輪驅(qū)動(dòng)模式,以開(kāi)源切入大模型賽道的百川智能,在發(fā)布完Baichuan-7B、Baichuan-13B開(kāi)源大模型后,又拿出了Baichuan-53B閉源大模型。在Baichuan-53B發(fā)布會(huì)的媒體溝通會(huì)上,王小川被問(wèn)到為什么沒(méi)有繼續(xù)開(kāi)源,他回答稱:“模型變大之后沒(méi)有走開(kāi)源的這樣一種方式,因?yàn)榇蠹也渴鹌饋?lái)成本也會(huì)非常的高,就使用閉源模式讓大家在網(wǎng)上調(diào)用API”。

 

“1.關(guān)于開(kāi)閉源之爭(zhēng),核心是要看誰(shuí)在開(kāi)源。2.雙輪驅(qū)動(dòng),是一線創(chuàng)業(yè)AGI公司的唯一解?!备鶕?jù)第一財(cái)經(jīng)報(bào)道,百川智能CEO王小川在行業(yè)微信群討論中發(fā)表了以上觀點(diǎn)。王小川認(rèn)為,“從To B角度,開(kāi)源閉源其實(shí)都需要。未來(lái)80%的企業(yè)會(huì)用到開(kāi)源的大模型,因?yàn)殚]源沒(méi)有辦法對(duì)產(chǎn)品做更好的適配,或者成本特別高,閉源可以給剩下的 20%提供服務(wù)。二者不是競(jìng)爭(zhēng)關(guān)系,而是在不同產(chǎn)品中互補(bǔ)的關(guān)系。”

 

開(kāi)源和閉源,本來(lái)就不是單選題,而是一個(gè)綜合應(yīng)用題。如果資源夠、決心夠,完全可以既通過(guò)開(kāi)源顯示技術(shù)實(shí)力、獲得更多的技術(shù)和數(shù)據(jù)反饋、打造開(kāi)源生態(tài);又通過(guò)強(qiáng)大的閉源模型將其封裝為產(chǎn)品,直接實(shí)現(xiàn)商業(yè)化變現(xiàn)。

 

王小川也認(rèn)為,開(kāi)源和閉源并不像手機(jī)中iOS或者安卓操作系統(tǒng)只能二選一,開(kāi)源確實(shí)容易“建立人品”,“朋友多多的”,讓大家迅速了解和評(píng)測(cè)大模型的好壞。同時(shí)開(kāi)源也是為商業(yè)化做準(zhǔn)備,如果大家用起來(lái)覺(jué)得不錯(cuò),當(dāng)需要更好的服務(wù)和更大的參數(shù)時(shí),可以探索進(jìn)一步的商業(yè)化路徑。

 

一場(chǎng)關(guān)于開(kāi)源與閉源的爭(zhēng)論背后,其實(shí)是科技公司在大模型時(shí)代的開(kāi)端認(rèn)真思考的生態(tài)演變過(guò)程。

 

大模型的生態(tài)發(fā)展究竟會(huì)如何演變?大模型時(shí)代的開(kāi)源,又會(huì)呈現(xiàn)出哪些不同的特點(diǎn)?

 

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com