大型時代的芯片,要怎么造?
四月十六日,李彥宏在百度AI開發(fā)者大會上給出了文心經(jīng)歷2023年百模大戰(zhàn)后的戰(zhàn)況數(shù)據(jù):
用戶數(shù)量超過2億,服務企業(yè)8.5萬,AI原生應用超過19萬。。
另外,他還透露,每天在百度內(nèi)部添加27%的新代碼是由Comate(AI代碼助手)生成。
百度給出的這組數(shù)據(jù),作為我國布局最激進的互聯(lián)網(wǎng)巨頭之一,印證了大模型對互聯(lián)網(wǎng)公司的巨大影響。
實際上,大型模型帶來的影響遠不止于此,李彥宏說:“未來的開發(fā)應用將像拍攝短片一樣簡單。
或許正是在這一波變革的漩渦中,或者是錯過了云計算那一波時代的紅利,李彥宏對大模型發(fā)表的言論一直非常激進。
無論大模型能否像李彥宏預期的那樣顛覆互聯(lián)網(wǎng)時代的生產(chǎn)模式,一個不容忽視的事實是,這波大模型浪潮的背后,本質(zhì)上還是一場算率之爭。
如果你想在大模型時代獲得先機,先進的制芯片研發(fā),如訪存密集、近存計算、類腦計算、存算一體化等。,是不可回避的競爭焦點。
就在上周,在第十三屆吳文俊人工智能科學技術(shù)獎頒獎典禮的一系列活動中,圓桌討論了大模型時代芯片產(chǎn)業(yè)的發(fā)展。
在圓桌上,四位芯片領域?qū)<遥謩e是中國科學院自動化研究所研究員&中國科學院南京人工智能創(chuàng)新研究所副院長程健、中國科學院微電子研究員尚德龍、上海科技大學教授哈亞軍、北京憶芯科技有限公司首席架構(gòu)師黃好城:
1、大型云端芯片需要什么樣的大型模型?
2、為了實現(xiàn)通用人工智能,機器人需要什么樣的芯片?
3、大型模型在ic設計中的應用是什么?
4、芯片業(yè)需要什么樣的生態(tài)?
四大關(guān)鍵問題展開了激烈的討論。
本論文對這次圓桌討論的內(nèi)容進行了不改變本意的整理,供大家參考。
01 云端芯片在大模型時代。
問題:在大模型時代,云、邊、端芯片各有哪些發(fā)展機遇和挑戰(zhàn)?
程?。?/strong>要回答這個問題,我們首先要看的是,今天所謂的大模型和過去的傳統(tǒng)模型有什么不同。
這些差別很大,但本質(zhì)上沒有太大的差別,特別是芯片架構(gòu)上沒有太大的差別。
第一個是云芯片,我們看看今天英偉達的GPU,它是通過不斷地堆積顯存,擴大帶寬來提高性能,除了技術(shù)改進之外,更多的是通過增加硬件成本來提高算率。
對于我們來說,要想超越彎道,就得看能不能通過。存算一體化,三維堆疊等待形式,探索一些新的路徑。
云追求的是奧運精神,更快、更高、更強,在邊緣和終端方面,與云有著不同的場景和需求。
由于邊緣和終端側(cè),受體積、成本、功耗等限制。,不能追求更高、更快、更強,特別是還有不同的場景和應用需求。事實上,為我們制作芯片提供了更多的機會。。
例如很多團隊把模型和算法結(jié)合起來,一些芯片架構(gòu)也發(fā)生了變化,比如ASIC模式。
其中有許多東西可以做,需要定制,也有更多的機會。
尚德龍:大模型需要高計算能力,這是一個挑戰(zhàn),也是一個機會,我同意程老師的觀點。
本質(zhì)上,大型模型是一種生成式AI模型,生成AI模型的一個主要缺陷是無法生成知識。,無法產(chǎn)生知識如何呈現(xiàn)通用智能,這是我要問的一個問題。
就云端的機會而言,不要只看芯片,還要結(jié)合算法來討論。
類腦計算本身就是一個很大的系統(tǒng),我們能不能?通用人工智能可以從現(xiàn)有算法和類腦算法的結(jié)合中實現(xiàn)。,那是一個值得思考的問題。
另外一方面,類腦計算的一個重要起點是高效率,人腦功率不到20瓦,一天饅頭頂沒問題;
一臺機器的功率是幾百瓦,上KW,我們能不能?在算法設計理念上,云端的一些創(chuàng)新設計理念是通過結(jié)合來實現(xiàn)的。。
目前,無論是先進的結(jié)構(gòu)、先進的包裝還是Chiplet,即使很多芯片被包裝在一起,功耗仍然是一個問題,在云端使用時會有一些限制。
為了促進這些領域的發(fā)展,需要一些新的設計方法、設計構(gòu)思。
哈亞軍:如今,我們已經(jīng)進入了一個通用智能時代,很多時候,每個人都想用一個平臺來解決通用問題。
事實上,在各種模型出現(xiàn)之前,計算架構(gòu)也出現(xiàn)了類似的問題——是應該使用一個通用的計算平臺,還是應該使用一個特殊的計算平臺來解決問題?
從我的經(jīng)驗來看,通用芯片市場非常大,難度也很大,所以只有大公司、大團隊、大資本才有實力進入這條賽道。,因為許多東西都是通用的,你需要有生態(tài),工具應用。
特殊芯片的優(yōu)點是應用清晰,目標場景清晰。,您可以找到一些約束,針對約束不斷進行優(yōu)化,對生態(tài)等方面的要求相對較少,這樣更適合大學和小公司來做。
根據(jù)以往計算平臺的發(fā)展經(jīng)驗,大公司玩通用生存,小公司在專門的計算平臺上有更多的機會。。
同樣的經(jīng)驗也適用于大模型技術(shù)的發(fā)展。
大型模型強調(diào)通用性,但從模型設計的角度來看,一般大型模型很難通吃天下,許多場景下,有些特殊的場景。(?。?strong>模型仍然會有一席之地。。
黃好城:我公司成立于2015年,從存儲芯片開始。
伴隨著大型模型的出現(xiàn)和AI技術(shù)的發(fā)展,每個芯片都嵌入了AI相關(guān)功能。,例如,存算一體化,這項技術(shù)的出現(xiàn)給我們公司和國內(nèi)許多非大型芯片公司帶來了機遇和挑戰(zhàn)。
就機會而言,大型模型對所有計算、存儲和傳輸都有更高的要求。例如,存儲的數(shù)據(jù)越來越多,云和邊緣存儲的內(nèi)容越來越多,對帶寬和延遲的要求也越來越高。
就挑戰(zhàn)而言,一方面,大型模型對服務器的主板芯片要求很高,消耗了大量的能源、資源和碳排放。這反饋到ic設計中,就變成了究竟應該如何設計芯片的架構(gòu)和每一個模塊?。
從我們公司的角度來看,在功耗設計方面,每個芯片都對我們提出了更高的要求,從工藝選擇、IP選擇到每個模塊的低功耗設計,從而降低能耗,提高我們的產(chǎn)品競爭力。

同時,隨著大模型應用的研發(fā),我們對于存儲內(nèi)容的安全性也有更高的要求。。
我們存儲的數(shù)據(jù)是否得到了更好的加密和保護,是否可以被盜或檢測到。隨著國家一級、二級、三級的提出,我們在研發(fā)芯片進行數(shù)據(jù)安全保護時,對應的要求也越來越高。
02 通用機器人,需要什么樣的芯片?
問題:如何設計機器人智能芯片,促進通用人工智能的發(fā)展?
程?。?/strong>設計芯片,首先要了解芯片要解決哪些問題。
機器人需要解決的問題感知、規(guī)劃、決策、控制幾個相關(guān)問題。
在這些方面遇到的問題,所需的算法和軟件之間存在一些差異。
比如我們以前很多機器人都是圍繞MCU進行控制,做一些簡單的計算,很多決策都是手工編制的,所以也很簡單。
但今天是模型時代,原來很多人工編寫的計劃、決策算法,今天要用大模型來生成。,因此,對于機器人芯片的使用提出了更高的要求:
第一,端面主板芯片需要更大的算率;
要求端側(cè)主板芯片根據(jù)大模型實現(xiàn)感知、認知,提供更大的算率。
第二,是否可以基于一個芯片來實現(xiàn)端邊算率?;
端側(cè)要求的高計算能力不同于云端的高計算能力。云需要做大量的決策和規(guī)劃。端側(cè)的計算不同于GPU中的張量計算。我們能否將這些端側(cè)的計算需求放在一個芯片上,而不是用幾個芯片分開來實現(xiàn)?
第三,機器人需要大量的智能和自主性。
我們可以看到,除了感知、規(guī)劃、決策、控制之外,越來越多的機器人需要更多的智能和自主。
例如,機器人現(xiàn)在可以不斷地與環(huán)境互動和獨立學習,這需要大量的計算來加強學習。這種計算不同于張量計算。現(xiàn)在加強學習有很多分支,有的是基于transformer,有的是基于傳統(tǒng)的馬爾可夫。
這類機器人應用程序需要大量的計算、取樣和迭代,對芯片提出了許多新的要求。
尚德龍:具體服務機器人更注重擬人。,現(xiàn)在市場上的機器人顯然沒有這種特性。
可以看出,酒店的配送機器人和公園里的清潔機器人遇到人時,通常會先停下來,然后慢慢繞道。他們行動很慢,給人一種不好的感覺。
為了實現(xiàn)更好的體驗,感知、決策必須特別快,如果遵循當前的計算系統(tǒng),毫無疑問,大算率是我們需要的。
若不考慮設計方法,大算率相當于大功耗,現(xiàn)在電池技術(shù)的發(fā)展還跟不上計算的發(fā)展,這種技術(shù)路徑顯然很難走下去。,這些都需要我們有新的創(chuàng)新。
類腦計算、大型模型等都是新的創(chuàng)新。
如今的計算、決策、智能,我自己的一個“偏見”就是,它是一種計算感知,一種計算決策,一種計算智能,它非常耗能。。
能否成為一個真正像人類一樣的智能體,是機器人未來發(fā)展應該考慮的問題。
特別是未來的具體服務機器人,例如,未來如果居家老人對康養(yǎng)機器人的感覺很不好,這樣的機器人市場也不會很好。
我是做類腦計算的,我還是很佩服的。將現(xiàn)有的計算機制與類腦計算系統(tǒng)相結(jié)合,從而找到新的突破口。。
哈亞軍:關(guān)于這一問題,我有兩種感覺:
首先,通用智能要與機器人相結(jié)合,意味著芯片研究的前沿重點要從云端慢慢發(fā)展到邊緣端,邊緣芯片研究將變得越來越重要。
由于本質(zhì)上,機器人是一個邊緣平臺。。
從最近行業(yè)的發(fā)展可以看出,很多企業(yè),尤其是原來做算法的企業(yè),都在布局芯片行業(yè)。相信未來邊緣端的機器人廠商會有更多的布局。
其次,雖然大模型似乎可以解決機器人遇到的所有問題,但我個人并不這么認為,無論是機器人還是無人駕駛汽車,這個算法很難解決他們遇到的所有問題。
有時候機器人對決策的準確性要求很高。即使機器人達到了99.9%的決策準確性,當機器人真正與人打交道時,我們對某些情況的準確性需求可能是100%。
在這個時候,我們不能完全依賴智能計算。
我們?nèi)匀恍枰獋鹘y(tǒng)的算法才能智能計算出來。
在我看來,傳統(tǒng)算法不能丟失,在未來的世界里,傳統(tǒng)算法和智能算法將并存,通過各種方式提高決策的準確性。。
黃好城:人的聰明程度取決于以前所學的知識,我們的大腦將以前所學的知識儲存為記憶,能否很好地利用以前的記憶,決定了人類的聰明程度。。
例如,當老年人患上老年癡呆癥,失去記憶時,他的智力也無法體現(xiàn)出來。
我們會不斷感知周圍的環(huán)境,在服務機器人上做圖像和視頻學習。在這個過程中,儲存的大量數(shù)據(jù)是否得到了更好的利用,云端和邊緣是否得到了更好的訓練,關(guān)系到機器人是否足夠智能。
當機器人在許多應用領域或處理緊急情況時,它不能從一開始就很好地模擬和訓練。如果你想進入千家萬戶,你需要不斷學習和進步,尤其是服務機器人設備。通過高效利用本地存儲資源,實現(xiàn)智能化。
前面提到的近期存儲計算,通過對邊緣端存儲的數(shù)據(jù)進行重新分類和預處理,甚至將一些類決策放入邊緣端和靠近存儲的計算芯片中,一方面可以帶來更低的功耗收益,使機器人的續(xù)航性能更好,另一方面可以減少機器人對主計算單元的依賴。
03 在ic設計中使用大模型。
問題:ic設計中如何應用AI算法?
黃好城:我們確實看到AI已經(jīng)開始幫助工程師打代碼了。然而,在芯片設計過程中,目前的AI技術(shù)幫助工程師打代碼而不是工程師。
AI技術(shù)在設計方法上帶來了許多輸入,工程師省略了寫作細節(jié),重復模塊代碼。,可替代AI幫助您生成。
在使用了更多的AI輔助工具之后,工程師將有更多的精力參與到更高級的工作中,作為一些架構(gòu)師的角色。
她們不再需要做設計驗證,更多的是做A。、B、綜合選擇C方案,對比每一個ic設計的模塊化方案,這樣可以做出更好的PPA。(Performance、Power、Area)評估,而非放到最后,等架構(gòu)師得到ic設計方案后,再進行數(shù)據(jù)流、特性的模擬驗證。
這樣可以很好地提高芯片前端設計。
芯片當然不僅僅是前端設計,還有后端物理實現(xiàn)。
AI在后端物理實現(xiàn)中也有很多應用,因為物理實現(xiàn)中有很多自動布局布線的工作,原來都是靠EDA軟件來完成的。
目前我們正與國內(nèi)一些廠商一起進行AI算法的組合,提高走線自動布局的效率,嘗試各種放置方式,使芯片面積做得更好更合理。
哈亞軍:總而言之,這個問題就是,AI for IC、IC for AI。
如你所見,國內(nèi)外很多EDA公司的確在整個EDA公司。 在flow的各個階段,我們可以看到許多這樣的例子,考慮使人工智能改變以前的設計方法或工具。
另外,IC還能加快智能EDA工具的發(fā)展。
尚德龍:我是國內(nèi)較早接觸EDA工具的人。
實際上,新技術(shù)的發(fā)展已經(jīng)不斷地融入到芯片設計過程中,現(xiàn)在人工智能技術(shù)的發(fā)展也將融入到IC設計過程中。
不過,包含IBM、Intel,他們的核心X86芯片不是基于EDA工具,而是一個7-8人的小團隊。。
因此,在我看來,AI可以賦能IC。從技術(shù)發(fā)展的角度來看,AI確實在逐步提高EDA工具的效率和水平。然而,如果AI想取代設計師做包羅萬象的ic設計工作,還需要時間。
程健:我比尚老師更激進,我個人認為,至少在ic設計領域,AI技術(shù)必將完全取代人類。。
之所以這么說,是因為,參照人工智能技術(shù)的發(fā)展經(jīng)驗,AI能做的就是下圍棋、玩游戲等有明確規(guī)則的事情。
以下圍棋為例,AI不僅可以下圍棋,而且可以清楚地看到對手是如何下圍棋的。在這種情況下,AI往往比人們做得更好。
再來看看ic設計,ic設計的目標也很明確,重點是面積、功耗、功能,這是一個可以規(guī)則化、量化的目標。,而且芯片走線,布局也有明確的要求。
從這個角度來看,我認為AI的ic設計必然會取代人類,而且肯定會比人類做得更好。當然,這需要時間。
目前我們的AI布局、走線都做得很好,但做ic設計還存在一些問題,有哪些方面?
我舉三個例子:
首先,基于神經(jīng)網(wǎng)絡或transformer的AI模型目前正在進行。仍然缺乏執(zhí)行任務的準確性。。
ic設計通常需要高精度,中間有一個小BUG,整個芯片都被廢除了。如何在AIic設計中體現(xiàn)未來的準確性,使其越來越準確,是一個有待解決的問題。
第二,需要將工程師的經(jīng)驗和知識轉(zhuǎn)化為可量化的數(shù)據(jù)。
很多ic設計都是工程師積累的長期經(jīng)驗。這些經(jīng)歷有的是知識,有的是可以描述的,有的是無法描述的。這就需要將這些經(jīng)驗和知識轉(zhuǎn)化為可以量化和規(guī)則化AI學習的數(shù)據(jù)。
第三,很難獲得ic設計的數(shù)據(jù)。。
由于DeepMind在設計AlphaGo時收集了大量的棋譜,AI下圍棋下得很好,可以說沒有AlphaGo沒有學過的棋譜。
在芯片行業(yè),互聯(lián)網(wǎng)上找不到很多信息,開源項目很少。很多芯片公司只能獲得一些數(shù)據(jù),這對AI學習來說是一個很大的問題。
在我看來,如果能夠解決這三個問題,未來AI肯定能夠取代人類進行ic設計。
04 生態(tài)學是AI芯片的重點
問題:如何從技術(shù)創(chuàng)新、人才培養(yǎng)、市場需求三個方面共同推進芯片生態(tài)建設?
黃好城:在我看來,最重要的是市場需求。
客戶和消費者只有在需要產(chǎn)品的時候才會花錢買單。只有在這些資金的支持下,他們才能促進公司的發(fā)展,促進產(chǎn)學研合作,每個人都有一個良好的就業(yè)環(huán)境,這是一種供求關(guān)系。
現(xiàn)在國內(nèi)的一個好趨勢是,各大甲方都更愿意使用國產(chǎn)芯片和存儲產(chǎn)品。,不只是嘗試,而是大規(guī)模出貨。
對于芯片公司來說,當我們開發(fā)新一代主板芯片時,我們也愿意使用國內(nèi)IP公司提供的IP產(chǎn)品,我們目前的控制器,Chiplet技術(shù),甚至RISC-V 國內(nèi)供應商已使用CPU。
在使用了國內(nèi)供應商的CPU之后,我們也在幫助他們調(diào)試他們的CPU,并給他們很多建議。
就學校而言,每年都有更多優(yōu)秀的畢業(yè)生帶著自己在學校掌握的AI技術(shù)進入公司,這也是企業(yè)的好資源,讓我們的整個生態(tài)不斷發(fā)展。
哈亞軍:本人重點介紹人才培養(yǎng)。
不管是芯片還是人工智能,這兩個行業(yè)都有一個特點,從某種意義上說,行業(yè)領先于學術(shù)界,對于人才培養(yǎng)有很多特殊要求。
就人才培養(yǎng)而言,過去更注重培養(yǎng)學生,而要把這件事做好,其實,教師還需要培養(yǎng),因此,我們需要建立一個新的工程培訓體系,這個體系既可以培養(yǎng)學生,也可以培養(yǎng)教師。
從教師培訓的角度來看,教師應該每隔幾年在企業(yè)呆上幾個月,了解公司的實際進展和需求,包括教師在學校講課的教材。學校的企業(yè)導師需要及時給出反饋,讓他們看看這些教材是否符合企業(yè)的需求。
就學生培養(yǎng)而言,要增加流片的機會,增加學生到企業(yè)實習,增加學校和公司共同做項目的機會。
學校和企業(yè)的定位差別很大,企業(yè)追求利潤,學校追求科學研究,雙方合作也需要完善的合作模式。。
尚德龍:我深深地感受到了這個問題,但我只想強調(diào)兩個字——生態(tài)。
商品生態(tài)、科研生態(tài)、人才培養(yǎng)生態(tài)、良好的生態(tài)才能真正做到這一點。
程?。?/strong>然后尚老師教的生態(tài),我想說,事實上,芯片從設計、生產(chǎn)、應用到反饋,形成積極的反饋是非常重要的。
其中一個重要環(huán)節(jié)是要有人用,只要使用它,就會有積極的迭代。
芯片越?jīng)]人用越難用,越難用越?jīng)]人用,會形成惡性循環(huán)。
如何使用?
這一問題并非哪個公司,哪個大學,甚至哪個環(huán)節(jié)可以解決,這是一個需要從整個生態(tài)學全局考慮的因素。
我們需要從人才培養(yǎng)、教育、企業(yè)等方面共同努力,給我們一些國產(chǎn)芯片的機會。
能否通過國家和公司共同推動我們的硬件生態(tài),將芯片非常便宜或免費送到高校進行人才培養(yǎng)使用。,在生態(tài)方面,我認為這是一個值得考慮的問題。
其次,任何行業(yè)都要做好人才培養(yǎng)工作,重要的是要“有利可圖”。
如今那么多人做AI,其實本質(zhì)上是因為今天大家在AI領域有很多工作機會,公司也可以賺錢。
事實上,芯片需要更多的錢,需要更多的時間,承擔更多的風險,走更長的路才能做好。
因此必須要有資金投入,單位和個人都可以在這一過程中賺到錢,才能把這件事做好。
只有BATH,還有國有企業(yè)和央企,為了實現(xiàn)大模型時代的芯片時代,這些真正有資源、有應用場景的公司加入進來。。
本文來自微信微信官方賬號“鋅產(chǎn)業(yè)”(ID:作者:山竹,36氪經(jīng)授權(quán)發(fā)布,xinchanye2021。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





