原標題:國產AI芯片系統(tǒng)應練好“內功”
“大模型訓練需要大量數(shù)據(jù),因此對算力的要求很高?!痹谌涨罢匍_的首屆“AI Tech Day(人工智能科技日)”峰會上,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民介紹,自去年12月份以來,大模型需要的AI芯片漲價一倍,國外芯片“一卡難求”。盡管國內數(shù)十家公司在AI芯片研制和生產方面取得了很大進步,但國產芯片尚未受到市場的廣泛青睞。
對此,與會專家呼吁,解決算力難題,應重塑大模型算力生態(tài),助力國產AI芯片系統(tǒng)練好“內功”。
加強底層研發(fā),提升國產AI芯片“包容力”
“如果基于國外芯片編寫的軟件能夠很容易移植到我們的國產芯片系統(tǒng)上來,用戶就會感覺到國產芯片好用?!编嵕暶裾J為,但由于生態(tài)建設不完備,目前國產芯片在大模型訓練相關軟件移植方面表現(xiàn)不太順暢,因此需要進一步加強底層研發(fā),做好包括編程框架、并行加速、通信庫在內的軟件研發(fā)工作。
“為了發(fā)展AI芯片的生態(tài)體系,一些國際大企業(yè)甚至可以放棄一些高利潤的項目和方案?!庇⒉?shù)科CEO周韡韡介紹,營造生態(tài)需要發(fā)動整個行業(yè)的創(chuàng)新力量,例如國際企業(yè)曾通過主動開源部分軟件的底層代碼、讓利給基于芯片的軟件開發(fā)者,形成以AI芯片為核心的算力體系。
相較于芯片本身的硬件性能提升,鄭緯民認為,通過營造生態(tài),提升國產AI芯片的“包容力”更加急迫?!叭绻懔ι鷳B(tài)做得非常好,即使國產芯片的硬件性能只有國外性能的60%及以上,大家也會喜歡用。”鄭緯民說,但如果算力生態(tài)沒做好,新型軟件跑不起來、軟件移植不順暢,即便硬件性能達到國外的120%,照樣難以轉變?yōu)橛行懔Α?/p>
為凝聚行業(yè)力量、改變當前的大模型算力生態(tài),英博數(shù)科聯(lián)合百川智能、中國計算機學會、清華大學等單位共同成立北京AI創(chuàng)新賦能中心技術委員會。作為該技術委員會的顧問,清華大學電子工程系教授汪玉表示:“在大模型領域,我們將同時從軟件側和硬件側方面開展聯(lián)合優(yōu)化。在打造通用型人工智能服務平臺的同時,推動高性能計算領域智能芯片和高模態(tài)電路關鍵技術的研發(fā)?!?/p>
共建基礎生態(tài),推動現(xiàn)有算力融合創(chuàng)新
“大模型興起之前建設的算力,相對而言利用率較低,跟不上現(xiàn)階段大模型對算力指數(shù)級發(fā)展的需求?!卑鹱稍儺a業(yè)數(shù)字化研究院負責人徐樊磊介紹,為提升整體算力效率和滿足差異化需求,應建立支撐大模型萬億量級參數(shù)計算的“智算中心”?!爸撬阒行摹笨衫矛F(xiàn)有高質量數(shù)據(jù)中心,通過提升組網(wǎng)能力、協(xié)同能力、軟硬件適配能力等實現(xiàn)部署。當前,“萬卡”級別的智算中心正在主要節(jié)點城市發(fā)展起來。
與會專家認為,推動現(xiàn)有算力融合創(chuàng)新將進一步提升當前算力使用效率?!?萬塊卡(AI芯片)應該怎么連?是不是每塊卡和其他9999塊直連?如果這樣,中間的連接將需要1萬乘以9999個連接卡,成本將非常高。”鄭緯民說,通過最有效的連接支持模型并行、數(shù)據(jù)并行等不同的要求,是融合創(chuàng)新的關鍵。
大模型背后運行的是更加復雜的網(wǎng)絡架構和智能算法。如何在降本增效的同時,促進大模型算力使用門檻的降低?“‘云’模式是打通供需不對稱、達成算力普惠的有效路徑?!敝茼|韡表示,通過共享、共融集結現(xiàn)有算力,萬卡平臺及配備高效網(wǎng)絡交互機制的大模型訓練與推理平臺,可以開放給大企業(yè)、小微企業(yè)共用。通過搭載數(shù)據(jù)遷徙、訓練數(shù)據(jù)庫等工具,云平臺等基礎生態(tài)的搭建有望讓算力像水和電一樣隨取隨用。