最近,在ChatGPT火了之后,國內互聯網科技圈不時傳出計劃或者正在研究類ChatGPT大模型的消息。
然而在相關技術真正面世之前,近日,OpenAI又放出新消息,該公司正式開放了ChatGPT的API接口,開發人員可以將ChatGPT模型集成到他們的應用程序和產品中。這意味著ChatGPT將會以更快的速度占領市場,因此國內企業在大模型的研究中更要加快進度。
在大模型發展中,國內具備了怎樣的條件
在類ChatGPT及其他大模型的發展中,國內是否具備相應的條件呢?登臨科技聯合創始人王平日前在接受電子發燒友采訪的時候談到了幾點:
他認為,國內在這方面是具備一定條件的,首先是數據,這是大模型技術中非常重要的一個生產要素,國內在數據上是有一定積累的;其次是人才,在這方面國內有不少優秀的算法人才,在大模型方面具備一定的知識基礎與經驗;此外,目前國內也有比較不錯的AI框架平臺以及具備核心技術完全自主研發能力的GPGPU廠商。整體來說整套的生產要素上都有一定的基礎,只不過在成熟度上跟OpenAI相比還存在一定差距。
具體來看,在AI框架方面,OpenAI能夠推出能力如此強大的ChatGPT,它應該有自己專門的框架。現在各種商用的框架,包括國產的飛槳paddlepaddle,以及Tensorflow或者Pytorch,其實更多是用于常規模型,而不是大模型的調度。因此在發展ChatGPT類大模型方面,還存在一些挑戰,需要去持續創新。
在人才方面,雖然目前國內具備一些算法相關的人才,然而整體而言是處于較為緊缺的狀態。另外大模型的訓練,也需要算法工程師具備豐富的經驗積累,因為模型太大,中間涉及很多技術,這并不是短時間砸錢就能達到的。
在硬件層面,國內的GPGPU具有自身的特色,甚至在一些領域比NVIDIA更具優勢,在ChatGPT或者相關大模型上,也有它的優勢。不過整體來看,還是存在差距,需要不斷進行創新和迭代,要不停的向前走。
大模型發展對GPGPU提出了怎樣的要求
ChatGPT火熱之后,可以明顯看到國內在AI大模型方面的發展將會加速,這對國內GPGPU來說意味著什么呢?大模型的發展,必然少不了GPGPU,GPGPU對于大模型就相當于是發動機之于汽車。王平認為,近十幾年AI的再度興起,到現在ChatGPT的爆火,以及未來AI產業的發展再上一個臺階,如果沒有GPGPU,這些都不大可能會實現。
因為每個大模型訓練和部署的背后,都有幾萬個GPGPU在支持。可想而知,未來隨著這方面的研發和應用的普及,GPGPU市場需求將會再度迎來爆發式增長。
以電力為例,就可以很清楚的看到這個市場未來可能發生的變化。幾十年前,電力只是用在一些小用量的場景,隨著電力的供給越來越多,電器也越來越多的時候,最后電力就成了一個基本設施。可以說,算力也是朝著基礎設施的方向在發展。在王平看來,現在GPGPU還遠沒有到爆炸式需求的階段。
當然在ChatGPT或者其他大模型訓練和部署,對GPGPU或者說算力也會有更高的要求。王平談到了幾個方面:
首先從單卡層面來看,先來看一組數據,1月份的時候ChatGPT的用戶數突破1億,日訪問量有幾千萬,在這種情況下,它的運營成本會相當高,每天的電費在幾十萬人民幣量級。這時候計算效率很重要,如果計算架構相比于傳統的GPGPU更有優勢的話,比如,登臨科技一些計算密度更大的產品,在計算效率上就更有優勢。
其次是單卡之外,卡片間的互聯也很重要。因為在用戶側工作的實際上是一個超級計算機系統,在訓練的時候,帶寬、片間、服務器間的信息傳遞很重要,這就需要針對大模型的訓練框架,在整個服務器集群的調度和協同工作中進行升級優化。
再者就是軟件方面,一般來說在軟硬件協同的系統里,軟件的重要作用不可忽視,因為一些軟件棧的原因,或者軟件協同調度的問題,硬件往往不能完全發揮出能力。所以我們經常可以看到,在一些場景下,軟件稍微進行優化,整體應用性能就會有百分之幾十,甚至百分之百的提升。
從硬件公司的角度來看,GPGPU是一個通用平臺,行業整體有產品異構化的走向,總體來說,GPGPU存在一些性能瓶頸。登臨科技是一家專注于高性能通用計算平臺的芯片研發與技術創新的公司,登臨自主研發的GPU+架構正式采用了軟件定義的片內異構體系,目前首款基于GPU+的系列產品—Goldwasser已在云至邊緣的各個應用場景實現規模化落地。據王平介紹:登臨科技希望通過異構,從由點及面在一些足夠大的市場領域,把產品做到比英偉達同系列產品更具性價比優勢,甚至超過英偉達。
帶著這樣的出發點,在大型語言模型方面,登臨科技會更關心如何更好的提升產品的能效比。簡單來說,在同樣功耗下,登臨科技可以提供英偉達1.5到2倍的算力,在算力一致的情況下,做到單位功耗更低這樣從計算的整體性能上實現英偉達同類產品的能效比3倍的優勢。如此一來,上面提到的電費、運維成本都將會有很大的節省。
小結
不難看出,以ChatGPT為代表的大語言模型發展和應用,對人們生產生活意義重大。隨著它的技術和應用逐步成熟,其對GPGPU等算力硬件的需求將會持續增加,就如同文中提到的電力的發展路徑一樣。當然大模型對GPGPU及算力集群系統的也有更高的要求,比如計算效率更高,能夠節省電費和運維成本等,可想而知,對于硬件公司來說,誰能夠在這方面更具優勢,誰就更能在未來大模型處處落地的時候,更占據優勢。
審核編輯 :李倩
-
算法
+關注
關注
23文章
4627瀏覽量
93166 -
API
+關注
關注
2文章
1509瀏覽量
62259 -
ChatGPT
+關注
關注
29文章
1566瀏覽量
7916 -
大模型
+關注
關注
2文章
2524瀏覽量
2991
原文標題:ChatGPT等大模型的發展,對GPGPU有怎樣的性能要求?
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論