ChatGPT這一語言AI模型的火爆出圈,引發了普羅大眾對AI應用的熱情的同時,也引燃了AI大模型的戰火。3月15日,OpenAI發布GPT-4,將這一戰火再度升級。
站在底層技術角度來看,從科技巨頭到互聯網大廠,從創業屆到學術屆,AI大模型正在成為各方搶灘市場的關鍵。目前,國內布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業,正在不斷夯實通用大模型,打造產業模型,助力AI大模型產業化。
其中,百度以文心大模型+飛槳PaddlePaddle深度學習平臺;騰訊以HunYuan大模型+太極機器學習平臺;阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了(自然語言處理)大模型 、(計算機視覺)大模型以及多模態大模型方面。
百度由于多年在AI領域的深耕,其文心大模型涵蓋基礎大模型、任務大模型、行業大模型的三級體系,打造大模型總量約40個,產業應用也較為廣泛,例如電力、燃氣、金融、航天等,構建了國內業界較大的產業大模型。
騰訊產業化應用方向則主要是騰訊自身生態的降本增效,其中廣告類應用表現出色。
阿里更重技術,例如M6大模型基于阿里云、達摩院打造的硬件優勢,可將大模型所需算力壓縮到極致;另外其底層技術優勢還有利于構建AI的統一底層。
華為的優勢則在于其訓練出業界首個2000 億參數以中文為核心的預訓練生成語言模型。目前發布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項較為重磅的行業大模型。
“AIGC專題:國內大模型概覽”舉了達摩院、百度、小米、中科院自動化所等國內部分企業、研究所關于大模型的研究成果、技術方案、落地實踐、未來發展規劃等方面的內容。
審核編輯 :李倩
-
AI
+關注
關注
87文章
31155瀏覽量
269489 -
模型
+關注
關注
1文章
3268瀏覽量
48927 -
機器學習
+關注
關注
66文章
8425瀏覽量
132775
原文標題:深度:國內AI大模型分析概覽
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論