年初以來,由ChatGPT掀起的人工智能浪潮,再一次催發了中國科技企業擁抱新興技術的熱情。不到半年時間里,百度“文心一言”、阿里“通義千問”、華為云“盤古”等國產自研AI大模型悉數登場。當科技巨頭們不約而同地踏上人工智能的新賽道,一場圍繞大模型的“軍備競賽”就在頃刻間拉開了序幕。
「通用」向左,「垂直」向右
過去幾個月,伴隨著ChatGPT的一路狂飆,AI大模型在中國的進化也來到了新的分野。一邊是通用大模型,因其經過了海量數據參數和龐大語料的預訓練,在處理各種復雜任務時能夠表現出更好的泛化能力和更高的通用性,可以說是“書讀百遍其義自見”在人工智能時代的最好詮釋。
這其中,OpenAI十年磨一劍的GPT系列大模型堪稱珠玉在前。以ChatGPT為代表的大模型在邏輯推理、文本生成、自動編寫等方面展現出來的智慧與能力,一時間掀起了AI大模型的研發熱潮。從“通義千問”“知海圖”“百川智能”等一系列大模型產品的命名深意中,我們也不難發現,重兵押注“通用大模型”已經率先成為了國內頭部廠商的共識。
而另一邊,以垂直行業廠商為代表的入局者們,則將目光放在了更大的產業領域中,力圖在角逐正酣的“百模大戰”中找到AI商業化落地的機會。這便是國產大模型的另一個重要方向——從行業應用的路徑切入,解決特定場景的業務需求。
不同于科技大廠們對基礎大模型技術和底層通用能力的狂熱追逐,這些行業廠商經年累月地扎根產業的“神經末梢”處,在特定行業沉淀了大量垂直領域數據和具體業務場景,可以更精準地錘煉出大模型的“專家”能力,有望加速推動“大模型”在千行百業場景中的廣泛應用。
據科技部新一代人工智能發展研究中心的《中國人工智能大模型地圖研究報告》顯示,截至上半年,中國已至少發布79個規模在10億級參數以上的基礎大模型,研發數量排名全球第二。但歷史的經驗告訴我們,一項技術能否最終普及,關鍵是找到合適的應用場景,AI概莫能外。也因此,無論是在AI大模型賽道上已經占得先機的頭部大廠,還是在垂直領域握有海量數據集和豐富場景理解的行業廠商,都不約而同地選擇了下探至產業更深處。
場景化應用,大模型的「長坡厚雪」
毋庸諱言的是,盡管當前各方玩家對大模型的產業化都已展露出鮮明的共識,但在大模型落地應用的這最后一公里路程中,以科技大廠為代表的“通用派”和以行業廠商為代表的“垂直派”還是衍生出了兩條截然不同的分支。
以華為、百度、騰訊等為代表的頭部大廠,憑借在算法技術、行業數據、生態開放等方面的絕對領先優勢,可以更快地搭建起大模型的產品應用及服務生態,從而為大模型落地應用提供“底座”支撐和“引擎”之力。
從早前百度宣布打造全球首個一站式企業級大模型生產平臺;到阿里決定將旗下所有產品接入其自研的大語言模型“通義千問”、騰訊推出MaaS一站式行業大模型精選商店;再到“源于產業、服務產業”的京東言犀大模型、“不作詩,只做事”的華為云盤古大模型3.0等面向產業和行業場景的大模型相繼問世……無不預示著通用大模型開發的激流已經遠去,一個“AI For Industries”的時代正在到來。
圖/拓維信息簽約成為華為云盤古大模型合作伙伴
大模型的產業化之路,起于大廠們“深入產業”的共識,興于行業廠商們“扎根場景”的躬耕。與頭部科技大廠的路徑不同,拓維信息等垂直行業廠商們則是因為有了更多“Know-how”能力的加持,可以基于通用大模型的底座適配行業數據和知識庫,打造出更有針對性、專業性、精準度的垂直大模型產品或解決方案,也得以在這條龐大產業鏈上找到安身之地。
例如,拓維信息交通CV大模型就是在華為云盤古大模型的基礎之上,結合自身在交通領域沉淀的訓練數據和行業知識庫,進行再訓練和精調打造出的交通行業垂直大模型。相比于傳統小模型開發往往要面臨模式耗時長、專業度要求高、訓練/調優需要大量人工參與等限制,拓維信息交通CV大模型依托于“基礎模型預訓練+行業化調優造”的新范式,使得模型精度提升了 6.21%,開發時間節約了24倍左右,大大降低了開發成本和難度。
目前拓維信息交通CV大模型已在高速公路稽核等前端業務場景得到了正式應用。在“大模型能力”的加成下,稽核場景可以實現高速公路圖片的實時上傳和服務,通過智能壓縮,大幅提升圖片服務能力,助推稽核工作提質增效。除此之外,在教育、醫療、氣象、采礦等眾多行業應用場景中,大模型賦能產業的相關能力也已開始實踐。也正是技術與場景的一次次交融,讓中國大模型產業迎來了具有變革意義的躍遷拐點,真正進化為“長坡厚雪”的理想賽道。
Know-how,大模型落地最優解
如果說大模型的上半場是“詩和遠方”。那么,在經歷了AIGC熱潮一浪接一浪的卷積之后,國產大模型已經走過了最初的技術狂熱期,在商業化落地的冷思考中開啟了“煙火日常”的下半場。誰能率先將大模型技術與產業具體場景結合,訓練出大模型的垂直化、行業化能力,帶來切實可落地的數字化轉型成效,誰就能爭取到AI 2.0時代更多的話語權和主動權。
隨著大模型作為新生產力的引擎形態越來越為人所熟知,源于產業側的“Know-how”能力,也逐漸成為各路參與方在這場大模型落地考中新的角力點。然而,“Know-how”能力的構建絕非一日之功。眾所周知,不同行業的數字化需求是模糊而龐雜的,這就對服務廠商的行業Know-how能力提出了更高要求。比起主打普惠適用的“全面型”能力,大模型要在千行百業應用場景中跑起來,更需要“Know-how”的深厚積累。
以拓維信息交通CV大模型為例。拓維信息從2019年開始深入交通行業數字化改造,持續探索AI技術在高速收費、稽核、隧道等具體業務場景中的應用及建設,針對特定場景需求先后推出AI稽核、數字視網膜解決方案、RPA工單機器人等多款基于AI的創新成果,在不斷的技術打磨和實踐迭代中累積起優質的交通垂直場景數據集,最終以此為“養料”,訓練出交通CV大模型。在“模型+場景”的飛輪帶動下,拓維信息交通CV大模型在感光成像、特征提取、態勢感知、事件識別等方面的能力已得到較大提升,在交通行業場景展現出了巨大的應用潛力。
誠然,從通識屬性來看,“領域專家型”的垂直大模型難以和“海納百川”的通用大模型抗衡。但站在產業的角度,新技術究竟能否突破原有的生產力邊界,最終還是要回到具體的應用場景中進行驗證。
可以肯定的是,在人工智能由“技術力”轉向“生產力”的這場商業化浪潮中,“通用”和“垂直”兩種路線從來都不是有你無我的對立關系,它們終將共同匯入產業的大江大河,漾出涓涓細流滋養每一方數字化土壤。一橫一縱之間,中國AI大模型的新版圖已經顯現。
-
AI
+關注
關注
87文章
31490瀏覽量
269911 -
模型
+關注
關注
1文章
3298瀏覽量
49074 -
ChatGPT
+關注
關注
29文章
1566瀏覽量
7953 -
AI大模型
+關注
關注
0文章
320瀏覽量
339
發布評論請先 登錄
相關推薦
評論