ChatGPT 在全球范圍內掀起了一場技術革命與商業浪潮,AI 市場也迎來了前所未有的機遇與增量。
當前,AI 基礎設施的算力、算法呈現新 “摩爾定律”:相同算力下能訓練生產更優質的模型,同時最先進的 AI 模型約每幾個月算力需求就會擴大一倍。
根據斯坦福大學和麥肯錫聯合發布的《2019 人工智能指數報告》,2012 年之前最先進 AI 模型計算量每兩年翻一倍;2012 年之后計算量每 3.4 個月翻一番,從 2012 年到 2020 年 3 月已增長 30 萬倍。
伴隨著大模型的快速迭代,其對算力的要求也不斷提高,而算力的核心就是人工智能芯片。因此,如何在新趨勢、新挑戰下快速響應客戶需求,推出切實可用的軟硬件解決方案,成為了擺在國內 AI 芯片企業面前的首要課題。
擁抱變化,聚焦提升產品力
ChatGPT 及大模型技術大會上,昆侖芯科技研發總監王志鵬表示:“作為一家芯片公司,需要對市場的需求和變化非常敏感,才能使硬件產品始終精準匹配主流需求。”
大模型對計算的要求主要體現在三個方面,一是算力,二是互聯,三是成本。就大模型而言,昆侖芯科技在產品定義上已經做出布局 —— 相較第一代產品,昆侖芯 2 代 AI 芯片可大幅優化算力、互聯和高性能,而在研的下一代產品則將提供更佳的性能體驗。
昆侖芯科技成立于 2021 年,前身為百度智能芯片及架構部。在實際業務場景中深耕 AI 加速領域已逾 10 年,專注打造擁有強大通用性、易用性和高性能的通用人工智能芯片。
在持續推進核心技術攻關的同時,昆侖芯科技緊密關注科技前沿,精準匹配市場需求。目前,公司已實現兩代通用 AI 芯片的量產及落地應用,在互聯網、智慧金融、智慧交通等領域已規模部署數萬片。
昆侖芯在大模型場景的規模落地實踐
“來自真實場景” 一直是昆侖芯科技最獨特的身份標簽,也是其規模部署數萬片、在行業內 “領跑落地” 的核心優勢所在。
王志鵬認為,只有基于真實業務場景中的數據進行端到端優化,才能順利推進大模型落地。
目前市場上主流的大模型以 Transformer 架構為主,包含 Encoder 和 Decoder。Encoder 主要被應用于各類 NLP 的判別類任務;而 Decoder 更多被應用于翻譯、圖文生成等場景,最近出圈的 ChatGPT 就是典型代表。
針對大模型,昆侖芯持續打磨部署優化方案,領跑產業落地。昆侖芯已將大模型的 Transformer 相關優化技術沉淀為重要基建,優化后的性能比原有方案提升 5 倍以上,壓縮顯存 30% 以上。
以文生圖大模型為例,昆侖芯已跑通一條端到端優化、規模落地之路。
AI 繪畫模型的推理算力及顯存需求隨圖像分辨率增大而指數級增加,同時,圖像生成需要循環采樣數十次,產業落地動輒需要高昂成本的部署集群,嚴重阻礙了 AIGC 模型大規模商業化落地。
2022 年第四季度,昆侖芯聯合客戶,基于飛槳 PaddlePaddle 發起了端到端聯合優化項目。在 2-3 周內,項目組快速完成端到端優化,最終實現輸入文本后 2 秒出圖的優化效果,性能提升近 8 倍。
目前,昆侖芯 AI 加速卡 R200 已在該客戶的大模型場景完成規模部署,性能數據全面超越同系列主流推理卡:
基于昆侖芯 AI 加速卡 R200 高效運算與推理能力,綜合優化方案,在 dpm-25steps 算法下,利用昆侖芯 AI 加速卡 R200,生成 1024*1024 圖像時的推理速度為 10.89 iters/s,相比同能力的主流推理卡快 20%。
昆侖芯 AI 加速卡 R200 擁有 32G GDDR6 顯存,為大規模參數提供更大的存儲容量、更高帶寬的內存訪問、更穩定的性能,生成更高分辨率的圖片,為用戶提供高性價比服務。
與此同時,面向當前市場需求迫切的大模型場景,據悉昆侖芯科技即將推出一款加速器組解決方案。
該加速器組搭載第二代昆侖芯 AI 芯片,是 AI 基礎設施的重要組成部分,為 AI IAAS 平臺、 AI PAAS 平臺提供堅實算力支撐。該產品可提供更為集約的 AI 算力,具備分布式集群部署能力,支持彈性 RDMA 網絡,對比傳統網絡通信時延降低 2~3 倍。該產品可明顯提高并行加速比,訓推一體化助力提高資源利用率,極大提升模型開發迭代效率。
攜手上層伙伴共拓 AI 芯生態
ChatGPT 及大模型技術大會上,與會者提問:在生態建設方面,國內 AI 芯片產業面臨的客觀情況是什么?
這也是昆侖芯科技經常被客戶提及的現實問題。
昆侖芯科技在努力進一步擴大生態影響力:首先要深刻理解客戶的使用習慣,滿足客戶需求,踏踏實實把軟硬件從產品和技術上做到位。隨著產品的規模部署,客戶越來越多,生態也就自然而然建立起來了。與此同時,產品也會因此得到更好的打磨,進入良性循環。
在昆侖芯科技看來,AI 芯片看似是一個硬件,但其本質則是一款軟件產品。這也證明了軟件棧、生態對于 AI 芯片發展的關鍵作用。
目前,昆侖芯已實現對飛槳的原生適配,并完成了 III 級兼容性測試,訓練與推理性能可以滿足用戶的應用需求。從底層 AI 算力組件、AI 服務器,到操作系統,再到昆侖芯 SDK,昆侖芯和飛槳攜手完成了一套端到端的 AI 計算系統解決方案,并致力于打造一個全棧式軟硬一體的 AI 生態。
為進一步完善軟件生態,昆侖芯已與多款通用處理器、操作系統、主流框架完成端到端適配,實現了軟硬件解決方案的技術棧,為客戶提供開箱即用的 AI 芯片產品。
昆侖芯軟件棧
結語
談及大模型趨勢下 AI 芯片公司面對的變化,王志鵬說道: “必須快速調整心態,并擁抱大模型帶來的變化。”
而這也剛好印證了昆侖芯科技 “突破創新” 的公司文化:面對瞬息萬變的外部環境,突破創新是適應行業的唯一方式。
面對復雜多變的市場環境以及新場景新應用對研發和落地的重重挑戰,國內 AI 芯片公司如何出圈?
集十余年 AI 加速領域的技術積淀,曾任百度智能芯片及架構部首席架構師、現任昆侖芯科技 CEO 歐陽劍認為,“AI 芯片公司應抓住場景和技術創新‘雙驅動’模式,驅動架構優化升級與軟硬件產品迭代,這是持續保持競爭力的關鍵。”
審核編輯 :李倩
-
AI
+關注
關注
87文章
31490瀏覽量
269883 -
智能芯片
+關注
關注
0文章
139瀏覽量
25264 -
ChatGPT
+關注
關注
29文章
1566瀏覽量
7939
原文標題:大模型引發技術變革, AI芯片公司面臨新挑戰
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論