隨著ChatGPT的火爆,AIGC(生成式人工智能)這一新興概念也備受矚目。AIGC目前已經在很多領域得到了廣泛應用,如新聞報道、廣告創意、音樂創作等,它可以模仿人類的寫作風格,甚至創造出全新的作品。然而AIGC的用途遠非如此簡單,隨著AIGC通過海量數據訓練的大規模神經網絡模型(大模型)的模型層數、參數的增加,“思維方式”愈來愈趨向于人腦,使其在金融、制造、醫療等各領域的應用越來越廣泛。
在訓練過程中,大模型需要大量的計算資源來執行復雜的矩陣運算和其他計算任務。為了支持這些計算任務,需要使用高性能的計算設備。同時,還需要有效的算法和架構設計來優化模型的訓練速度和效率。為提升整體算力效率和滿足差異化需求,大模型一般需要萬億量級參數計算的“智算中心”。現階段的“智算中心”通常采用云模式,通過共享、共融集結現有算力,萬卡平臺及配備高效網絡交互機制構建大模型訓練與推理平臺。
可以看出,訓練一個大模型代價是巨大的,且大模型落地部署的代價也極大,在工業界實際應用中不得不考慮部署的成本,模型輕量化是必不可少的。輕量化的其中一個方法是模型壓縮,通過將通用大模型經過剪枝、量化和蒸餾,將大模型進行壓縮得到輕量化模型,使其能夠使用算力較小的設備進行訓練推理,減輕應用單位的部署成本。
大模型通過不同的方法得到了有效的輕量化,還是無法阻止模型規模的增加,但是同時也刺激著各大芯片廠商在AI芯片上的研發投入,特別是受眾面更廣、性價比更高的AI系統化模塊(SOM),其算力發展更是一年數倍級的提升。系統化模塊(SOM)算力的提升,可處理大模型輕量化壓縮后的小模型,有助于實現從基礎大模型轉向行業微調模型(通用2B),進而細化至場景結合模型(專用2B)的轉換。而這些小巧的AI系統化模塊是對空間、能耗、環境、安全、響應要求苛刻的邊緣端設備的首選。在此過程中邊緣端設備發揮著重要的作用來推動AI部署,網絡邊緣端比過去而言會受到更多重視,也將帶來更大的市場。
研揚科技致力于為客戶提供高質量、高性能的邊緣端計算產品,是業界領先的邊緣AI解決方案設計制造商。研揚作為英偉達Elite member of the NVIDIA Partner Network(合作伙伴網絡精英成員),推出基于NVIDIA Jetson AGX Orin系統化模塊(SOM)的兩款緊湊型無風扇邊緣盒子ARES-240AI和ARES-241AI。ARES-240AI和ARES-241AI將NVIDIA Jetson AGX Orin的超高性能與全新打造的強化耐用機殼相結合,32/64GB版本可選,提供了卓越的275 TOPS 的服務器級算力,在以往需要專業顯卡支持才能運行的應用,比如自動汽車駕駛,現在憑借ARES-240AI和ARES-241AI的實時物體偵測、數據加速傳輸和強大的嚴苛環境耐受度等特性,可將整個操作移至邊緣。這兩款邊緣盒子是重新定義自主邊緣應用進行AI深度學習的理想載體。通過NVIDIA Jetson AGX Orin與其他 NVIDIA Jetson 模組、開發者套件獲得同一 NVIDIA Jetson 軟件棧的支持,這樣您只需一次開發,即可在任意位置進行部署,從而加快產品上市速度。
NVIDIA Jetson AGX Orin
功能特點
01
ARES-240AI和ARES-241AI搭載的NVIDIA Jetson AGX Orin,擁有12核ARM v8.2 64位CPU和64 個 Tensor Core 的 2048 核 NVIDIA Ampere 架構 GPU,最高可達 275 TOPS的算力,提供了比Jetson AGX Xavier 高達8倍的AI性能。ARES-240AI和ARES-241AI還具有64GB內存,在W4A16量化中,可完美支持Llama-70B。借助NVIDIA TAO工具套件,以更小的體積在行人檢測、3D姿態估計、DashCamNet、車牌識別等模型架構中提供與英偉達專業顯卡T4相似甚至更高的推理性能,這將有助于機器人和智能交通中對實時目標檢測與多傳感器的結合,同時大大增強定位和目標確認精度。
適用于嚴苛環境
功能特點
02
ARES-240AI和ARES-241AI堅固耐用,采用強固輕型鋁合金材料外殼,傳導被動散熱,可在溫度范圍為-20°C ~ 55°C (-4°F ~ 131°F)下穩定工作,具有極端溫度環境的耐受性,可以出色應對各類工業環境。此外,小巧的尺寸和輕巧的重量讓其操作不受空間限制,非常適用于車載、工業AMR和自主采礦車等應用,其物體檢測功能可應用于狹窄的、能見度低的工業環境,并提供智慧物流解決方案。
高度整合智能接口
功能特點
03
為了能完整發揮NVIDIA Jetson AGX Orin的強大計算能力,ARES-240AI和ARES-241AI搭載了許多可應用于垂直市場的功能。兩款邊緣盒子皆配備了多個USB 3.2接口,以及32/64GB LPDDR5x系統內存、64G eMMC并支持5G、Wi-Fi和NVMe的M.2 Key,確保外接硬件如攝影機和傳感器等可進行快速的信息傳輸,使其成為理想的智慧零售解決方案。
ARES-240AI區別于ARES-241AI的2個GbE LAN,它具有電源與多功能性相結合的4個PoE LAN端口,可將系統部署在距離其電源更遠的地方,并可以通過同一根線纜實現互聯網連接和系統的遠程監控,從而降低了安裝的復雜性,非常適合各種工業自動化場景及自動駕駛領域。
接口展示
產品簡介
01
功能 & 區別
產品簡介
02
-
ARES
+關注
關注
0文章
3瀏覽量
9718 -
研揚科技
+關注
關注
0文章
22瀏覽量
7327 -
AIGC
+關注
關注
1文章
362瀏覽量
1549
發布評論請先 登錄
相關推薦
評論