Neuchips展示大模型推理ASIC芯片

領先的AI專用集成電路（ASIC）解決方案提供商Neuchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片（以前稱為N3000）和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業能夠以現有解決方案的一小部分成本部署大型語言模型（LLM）推理。

NeuchipsCEO Ken Lau表示：“我們很高興在CES 2024上向業界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips，任何組織都可以在廣泛的AI應用中從LLM中獲得力量。”

LLM民主化

Raptor和Evo共同提供了一個優化的堆棧，使企業可以輕松訪問市場領先的LLM。與現有解決方案相比，Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量，進一步降低了總擁有成本。

在CES 2024上，Neuchips展示了Raptor和Evo，在個人AI助理應用程序上加速Whisper和LlamaAI聊天機器人。該解決方案突出了LLM推理對實際業務需求的強大功能。

其他技術會議將展示Raptor和Evo如何削減語音到文本應用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運算速度高達每秒200TOPS。它在AI推理操作（如矩陣乘法、向量和嵌入表查找）方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經網絡量身定制的專利壓縮和效率優化來實現的。

Evo第5代PCIe卡為加速和低功耗設定新標準

與Raptor互補的是Neuchips的超低功耗Evo加速卡。Evo結合了8通道PCIe Gen 5和32GB LPDDR5，實現64 GB/s主機I/O帶寬和1.6 Tbps每秒的內存帶寬，每卡僅55瓦。

正如DLRM所展示的那樣，Evo還具有100%的可擴展性，允許客戶通過添加更多芯片來線性提高性能。這種模塊化設計確保了對未來AI工作負載的投資保護。

該公司2024年下半年推出了HHHL(half-height half-length)外形產品Viper，提供更大的部署靈活性。新系列在緊湊的設計中帶來了數據中心級的AI加速。

原文鏈接：

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

ASIC芯片

ASIC芯片

+關注

關注
2

文章
92

瀏覽量
24091
LLM

LLM

+關注

關注
1

文章
316

瀏覽量
633

原文標題：Neuchips展示大模型推理ASIC芯片！

文章出處：【微信號：SSDFans，微信公眾號：SSDFans】歡迎添加關注！文章轉載請注明出處。

谷歌新一代 TPU 芯片 Ironwood：助力大規模思考與推理的 AI 模型新引擎?

Cloud 客戶開放，將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點層面，Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU 芯片，

發表于 04-12 00:57 ?1671次閱讀

詳解 LLM 推理模型的現狀

2025年，如何提升大型語言模型（LLM）的推理能力成了最熱門的話題之一，大量優化推理能力的新策略開始出現，包括擴展推理時間計算、運用強化學習、開展監督微調和進行提煉等。本文將深入探討

發表于 04-03 12:09 ?174次閱讀

為什么無法在運行時C++推理中讀取OpenVINO?模型？

使用模型優化器 2021.1 版OpenVINO?轉換模型使用 Runtime 2022.3 版本在 C++ 推理實現（ core.read_model（））中讀取模型Open

發表于 03-05 06:17

AI推理帶火的ASIC，開發成敗在此一舉！

電子發燒友網報道（文/梁浩斌）去年年底，多家大廠爆出開發數據中心ASIC芯片的消息，包括傳聞蘋果與博通合作開發面向AI推理的ASIC，亞馬遜也在年底公布了其AI?

發表于 03-03 00:13 ?2614次閱讀

AI<b class='flag-5'>推理</b>帶火的<b class='flag-5'>ASIC</b>，開發成敗在此一舉！

AI大模型在汽車應用中的推理、降本與可解釋性研究

佐思汽研發布《2024-2025年AI大模型及其在汽車領域的應用研究報告》。推理能力成為大模型性能提升的驅動引擎 2024下半年以來，國內外大模型公司紛紛推出

發表于 02-18 15:02 ?953次閱讀

AI大<b class='flag-5'>模型</b>在汽車應用中的<b class='flag-5'>推理</b>、降本與可解釋性研究

黑芝麻智能芯片加速DeepSeek模型推理

近日，黑芝麻智能宣布，其武當C1200家族芯片已成功完成DeepSeek模型推理的部署，而A2000芯片也將全面支持基于DeepSeek的多模態大模

發表于 02-14 15:04 ?430次閱讀

如何開啟Stable Diffusion WebUI模型推理部署

如何開啟Stable Diffusion WebUI模型推理部署

發表于 12-11 20:13 ?393次閱讀

阿里云開源推理大模型QwQ

推理能力，尤其在數學和編程方面表現突出。其整體推理水平已經可以與OpenAI的o1模型相媲美，這充分展示了QwQ的強大實力和潛力。 QwQ(Qwen with Questions)是通

發表于 11-29 11:30 ?927次閱讀

使用vLLM+OpenVINO加速大語言模型推理

隨著大語言模型的廣泛應用，模型的計算需求大幅提升，帶來推理時延高、資源消耗大等挑戰。

發表于 11-15 14:20 ?1067次閱讀

高效大模型的推理綜述

大模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而，大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型

發表于 11-15 11:45 ?1179次閱讀

FPGA和ASIC在大模型推理加速中的應用

隨著現在AI的快速發展，使用FPGA和ASIC進行推理加速的研究也越來越多，從目前的市場來說，有些公司已經有了專門做推理的ASIC，像Groq的LPU，專門針對大語言

發表于 10-29 14:12 ?1581次閱讀

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，在2023年11月25日發布了針對大語言

發表于 09-29 10:14 ?1051次閱讀

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型

發表于 07-24 11:38 ?1496次閱讀

如何加速大語言模型推理

的主要挑戰。本文將從多個維度深入探討如何加速大語言模型的推理過程，以期為相關領域的研究者和開發者提供參考。

發表于 07-04 17:32 ?862次閱讀

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

用于文本生成，根據提示或上下文生成連貫、富有創造性的文本，為故事創作等提供無限可能。大語言模型也面臨挑戰。一方面，其計算資源需求巨大，訓練和推理耗時；另一方面，模型高度依賴數據，需要大規模訓練數據才能

發表于 05-04 23:55

SSDFans
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 碎屏手機數據導出方案
Hot 什么是UFS？為什么說UFS是手機存儲的未來？

New 多流技術：不同壽命數據存在SSD的不同塊
New 致態TiPro9000固態硬盤的功耗及電壓測試

发布文章

精選推薦
更多

文章

資料

帖子

邊緣AI MPU深度盤點：品牌、型號與技術特性全解析

eeDesigner
15小時前

251 閱讀

晶圓揀選測試的具體過程和核心要點

中科院半導體所
16小時前

292 閱讀

基于瑞薩電子RA8D1 MCU的USB和I2S數字音頻應用解決方案

瑞薩MCU小百科
17小時前

306 閱讀

RZT2H CR52雙核BOOT流程和例程代碼分析

RA生態工作室
27天前

250 閱讀

使用e2studio軟件新建瑞薩RA系列MCU工程

瑞薩MCU小百科
17小時前

249 閱讀

高級駕駛輔助系統ADAS核心設計攻略

盧國藝
4281KB

5積分

234下載

夾頭是用于OkHttp客戶端的簡單應用內HTTP檢查器

姚小熊27
0.14 MB

免費

1下載

cloudmacs Emacs編輯器

高桂清
0.02 MB

2積分

2下載

Streamis流式應用開發管理系統

mintsy
20.23 MB

2積分

3下載

StitchingImage iOS仿微信群組封面拼接

王尚岱
0.59 MB

2積分

1下載

【五一打卡】勞動最光榮！分享勞動風采，把小智AI套件帶回家

dianzi_0101
3天前

595 閱讀

【RA-Eco-RA4M2開發板評測】定時器輔助串口不定長數據接收

wang123a
1天前

372 閱讀

【米爾-STM32MP257開發板試用體驗】米爾-STM32MP257開發板下載yocto源碼和編譯及燒錄

jf_67024233
1天前

302 閱讀

請問一下是不是LMX2541只有輸入為整數時才能被鎖定

jf_94493343
1天前

364 閱讀

【RA-Eco-RA4M2開發板評測】使用Jlink的RTT來實現串口打印功能

jf_43382582
1天前

401 閱讀

推薦專欄
更多