(電子發燒友網報道 文/章鷹)4月9日,美國全國公共廣播電臺(NPR)引述兩位知情者說法稱,美國特朗普政府暫時叫停了將英偉達對華銷售限制擴大至“特供版”人工智能芯片H20的計劃。原本美國數月來都在對這款芯片實行出口管制,原本準備最快在本周實施。
事情的轉機出現在4月4日,英偉達CEO黃仁勛在總統特朗普的私人住所出席豪華晚宴。英偉達CEO向特朗普承諾將在美國AI數據中心進行新投資后,上述的管制計劃出現改變。
4月10日,還有一條爆炸性消息,著名AI科學家李飛飛領銜的斯坦福大學人工智能研究所近日發布了最新一期《2025年人工智能指數報告》,報告指出中美頂級AI大模型性能已經由2023年的17.5%大幅縮至0.3%,接近抹平。2024年全球重要的大模型中,美國入選40個,中國15個。在業內頂尖專家評選的32項“2024年AI領域重要發布中”,中國的阿里Qwen2、Qwen2.5及DeepSeek-V3發布上榜。
為何H20芯片會首先被美國政府放行,這對英偉達的全球戰略有何影響?除了H20芯片外,中國在AI服務器、DeepSeek一體機等重要的算力基礎設施中,還有哪些國產AI芯片選項?本文進行詳細分析。
H20芯片的前世今生,DeepSeek爆火提振了H20的需求
H20芯片是英偉達公司2023年底推出的AI芯片,H20基于英偉達Hopper架構,是H100的簡化版。2023年10月17日,美國更新出口管制標準,要求先進芯片性能超過特定閾值,即需要申請出口許可。在嚴苛的限制條件下,英偉達針對中國市場的特供版H800、A800兩款芯片也面臨禁售,面對新的管制,英偉達定制全新的特供版本H20,供中國使用。英偉達公司于2023年底推出的特供版的AI芯片H20。
H20采用GH100芯片,禁止用張量核心,核心數量相較于H100減少了41%,在超頻和集群擴展能力上受到了很大限制。H20配置了96GB HBM3顯存,以及4TB/s帶寬,FP8算力為296 TFLOPs,FP16算力為148TFLOPS,集群的理論擴容能力最高5萬張,集群算力合計最高7400P算力,遠低于H100、A800和A100。H100采用Hopper架構,擁有16896個CUDA核心,顯存為80GB HBM3,理論擴容可達5萬張,最多可以達到10萬P算力。
針對LLM大模型業態而言,實際使用H20做千卡分布式訓練,H20芯片由于單卡算力規格低,更適用于垂直類模型的訓練/推理,不容易滿足千億參數級LLM的訓練需求。
今年1月以來,隨著DeepSeek-R1版本正式發布上線,作為業內首個比肩GPT4 o1的開源大模型,憑借高性能、低成本、全開放三大優勢,成為“國運級科技成果”,引發使用人工智能的新一輪浪潮。在DeepSeek推理模型爆火后,支持推理的H20芯片就日益受到AI公司的青睞,根據美國The information報道,字節跳動、阿里巴巴與騰訊控股等中國公司,在今年3月對英偉達H20芯片下單至少160億美元。
今年2月英偉達發布2025財年第四季度財報和2025財年全年業績。財報顯示,截止到1月25日的2025財年英偉達全年營收達到1305億美元,同比增長114%,凈利潤約729億美元,同比增長145%。其中來自英偉達中國區的營收171.08億美元,達到歷史新高。而3月H20的芯片訂單沖上160億美元,如果因為美國出口管制H20芯片無法向中國出售,英偉達的損失相當慘重。
國產芯片積極布局國產算力
4月9日,在深圳舉辦的中國電子展上,中國聯合網絡通信有限公司深圳分公司云計算、算網運營BU總經理趙成屏表示,公司作為云計算國家隊,聯通云已經成為首個接入DeepSeek大模型的運營商,基于A100智算池、國產910B智算池和合作算力資源池,向客戶提供GPU裸金屬服務器資源,支持專區隔離,結合專線訪問,滿足客戶強數據安全需求,適用于大模型部署、微調和應用開發服務。
在2023年美國對華高端AI芯片禁令實施的第187天,華為低調推出了昇騰910B芯片。這款AI芯片是華為自主研發、基于國內供應鏈核心環節的創新成果,擁有每秒320萬億次運算(FP16)的強大算力,為中國AI產業的發展帶來了新的突破。昇騰910B的FP16算力是英偉達H20的近2倍,在能效比方面優勢明顯,同樣16張顯卡訓練,使用鯤鵬底座的910B比英偉達服務器省電70%。
趙成屏透露,深圳智算節點建立萬卡集群,坪山機房主要采購昇騰910B芯片,去年到今年算力芯片、算子適配已經完成,國產算力逐步服務政府、金融等重點單位,提供模型從CUDA遷移到華為昇騰CANN的全流程工具。在美國持續斷供大算力AI芯片和國產替代浪潮推動下,昇騰910B生態正在快速崛起。
國泰海通證券電子聯系首席分析師舒迪近日表示,2027年上海智能云產業規模突破2000億元,國內算力資本性支出與海外仍存在較大差距,中美AI領域競爭加劇導致海外AI芯片出口限制加碼,H20能效未能達到國內新建IDC能效要求,國產算力芯片預計加速滲透。按照2027年上海市智算規模力爭達到200EFLOPS,其中自主可控算力占比超70%,基于910B FP16算力 320TFLOPS進行測算,2027年上海市需求910B等效需求62.5萬張。除了910B外,寒武紀思元370、天數智芯天垓100 芯片、海光DCU K100等都在性能、架構、應用場景和生態方面各具特點,適配不同的場景。
隨著DeepSeek的開源和國產大模型成本的下降,人工智能技術在企業的應用場景大幅度拓展,國產算力也有機會在更多行業應用。在AI服務器之外,服務于個人和企業應用場景的DeepSeek一體機也日益火爆。DeepSeek一體機以高效、便捷、安全的特點,在市場上迅速取得了顯著成績,浪潮、華為、聯想、新華三、中興通訊、百度云、聯通等十幾家企業都推出相應的產品。一體機方案背后的AI芯片選擇,也成為了業內關注的焦點。
中國聯合網絡通信有限公司深圳分公司云計算、算網運營BU總經理趙成屏展示的聯通推出的DeepSeek-R1一體機70B版本采用了燧原、華為910B和英偉達4090多款芯片;聯想和沐熙合作推出了DeepSeek一體機,采用沐熙AI芯片,除了華為昇騰和沐熙之外,其他家采用的AI芯片來自昆侖芯、天數智芯、海光、壁仞、云天勵飛、景嘉微等。
從算力數據看,華為昇騰憑借單卡320 TFLOPS的算力以及優良的集群擴展性領先;從能效維度看,沐曦以1.8 TFLOPS/W的能效比以及訓推一體優化而表現突出;而在生態維度上,昆侖芯與百度飛槳深度整合,形成了一定的生態優勢。而天數智芯則通過異構算力混合訓練降低成本30%。此外,海光的Deepseek一體機搭載海光K100 GPU服務器,采用自主設計DCU芯片,單卡算力突破164TFLOPS,支持百億級模型訓練。
寫在最后
2025年,中美兩國在AI算力基礎設施和AI行業應用領域的競爭日趨激烈,英偉達CEO黃仁勛此前表示,華為的持續成功表明了美國遏制中國科技發展所作的工作沒什么成效,并指出“他們在人工智能領域的影響力逐年增長,我們無法忽視其存在。”
隨著阿里Qwen2、Qwen2.5及DeepSeek-V3在全球大模型領域的上榜,更多中國AI芯片推出新品配合DeepSeek一體機的落地,服務于企業場景的AI應用加速落地。H20之外,中國AI服務器和終端硬件廠商也具備越來越多的選項。
本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@huaqiu.com。
-
AI芯片
+關注
關注
17文章
1956瀏覽量
35597
發布評論請先 登錄
相關推薦
算力租賃市場爆發,H20遭瘋搶!小心掉坑
美國限制英偉達向華出售H20芯片
特朗普要叫停英偉達對華特供版 英偉達H20出口限制 或損失55億美元
今日看點丨英偉達H20出口至中國需“無限期”申請許可證;特斯拉即將實現純AI自動駕駛
國產AI芯片破局:國產TCB設備首次完成CoWoS封裝工藝測試

芯森CM5A 2000 H20傳感器在集中式逆變器中的革新實踐

【新品發布】國產實力破局!算力 “卷王” HZHY-AI210G,體積小巧,讓智能無人設備輕裝上陣

評論