電子發燒友原創 章鷹
近日,DeepSeek推出的AI大模型R1火爆,隨著DeepSeek的開源和國產大模型成本的下降,人工智能技術在企業的應用場景大幅度拓展,國產算力也有機會在更多行業應用。業內人士表示,DeepSeek的開源讓行業應用AI門檻大幅度降低,政府及企業應用有望在2025年產生裂變式增長。最新,中國電信、華為、京東、聯想都相繼加入了DeepSeek一體機的矩陣。
2月11日,中國電信宣布推出了息壤智算一體機-DeepSeek版,在硬件層面以華為昇騰芯片為基礎,提供8卡、16卡、32卡等多種規格型號。
2月13日,華為宣布推出昇騰DeepSeek大模型一體機,從服務器、推理卡、到加速模組等豐富的DeepSeek一體機產品形態,全面適配DSV3/R1滿血版/蒸餾版本全系列模型,涵蓋智能對話、智能編程、文檔分析、開發板等全場景應用。
華為表示,DeepSeek V3/ R1 671B旗艦模型(滿血版)通常需要高端GPU進行推理,現在基于華為云昇騰云服務的全棧優化適配可以獲得持平全球高端GPU部署模型的效果,提供穩定的生產級服務能力,滿足業務商用部署需求。
近日,聯想百應總經理魏東表示,聯想開發的DeepSeek一體機得到來自政府、醫療行業、制造行業、教育行業的關注。不少企業和聯想溝通希望做一些本地的部署。
據悉,目前上市的DeepSeek推理一體機內置DeepSeek-R1 32B、70B、滿血版671B等不同尺寸模型,價格在幾十萬到數百萬不等,主要面向對數據安全、數據隱私較為敏感的企業用戶。而訓推一體機的售價更高,用于DeepSeek-R1 32B模型的預訓練和微調的一體機價格就達到數百萬。
對比其他AI大模型,DeepSeek的兩大優勢
DeepSeek R1是一個基于混合專家(MOE)架構的 AI 對話模型。盡管中國 AI 公司 DeepSeek 發布的模型相當新,但它已經被稱為 ChatGPT、Perplexity 和 Gemini 等較老 AI 模型的強勁競爭對手。
DeepSeek 的與眾不同之處在于其開源特性和高效架構。這使得開發人員能夠適應并在此基礎上進行構建,而無需承擔與資源密集型模型相關的高昂基礎設施成本。對于想要使用 AI 但預算不足的初創公司和小型企業來說,DeepSeek R1 是一個不錯的選擇。
DeepSeek R1總共擁有驚人的 6710 億個參數,但每個任務僅激活約 370 億個參數——這就像為手頭的工作召集了合適的專家。這種選擇性激活是通過 DeepSeek R1 的創新多頭潛在注意力 (MLA) 機制實現的。這種方法使 DeepSeek R1 能夠以驚人的效率處理復雜任務,處理信息的速度通常比傳統模型快兩倍,例如編碼和數學計算等任務。
ChatGPT 建立在 OpenAI 的 GPT 架構之上,該架構利用基于 Transformer 的神經網絡。該模型采用自注意力機制來處理和生成文本,從而能夠捕捉輸入數據中的復雜關系。ChatGPT 的架構擁有 1750 億個參數,確保其所有“知識”可用于每項任務。這意味著,與 DeepSeek R1 不同,ChatGPT 不會只調用提示所需的參數。相反,它每次都會使用所有1750 億個參數,無論它們是否是必需的。這種廣泛的參與令ChatGPT能夠提供高度準確且具有情境感知能力的響應。但也意味著它消耗了大量的計算能力和能源資源,不可持續。
國產算力支持DeepSeek一體機部署,前景如何?
聯想集團和沐熙公司聯合發布基于DeepSeek大模型的一體機解決方案,以“聯想服務器/工作站+沐曦訓推一體GPU+自主算法”為核心架構。京東云的DeepSeek大模型一體機,支持華為昇騰、海光、寒武紀、摩爾線程、天數智芯等國產AI加速芯片。
行業專家指出,大模型一體機主要是本地化部署,解決的是數據隱私問題。之前大模型一體機的經濟價值不高,高投入影響了其落地,未來還是需要應用能有更大的發展。
據悉,國內多家國產芯片廠商完成了對DeepSeek滿血版和蒸餾版開源模型的適配工作。但是目前主要針對的中小模型,而滿血版的V3/R1擁有6710億參數,對硬件要求大大提高。需要推理的時候用到320個GPU,這對于成本和芯片性能提出了更高要求。
DeepSeek對核心產業的相互滲透,將助力中國從“算力追求者”向“生態主導者”轉型。DeepSeek一體機的密集發布,對中小企業的AI應用落地是一個極大助力,未來在行業拓展應用口碑如何,我們將拭目以待。
-
DeepSeek
+關注
關注
1文章
632瀏覽量
410
發布評論請先 登錄
相關推薦
DeepSeek一體機背后,國產算力芯片崛起

中軟國際發布基于昇騰計算架構的“DeepSeek社保基金監管大模型一體機”解決方案

中科曙光推出DeepSeek人工智能一體機
DeepSeek一體機:加速AI訓推超融合,推動行業智能化落地

格靈深瞳發布全國產超融合大模型一體機
標普云DeepSeek一體機發布:零門檻部署企業DeepSeek
曙光云發布DeepSeek大模型超融合一體機
梯度科技推出DeepSeek智算一體機
澎峰科技發布DeepSeek智算一體機
曙光云推出DeepSeek大模型一體機
新華三發布DeepSeek大模型一體機UniCube
邊緣計算AI一體機常見應用場景有哪些?

評論