Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關注的是,本次上線的四個模型均部署在國產沐曦曦云 GPU 上。
與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業內部實施部署,可以極大的降低落地成本。
同時,這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺,更是實現了從芯片到平臺,從算力到模型,全國產研發、中國制造。
100%國產AI的力量
國產模型 DeepSeek R1
DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個參數,支持 128000 個 Token 的大輸入上下文長度。在數學、代碼和自然語言推理等任務上表現出色。
本次部署在沐曦曦云 GPU 上的是四個 DeepSeek R1 蒸餾模型,以更小參數量的資源占用,實現了性能與大參數模型旗鼓相當。
國產 GPU 沐曦曦云
曦云系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)采用完全自主研發的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數據處理等場景。
在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時得到沐曦的算力供應商超訊通信的鼎力支持,最終實現了模型的快速部署、穩定調用。
國產平臺 Gitee AI
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發者輕松構建和部署 AI 應用,為企業客戶提供更加智能、高效的 AI 應用解決方案。
100%國產AI免費跑
目前 Gitee AI 上的DeepSeek-R1-Distill系列模型現已面向全體開發者免費使用!免費使用!免費使用!
本次上線的模型參數雖小,但它們表現并不亞于大參數模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B,雖然參數較小,但簡單任務相較于大參數模型其響應速度更快,同時也具備體現思考過程的能力:
模型自強、算力自強、平臺自強,100%國產AI的新時代已然來臨。與其在“制裁-替代-再制裁”的循環中疲于奔命,不如和我們一起在國產 AI 的土壤上,種出下一個時代的參天大樹。
訪問 Gitee AI,體驗基于沐曦算力的 DeepSeek R1,開啟你的100%國產AI開發之旅!
審核編輯 黃宇
-
AI
+關注
關注
87文章
32942瀏覽量
272606 -
DeepSeek
+關注
關注
1文章
698瀏覽量
579
發布評論請先 登錄
相關推薦
研華發布昇騰AI Box及Deepseek R1模型部署流程
研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

免費!「DeepSeek-R1 671B滿血版」不卡、不限次!問小白火速支援

IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
IBM企業級AI開發平臺watsonx.ai上線DeepSeek R1蒸餾模型
部署DeepSeek R1于AX650N與AX630C平臺

壁仞科技順利部署DeepSeek R1千問蒸餾模型
扣子平臺支持DeepSeek R1與V3模型
摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務
云天勵飛上線DeepSeek R1系列模型

評論