色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepSeek在昇騰上的模型部署的常見問題及解決方案

OSC開源社區 ? 來源: OSC開源社區 ? 2025-03-25 16:53 ? 次閱讀

2024年12月26日,DeepSeek-V3橫空出世,以其卓越性能備受矚目。該模型發布即支持昇騰,用戶可在昇騰硬件和MindIE推理引擎上實現高效推理,但在實際操作中,部署流程與常見問題困擾著不少開發者

本文將為你詳細闡述昇騰DeepSeek模型部署的優秀實踐。

昇騰DeepSeek模型部署的常見問題及解決方案見:
DeepSeek在昇騰上的模型部署 - 常見問題及解決方案
https://modelers.cn/updates/zh/modelers/20250226-deepseek-bestpractice-acend-deploy-part2/

01 硬件要求及組網

推薦參考配置如下,部署DeepSeek-V3/R1量化模型至少需要多節點Atlas 800I A2(8*64G)服務器。

本方案以DeepSeek-R1為主進行介紹,DeepSeek-V3與R1的模型結構和參數量一致,部署方式與R1相同。

b4125938-0952-11f0-9310-92fbcf53809c.jpg

02 運行環境準備

推薦使用鏡像部署

1、鏡像部署

昇騰官方在Ascend hub提供環境示例鏡像,含推理部署配套軟件以及模型運行腳本,用戶可參考構建運行環境鏡像進行部署。

鏡像部署及啟動參照ModelZoo指南中“加載鏡像”章節,該指南中還包含“容器啟動”等指引:
https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#加載鏡像

鏡像申請/下載(含于上述指南):
https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f

b42efc50-0952-11f0-9310-92fbcf53809c.jpg

2、裸機部署

根據MindIE安裝指南安裝軟件包和運行依賴軟件。

安裝指南:

根據指南安裝全部軟件包和環境
https://www.hiascend.com/document/detail/zh/mindie/100/envdeployment/instg/mindie_instg_0001.html

模型獲取:
https://modelers.cn/models/MindIE/DeepSeek-R1

03 權重文件準備

BF16權重下載:https://modelers.cn/models/State_Cloud/DeepSeek-V3-BF16

INT8量化后權重下載:https://modelers.cn/models/State_Cloud/DeepSeek-R1-W8A8/tree/main

如已下載BF16模型,也可采用以下步驟進行模型量化,權重BF16->INT8轉換預計7~8小時。

Step1:安裝ModelSlim

git clone https://gitee.com/ascend/msit.git

cd msit/msmodelslim

bash install.sh

Step2: 運行量化命令

cd msit/msmodelslim/example/DeepSeek/

python3 quant_deepseek_w8a8.py

--model_path {浮點權重路徑}

--save_path {W8A8量化權重路徑}

更多詳細量化教程請參考 DeepSeek量化文檔 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim/example/DeepSeek

Msmodelslim代碼倉 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim

04 運行前檢查

服務器檢查:https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#前置準備 軟件版本配套檢查,含:HDK、CANN、PTA、MindIE、MindStudio 1、檢查組網鏈接狀態 a)檢查物理鏈接for i in {0..7}; do hccn_tool -i $i -lldp -g | grep Ifname; done b)檢查鏈接情況for i in {0..7}; do hccn_tool -i $i -link -g ; done c)檢查網絡健康情況for i in {0..7}; do hccn_tool -i $i -net_health -g ; done d)查看偵測ip的配置是否正確for i in {0..7}; do hccn_tool -i $i -netdetect -g ; done e)查看網關是否配置正確for i in {0..7}; do hccn_tool -i $i -gateway -g ; done f)檢查NPU底層tls校驗行為一致性,建議全0for i in {0..7}; do hccn_tool -i $i -tls -g ; done | grep switch g)# NPU底層tls校驗行為置0操作for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done

2、根據組網設置準備rank_table_file.json

使用多節點推理時,需要將包含設備ip,服務器ip等信息的json文件地址傳遞給底層通信算子。參考如下格式,配置rank_table_file.json:

b43fd6b0-0952-11f0-9310-92fbcf53809c.jpg

05 模型部署與配置

獨立模型: https://modelers.cn/models/MindIE/DeepSeek-R1

服務化部署:

1、運行指南 https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md(服務化測試)

2、服務啟動 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3、接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

?

06 模型運行

??

?

1、純模型測試

模型腳本已預制在鏡像中,參照以下鏈接即可拉起精度測試及模型測試https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md (純模型測試部分)

b45b45d0-0952-11f0-9310-92fbcf53809c.jpg

2、服務化測試

1. 運行指南 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#服務化測試

2. 服務啟動 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3. 常用接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 昇騰
    +關注

    關注

    1

    文章

    150

    瀏覽量

    6758
  • DeepSeek
    +關注

    關注

    1

    文章

    698

    瀏覽量

    579

原文標題:DeepSeek在昇騰上的模型部署-優秀實踐

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    漫話之《一體機請就位》

    為什么DeepSeek部署「最優解」?
    的頭像 發表于 03-07 00:12 ?1274次閱讀
    漫話<b class='flag-5'>昇</b><b class='flag-5'>騰</b>之《一體機請就位》

    Deepseek進入業務深水區,為什么需要大EP?

    行業智能化的高鐵,由大EP+DeepSeek的雙軌鋪成
    的頭像 發表于 03-17 15:09 ?839次閱讀
    <b class='flag-5'>Deepseek</b>進入業務深水區,為什么需要<b class='flag-5'>昇</b><b class='flag-5'>騰</b>大EP?

    添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測試,開啟這場充滿挑戰與驚喜的技術探索之旅。 RK3588 開發板:AI 性能擔當 RK3588 開發板基于先進的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,
    發表于 02-14 17:42

    RK3588開發板上部署DeepSeek-R1大模型的完整指南

    的核心功能之一,它允許用戶將Hugging Face或GGUF格式的大語言模型轉換為RKLLM模型,從而將RKLLM模型Rockchip NPU
    發表于 02-27 16:45

    【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試

    【幸狐 Omni3576 邊緣計算套件測評】DeepSeek 部署及測試 本文介紹了幸狐 Omni3576 邊緣計算套件實現 DeepSeek 部署及測試的相關流程,包括
    發表于 03-21 19:31

    思原生,助力智譜打造自主創新大模型體系!

    自從全面啟動原生開發,越來越多的生態伙伴選擇,大模型生態從“應用遷移”走向“原生開發”,充分依托
    的頭像 發表于 08-20 18:29 ?585次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>與<b class='flag-5'>昇</b>思原生,助力智譜打造自主創新大<b class='flag-5'>模型</b>體系!

    中軟國際科創中心上線DeepSeek模型

    近日,中軟國際科創中心以“DeepSeek+”為引擎,緊跟行業趨勢,將DeepSeek全參模型滿血版
    的頭像 發表于 02-08 18:02 ?978次閱讀

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發布引發行業熱議,研華科技基于Atlas平臺邊緣AI Box MIC-ATL3S正式發布與Deepsee
    的頭像 發表于 02-14 16:08 ?718次閱讀
    研華邊緣AI Box MIC-ATL3S<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1<b class='flag-5'>模型</b>

    華為推出DeepSeek模型一體機

    DeepSeek模型的橫空出世,讓AI正以前所未有的速度重塑各行各業的發展格局。DeepSeek一體機深度融合
    的頭像 發表于 02-18 09:56 ?1497次閱讀

    云軸科技ZStack智塔攜手AI實現DeepSeek模型部署

    DeepSeek為人工智能AI產業帶來一場革命,為企業級AI應用私有化部署場景(Private AI)注入強勁動力。作為企業級私有化AI Infra平臺,云軸科技ZStack智塔攜手
    的頭像 發表于 02-18 09:59 ?301次閱讀
    云軸科技ZStack智塔攜手<b class='flag-5'>昇</b><b class='flag-5'>騰</b>AI實現<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    研華發布AI Box及Deepseek R1模型部署流程

    。這一舉措標志著研華AI邊緣計算領域邁出了重要一步。 研華邊緣AI Box MIC-ATL3S依托芯片的強大異構計算能力,結合研華邊緣計算領域的高可靠特點,為用戶提供了高效、穩
    的頭像 發表于 02-19 10:41 ?305次閱讀

    推理服務器+DeepSeek模型 技術培訓圖為科技成功舉辦

    DeepSeek模型的全面融合應用即將邁入實質性落地的新階段。 加持DeepSeek模型
    的頭像 發表于 02-26 17:38 ?368次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>推理服務器+<b class='flag-5'>DeepSeek</b>大<b class='flag-5'>模型</b> 技術培訓<b class='flag-5'>在</b>圖為科技成功舉辦

    中軟國際發布基于計算架構的“DeepSeek社保基金監管大模型一體機”解決方案

    ? ? ? 為了提升社保基金監管效能,推動社保基金管理的智能化、科學化、精準化,中軟國際正式推出“DeepSeek社保基金監管大模型一體機”解決方案。該方案基于
    的頭像 發表于 03-06 19:19 ?654次閱讀
    中軟國際發布基于<b class='flag-5'>昇</b><b class='flag-5'>騰</b>計算架構的“<b class='flag-5'>DeepSeek</b>社保基金監管大<b class='flag-5'>模型</b>一體機”<b class='flag-5'>解決方案</b>

    潤和軟件將持續深化“+DeepSeek”技術路線

    近日,“+DeepSeek 智算引擎創新行”江蘇省首站活動南京成功舉辦,本次活動由南京江北新區產業技術研創園指導,江蘇省人工智能學會、江蘇鯤鵬·
    的頭像 發表于 03-08 09:39 ?373次閱讀

    中軟國際推出金融AI解決方案和一體機v1.0

    近日,中軟國際重磅推出金融AI解決方案和一體機v1.0,該方案基于AI基礎軟硬件平臺,完
    的頭像 發表于 03-28 17:05 ?311次閱讀
    主站蜘蛛池模板: 日日做夜夜欢狠狠免费软件 | 116美女写真午夜电影z | 美艳人妻在厨房翘着屁股 | 99这里有精品视频视频 | 不良网站进入窗口软件下载免费 | 男人舔女人的阴部黄色骚虎视频 | 成人午夜剧场 | 一级无毛片| 波野结衣qvod | 琪琪电影午夜理论片77网 | 乱子伦在线观看中文字幕 | 菠萝视频高清版在线观看 | 在线自拍亚洲视频欧美 | 69精品人妻一区二区三区蜜桃 | 丰满少妇被猛烈进出69影院 | 777久久人妻少妇嫩草AV | 欧美丰满熟妇无码XOXOXO | 国产成人理在线观看视频 | 淫品色影院 | np高h肉辣一女多男 no视频在线观看 | 国产系列视频二区 | 99视频在线免费观看 | 国产午夜电影在线观看不卡 | 日本人娇小hd | beeg xxx日本老师 | 国产亚洲精品久久精品录音 | 最近日本MV字幕免费观看在线 | 国产精品一区二区欧美视频 | 国产原创中文视频 | 免费麻豆国产黄网站在线观看 | 水蜜桃亚洲一二三四在线 | 邪恶肉肉全彩色无遮琉璃神社 | 亚洲中文字幕AV在天堂 | 国产偷抇久久精品A片蜜臀AV | 国产曰批试看免费视频播放免费 | 亚洲视频中文字幕在线 | 果冻传媒 在线播放观看 | 国产精品A久久久久久久久 国产精品A久久777777 | 欧美 日韩 无码 有码 在线 | 亚洲.欧美.中文字幕在线观看 | 特黄大片aaaaa毛片 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品