色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA為全球企業開發和部署大型語言模型打開一扇新的大門

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2021-11-12 14:30 ? 次閱讀

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型Megatron 530B;多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署,推動行業和科學發展

NVIDIA為全球企業開發和部署大型語言模型打開了一扇新的大門——使這些企業能夠建立他們自己的、特定領域的聊天機器人、個人助理和其他AI應用程序,并能夠以前所未有的水平理解語言中的微妙和細微差別。

NVIDIA推出了為訓練具有數萬億參數的語言模型而優化的NVIDIA NeMo Megatron框架、為新領域和語言進行訓練的可定制大型語言模型(LLM)Megatron 530B以及具有多GPU、多節點分布式推理功能的NVIDIA Triton推理服務器。

這些工具與NVIDIA DGX系統相結合,提供了一個可部署到實際生產環境的企業級解決方案,以簡化大型語言模型的開發和部署。

“大型語言模型已被證明是靈活且功能強大的,無需專門的培訓或監督,即可回答深層次領域問題,翻譯語言,理解和總結文件,編寫故事和計算程序。” NVIDIA應用深度學習研究副總裁Bryan Catanzaro表示。“ 為新的語言和領域建立大型語言模型可能仍然是最大的超級計算的應用,現在這些功能對全球的企業也變得觸手可及。”

NVIDIA NeMo Megatron和Megatron 530B

加速大型語言模型開發

NVIDIA NeMo Megatron是在Megatron的基礎上發展起來的開源項目,由NVIDIA研究人員主導,研究大型轉換語言模型的高效訓練。Megatron 530B是世界上最大的可定制語言模型。

NeMo Megatron框架使企業能夠克服訓練復雜自然語言處理模型的挑戰。經過優化,可以在NVIDIA DGX SuperPOD的大規模加速計算基礎設施上進行擴展。

NeMo Megatron通過數據處理庫自動處理LLM訓練的復雜性,這些數據處理庫可以攝入、策劃、組織和清理數據。利用先進的數據、張量和管道并行化技術,它能使大型語言模型的訓練有效地分布在成千上萬的GPU上。企業可以通過NeMo Megatron框架進一步訓練它以服務新的領域和語言。

NVIDIA Triton推理服務器

助力實時大型語言模型推理

此外,今日發布的最新NVIDIA Triton推理服務器中的多GPU、多節點特性,使大型語言模型推理工作負載能夠實時在多個GPU和節點上擴展。這些模型需要的內存比單個GPU甚至是包含多個GPU的大型服務器所能提供的還要多,并且,實際應用對其推理實時性有著極高的要求。

通過Triton推理服務器,Megatron530B能夠在兩個NVIDIA DGX系統上運行,將處理時間從CPU服務器上的1分鐘以上縮短到半秒,令實時應用部署大型語言模型成為可能。

全球范圍開發的大規模定制語言模型

使用NVIDIA DGX SuperPOD構建大型復雜語言模型的早期客戶包括SiDi、京東探索研究院和VinBrai。 SiDi是巴西的一家大型AI 研究和開發機構,已經采用三星虛擬助手,供全國 2 億巴西葡萄牙語者使用。 SiDi 首席執行官John Yi 表示:“SiDi 團隊在AI 虛擬助理和聊天機器人開發方面擁有豐富的經驗,此類開發既需要強大的 AI 性能,也需要經過訓練并適應人類語言不斷變化的細微差別的專用軟件。NVIDIA DGX SuperPOD 非常適合推動我們團隊的先進工作,幫助我們為巴西的葡萄牙語者提供領先的AI 服務。” 京東探索研究院,是以供應鏈為基礎的領先技術和服務提供商京東的研發部門,他們利用 NVIDIA DGX SuperPOD 開發NLP,應用于智能客戶服務、智能零售、智能物流、物聯網、醫療健康等領域。 VinBrain,越南的醫療健康 AI 公司,他們使用 DGX SuperPOD 為100 家醫院的放射科醫生和遠程醫療醫生開發和部署了一種臨床語言模型。在這些醫院,已有 600 多名醫療健康從業者使用該模型。

供應情況

企業可以利用今天同期發布的NVIDIA LaunchPad,免費體驗開發和部署大型語言模型。行業組織可以申請加入搶先體驗計劃,了解用于訓練大規模語言模型的 NVIDIA NeMo Megatron 加速框架。

NVIDIA Triton可從NVIDIA NGC目錄中獲得,該目錄是GPU優化的AI軟件中心,包括框架、工具包、預訓練模型和Jupyter Notebooks,并可從Triton GitHub repository中獲取開放源代碼。

Triton也包含在NVIDIA AI Enterprise軟件套件中,該套件由NVIDIA優化、認證和支持。企業可以使用該軟件套件,在內部數據中心和私有云的主流加速服務器上運行語言模型推理。

NVIDIA DGX SuperPOD 和NVIDIA DGX 系統通過NVIDIA 的全球經銷商提供,這些合作伙伴能夠根據要求為符合條件的客戶提供詢價服務。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5013

    瀏覽量

    103247
  • AI
    AI
    +關注

    關注

    87

    文章

    31111

    瀏覽量

    269435
  • 模型
    +關注

    關注

    1

    文章

    3262

    瀏覽量

    48916

原文標題:GTC21 | NVIDIA 借助超大規模 AI 語言模型為全球企業賦能

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    企業AI模型部署攻略

    當下,越來越多的企業開始探索和實施AI模型,以提升業務效率和競爭力。然而,AI模型部署并非易事,需要企業在多個層面進行細致的規劃和準備。下
    的頭像 發表于 12-23 10:31 ?135次閱讀

    語言模型開發框架是什么

    語言模型開發框架是指用于訓練、推理和部署大型語言模型
    的頭像 發表于 12-06 10:28 ?138次閱讀

    語言模型開發語言是什么

    在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大
    的頭像 發表于 12-04 11:44 ?144次閱讀

    云端語言模型開發方法

    云端語言模型開發個復雜而系統的過程,涉及數據準備、模型選擇、訓練優化、部署應用等多個環節。
    的頭像 發表于 12-02 10:48 ?154次閱讀

    語言模型如何開發

    語言模型開發個復雜且細致的過程,涵蓋了數據準備、模型架構設計、訓練、微調和部署等多個階段
    的頭像 發表于 11-04 10:14 ?164次閱讀

    如何利用大型語言模型驅動的搜索公司創造價值

    大型語言模型LLMs具有自動化內容創建、提高內容質量及多樣化的潛力,可重塑企業與信息的交互方式。通過利用LLMs,企業能提升工作效率,降低運
    的頭像 發表于 10-13 08:07 ?188次閱讀
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>驅動的搜索<b class='flag-5'>為</b>公司創造價值

    NVIDIA NIM助力企業高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規模地部署語言模型
    的頭像 發表于 10-10 09:49 ?404次閱讀

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發布了款全新的領先語言模型Mistral NeMo 12B。開發者可以輕松定制和
    的頭像 發表于 07-27 11:04 ?677次閱讀

    NVIDIA AI Foundry 全球企業打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務,以實現準確響應 埃森哲率先使用新服務,客戶創建自定義 Llama 3.1 模型;Aramco、ATT 和優步。 ? Llama 3.1 多語種大語言模型
    發表于 07-24 09:39 ?721次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry <b class='flag-5'>為</b><b class='flag-5'>全球</b><b class='flag-5'>企業</b>打造自定義 Llama 3.1 生成式 AI <b class='flag-5'>模型</b>

    富士通與Cohere合作,專注于開發和提供大型語言模型(LLM)

    富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數據隱私人工智能企業Cohere Inc.攜手宣布建立深度戰略合作伙伴關系,共同致力于大型語言模型(LLM)的創新與
    的頭像 發表于 07-16 16:55 ?504次閱讀

    英偉達開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉達宣布開源了款名為Nemotron-4 340B的大型模型,這壯舉為開發者們打開了通往高性能
    的頭像 發表于 06-17 14:53 ?579次閱讀

    NVIDIA 通過 Holoscan NVIDIA IGX 提供企業軟件支持

    部署邊緣 AI 解決方案。 NVIDIA AI Enterprise-IGX 是款全新產品,其為企業的邊緣計算軟件堆棧提供前所未有的性能、安全性和支持,簡
    的頭像 發表于 06-04 10:21 ?522次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數百萬開發者轉變為生成式 AI 開發

    和測試 ? COMPUTEX—2024 年 6 月 2 日— NVIDIA 于今日宣布,全球 2,800 萬開發者現可下載 NVIDIA NIM?——
    發表于 06-03 09:12 ?236次閱讀
    <b class='flag-5'>NVIDIA</b> NIM 革命性地改變<b class='flag-5'>模型</b><b class='flag-5'>部署</b>,將<b class='flag-5'>全球</b>數百萬<b class='flag-5'>開發</b>者轉變為生成式 AI <b class='flag-5'>開發</b>者

    QSPI工作在QUAD模式下,擦除第一扇區成功,第二區失敗為什么?

    請教下,QSPI 為何工作在 QUAD模式下,擦除第一扇區所需要的時間基本上是OK,擦除第二區 所需要的時間怎么會是 0ms ???
    發表于 05-07 07:58

    基于北京迅iTOP-RK3588大語言模型部署測試

    基于北京迅iTOP-RK3588大語言模型部署測試
    的頭像 發表于 04-25 14:35 ?969次閱讀
    基于北京迅<b class='flag-5'>為</b>iTOP-RK3588大<b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>測試
    主站蜘蛛池模板: 肉动漫无修在线播放| 国内精品免费久久影院| 日韩高清毛片| 精品香蕉99久久久久网站| 99热久这里都是精品小草| 亚洲国产高清在线| 日本视频中文字幕一区二区| 老板吻我下身好爽到高潮| 国产亚洲精品久久久久5区| 成人毛片免费播放| 97 sese| 一本道mw高清码二区三区| 天津相声广播在线收听| 欧美人成人亚洲专区中文字幕| 久久精品热线免费| 国语大学生自产拍在线观看| 国产成人自产拍免费视频| 边摸边吃奶边做下面视频| 91亚洲精品| 1300部真实小Y女视频合集| 亚洲精品国产熟女久久久| 我的好妈妈BD免费观看| 三级黄色a| 日本黄色www| 热思思| 秋霞电影网午夜鲁丝片| 欧美高清videos 360p| 快播性爱电影| 久久综合亚洲色hezyo| 久99re视频9在线观看| 黄色软件视频app| 健身房被教练啪到腿软H| 国内精品视频一区二区在线观看| 国产精品亚洲在钱视频| 国产精品久久久久久影院| 国产成人精品免费视频大全办公室| 东北老妇xxxxhd| 国产跪地吃黄金喝圣水合集| 国产传媒精品1区2区3区| 国产精品手机在线视频| 国产乱码卡二卡三卡4W|