色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于AI網(wǎng)絡(luò)的五個(gè)基本要點(diǎn)

是德科技KEYSIGHT ? 來源:是德科技KEYSIGHT ? 2024-12-18 15:48 ? 次閱讀

隨著大模型的興起,為了應(yīng)對(duì)新的AI應(yīng)用,AI或算力數(shù)據(jù)中心建設(shè)如火如荼。

無論是作為聊天機(jī)器人推薦系統(tǒng)還是在各個(gè)領(lǐng)域中實(shí)現(xiàn)流程自動(dòng)化,比如無人駕駛、人臉識(shí)別;AI技術(shù)都有望提升并加速眾多企業(yè)和公共設(shè)施的運(yùn)營,甚至改變?nèi)藗兊纳罘绞健?/p>

然而,AI網(wǎng)絡(luò)或算力網(wǎng)絡(luò)作為一個(gè)概念,常常讓人感到困惑且被誤解,AI和算力需要網(wǎng)絡(luò)么?

在本文中,我們將探討關(guān)于AI網(wǎng)絡(luò)的五個(gè)基本要點(diǎn),以及隨著AI的發(fā)展,網(wǎng)絡(luò)所面臨的獨(dú)特挑戰(zhàn)。

GPU是AI的核心

簡單來說,AI的核心是圖形處理單元(GPU)或神經(jīng)處理單元(NPU)。

過去,我們通常認(rèn)為中央處理單元(CPU)是計(jì)算機(jī)的核心。但GPU的優(yōu)勢在于,它在執(zhí)行數(shù)學(xué)計(jì)算特別是矩陣計(jì)算方面非常出色,從某種角度來說,與人腦神經(jīng)元更接近。

CPU時(shí)代的數(shù)據(jù)中心網(wǎng)絡(luò)處理的大多是供人閱讀的文字或多媒體,典型的就是網(wǎng)站的瀏覽、文件傳輸以及觀看視頻,數(shù)據(jù)中心往往能夠同時(shí)支持?jǐn)?shù)億人的同時(shí)在線及高速的視頻碼流傳輸。

而在構(gòu)建大語言模型或深度學(xué)習(xí)模型時(shí),需要讓GPU進(jìn)行“訓(xùn)練”,這涉及到解決可能包含數(shù)十億參數(shù)的矩陣和梯度運(yùn)算。GPU的計(jì)算非常的快,整個(gè)“訓(xùn)練”過程異常嚴(yán)苛,不允許有任何的錯(cuò)誤發(fā)生,一旦發(fā)生錯(cuò)誤或延遲,整個(gè)“訓(xùn)練”的周期就會(huì)被拉長。這樣的運(yùn)算量,以及對(duì)無損和低延時(shí)的要求,對(duì)于傳統(tǒng)的數(shù)據(jù)中心而言,突然就變得捉襟見肘了。

AI訓(xùn)練任務(wù)由多GPU協(xié)同完成

大語言模型在訓(xùn)練的參數(shù)和模型復(fù)雜度上有非常明顯的提升,完成這些計(jì)算必須讓多達(dá)上千個(gè)GPU共同處理訓(xùn)練任務(wù),即便如此,訓(xùn)練或微調(diào)大模型也可能需要數(shù)周甚至數(shù)月的時(shí)間。

一般的多GPU互聯(lián)的架構(gòu)是將一組GPU服務(wù)器放置在機(jī)架中,并通過機(jī)架頂部的交換機(jī)相互連接。機(jī)架與機(jī)架通過CLOS網(wǎng)絡(luò)結(jié)構(gòu)將它們?nèi)窟B接起來。隨著解決問題復(fù)雜性的提升,對(duì)GPU的需求也會(huì)增加,有些情況下單個(gè)數(shù)據(jù)中心的電力不足以支持的時(shí)候,甚至需要跨數(shù)據(jù)中心連接通信來完成更大型的訓(xùn)練任務(wù)。

AI集群是一臺(tái)超級(jí)計(jì)算機(jī)

在構(gòu)建AI集群時(shí),不僅僅要將GPU相互連接,更需要把它作為一個(gè)系統(tǒng),解決很多錯(cuò)誤和優(yōu)化的問題。正因?yàn)锳I集群的規(guī)模不斷的上升,其中任何單點(diǎn)錯(cuò)誤會(huì)導(dǎo)致整體訓(xùn)練任務(wù)的失敗或效率低下,整個(gè)系統(tǒng)的組成部件比如模塊、線纜、交換機(jī)、網(wǎng)卡、服務(wù)器、存儲(chǔ)甚至電源,冷卻系統(tǒng)等,都會(huì)影響整個(gè)系統(tǒng)的執(zhí)行和維護(hù)。AI集群已經(jīng)慢慢由一個(gè)組網(wǎng)變成為一臺(tái)超級(jí)計(jì)算機(jī),越來越多的工作將會(huì)圍繞在部件之間的協(xié)同而不僅是部件內(nèi)部的單點(diǎn)優(yōu)化展開。

網(wǎng)絡(luò)成為了訓(xùn)練效率的關(guān)鍵瓶頸

在去年秋天的開放計(jì)算項(xiàng)目(OCP)全球峰會(huì)上,Marvell Technology的Loi Nguyen指出,網(wǎng)絡(luò)成為了AI部署的新瓶頸。GPU在解決計(jì)算問題或處理訓(xùn)練負(fù)載方面非常有效。然而,進(jìn)行并行計(jì)算的GPU在完成本身處理的信息之外需要獲取其他GPU處理完成的信息,彼此之間需要相互通信和同步。

如果一個(gè)GPU無法獲取所需信息,或者同步需要較長時(shí)間,其他所有GPU都必須等待,直到協(xié)作任務(wù)完成。在技術(shù)層面上,由網(wǎng)絡(luò)擁塞導(dǎo)致的數(shù)據(jù)包延遲或丟失可能會(huì)引發(fā)數(shù)據(jù)包重傳,顯著增加任務(wù)完成時(shí)間(JCT)。

這意味著價(jià)值數(shù)百萬甚至數(shù)千萬美元的GPU長時(shí)間處于閑置狀態(tài),從而導(dǎo)致AI產(chǎn)品的上市時(shí)間延遲并影響公司的財(cái)務(wù)成果。

測試對(duì)于AI網(wǎng)絡(luò)至關(guān)重要

為了確保AI集群的高效運(yùn)行,需要網(wǎng)絡(luò)對(duì)GPU協(xié)同作業(yè)可能存在的擁塞和錯(cuò)誤有提前的感知以及良好的應(yīng)對(duì)。

這要求對(duì)網(wǎng)絡(luò)處理AI負(fù)載的性能進(jìn)行詳盡的測試和基準(zhǔn)評(píng)估。但這并非易事,因?yàn)镚PU協(xié)同作業(yè)的負(fù)載區(qū)別于傳統(tǒng)網(wǎng)絡(luò)的流量負(fù)載,微突發(fā)、大象流、低熵是比較典型的特征。

因此,在測試AI網(wǎng)絡(luò)時(shí),我們會(huì)面臨諸多挑戰(zhàn):

? GPU短缺,無法復(fù)刻生產(chǎn)網(wǎng)絡(luò)環(huán)境或無法長時(shí)間復(fù)現(xiàn)問題。

?在生產(chǎn)系統(tǒng)上進(jìn)行測試可能會(huì)降低系統(tǒng)的處理能力。

?系統(tǒng)內(nèi)的部件不能提供足夠的日志及調(diào)試能力,無法準(zhǔn)確定位問題。

?此外,獲取GPU之間集合通信更細(xì)節(jié)的信息,比如 Queue-Pair 的信息是一個(gè)挑戰(zhàn)。

為了應(yīng)對(duì)這些挑戰(zhàn),可以首先在實(shí)驗(yàn)室環(huán)境中對(duì)建議配置的一個(gè)子集或小的組網(wǎng)進(jìn)行測試,對(duì)關(guān)鍵參數(shù)進(jìn)行基準(zhǔn)測試,比如任務(wù)完成時(shí)間(JCT)、AI集群可達(dá)到的帶寬,以及這些參數(shù)與網(wǎng)絡(luò)利用率和交換機(jī)緩存消耗的比較。

這種基準(zhǔn)測試有助于找到GPU/工作負(fù)載與網(wǎng)絡(luò)設(shè)計(jì)/參數(shù)設(shè)置之間的平衡。當(dāng)計(jì)算架構(gòu)師和網(wǎng)絡(luò)工程師對(duì)結(jié)果滿意時(shí),他們可以將這些設(shè)置應(yīng)用于生產(chǎn)環(huán)境,并測量新的結(jié)果。

結(jié)論

為了充分利用AI算力,必須對(duì)AI網(wǎng)絡(luò)的設(shè)備和基礎(chǔ)設(shè)施進(jìn)行優(yōu)化。

企業(yè)和學(xué)術(shù)界正在提出更多好的架構(gòu)和算法來優(yōu)化AI系統(tǒng)的各個(gè)部件及部件間協(xié)同,以應(yīng)對(duì)未來更多AI應(yīng)用給大型網(wǎng)絡(luò)帶來的挑戰(zhàn)。

測試對(duì)AI系統(tǒng)非常關(guān)鍵,只有通過確定可重復(fù)的測試,行業(yè)才能實(shí)現(xiàn)從探索性實(shí)驗(yàn)到可交付的迭代,這會(huì)是優(yōu)化AI這臺(tái)超級(jí)計(jì)算機(jī)的基礎(chǔ)。

關(guān)于是德科技

是德科技(NYSE:KEYS)啟迪并賦能創(chuàng)新者,助力他們將改變世界的技術(shù)帶入生活。作為一家標(biāo)準(zhǔn)普爾 500 指數(shù)公司,我們提供先進(jìn)的設(shè)計(jì)、仿真和測試解決方案,旨在幫助工程師在整個(gè)產(chǎn)品生命周期中更快地完成開發(fā)和部署,同時(shí)控制好風(fēng)險(xiǎn)。我們的客戶遍及全球通信、工業(yè)自動(dòng)化、航空航天與國防、汽車、半導(dǎo)體和通用電子等市場。我們與客戶攜手,加速創(chuàng)新,創(chuàng)造一個(gè)安全互聯(lián)的世界。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4766

    瀏覽量

    129189
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7592

    瀏覽量

    89067
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31399

    瀏覽量

    269806
  • 是德科技
    +關(guān)注

    關(guān)注

    20

    文章

    892

    瀏覽量

    81927

原文標(biāo)題:關(guān)于AI網(wǎng)絡(luò)你應(yīng)該知道的五件事

文章出處:【微信號(hào):是德科技KEYSIGHT,微信公眾號(hào):是德科技KEYSIGHT】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    微軟Azure AI Agent服務(wù)震撼發(fā)布

    在這場令人矚目的技術(shù)變革中,兩個(gè)要點(diǎn)已毋庸置疑:人工智能技術(shù)正在為各類企業(yè)帶來切實(shí)成果,且AI的創(chuàng)新潛力正在展現(xiàn)出廣闊前景。
    的頭像 發(fā)表于 12-11 16:54 ?370次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    必須通過決策閾值做出決定。 另一個(gè)區(qū)別是AI并不依賴固定的規(guī)則,而是要經(jīng)過訓(xùn)練。訓(xùn)練過程需要將大量貓的圖像展示給神經(jīng)網(wǎng)絡(luò)以供其學(xué)習(xí)。最終,神經(jīng)網(wǎng)絡(luò)將能夠獨(dú)立識(shí)別圖像中是否有貓。關(guān)鍵的一
    發(fā)表于 10-24 13:56

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到一本新書,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章“AI
    發(fā)表于 10-14 09:16

    pcb設(shè)計(jì)中布局的要點(diǎn)是什么

    在PCB設(shè)計(jì)中,布局是一個(gè)非常重要的環(huán)節(jié),它直接影響到電路的性能、可靠性和成本。以下是關(guān)于PCB布局的一些要點(diǎn),這些要點(diǎn)將幫助您設(shè)計(jì)出高質(zhì)量的PCB。 確定設(shè)計(jì)目標(biāo)和要求 在開始布局之
    的頭像 發(fā)表于 09-02 14:48 ?473次閱讀

    六類網(wǎng)絡(luò)模塊與網(wǎng)絡(luò)模塊區(qū)別

    六類網(wǎng)絡(luò)模塊與網(wǎng)絡(luò)模塊在多個(gè)方面存在顯著差異,以下是對(duì)兩者區(qū)別的詳細(xì)分析: 一、傳輸速率 六類網(wǎng)絡(luò)模塊:支持高達(dá)10Gbps的傳輸速率,能夠滿足大容量數(shù)據(jù)傳輸和高頻率應(yīng)用的需求。這
    的頭像 發(fā)表于 07-30 10:05 ?1802次閱讀

    OpenAI公布AI發(fā)展的個(gè)階段

    北京時(shí)間7月12日,OpenAI為追蹤其人工智能(AI)技術(shù)追趕并超越人類智能的進(jìn)程,正式公布了AI發(fā)展的個(gè)階段性劃分,旨在加深公眾對(duì)公司AI
    的頭像 發(fā)表于 07-12 15:50 ?2121次閱讀

    ESP8266如何連接個(gè)Wifi網(wǎng)絡(luò)

    正如我在文檔中讀到的那樣,ESP8266最多可以連接個(gè) Wifi 網(wǎng)絡(luò)。但我無法做到這一點(diǎn)。在啟動(dòng)過程中,我使用以下代碼將最大網(wǎng)絡(luò)數(shù)設(shè)置為 5: printf(\"err:%irn
    發(fā)表于 07-10 07:11

    中國移動(dòng)揭曉關(guān)于人工智能生態(tài)發(fā)展的個(gè)100計(jì)劃

    的宏偉藍(lán)圖——“個(gè)100”計(jì)劃。該計(jì)劃旨在通過開放百項(xiàng)AI融合應(yīng)用場景、匯聚百家頂尖合作伙伴、設(shè)立百億級(jí)權(quán)益支持基金、解鎖百項(xiàng)核心技術(shù)要素,并培育百萬量級(jí)智能實(shí)體,全面加速AI生態(tài)的
    的頭像 發(fā)表于 07-08 16:56 ?1396次閱讀

    生成式AI與神經(jīng)網(wǎng)絡(luò)模型的區(qū)別和聯(lián)系

    生成式AI與神經(jīng)網(wǎng)絡(luò)模型是現(xiàn)代人工智能領(lǐng)域的兩個(gè)核心概念,它們?cè)谕苿?dòng)技術(shù)進(jìn)步和應(yīng)用拓展方面發(fā)揮著至關(guān)重要的作用。本文將詳細(xì)探討生成式AI與神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 15:03 ?891次閱讀

    2030 年2030 年關(guān)于人工智能的點(diǎn)預(yù)測

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自semiengineering以下是關(guān)于2030年人工智能世界將會(huì)呈現(xiàn)出的個(gè)大膽預(yù)測。2030年,人工智能領(lǐng)域?qū)?huì)有怎樣的變化
    的頭像 發(fā)表于 03-28 08:26 ?735次閱讀
    2030 年2030 年<b class='flag-5'>關(guān)于</b>人工智能的<b class='flag-5'>五</b>點(diǎn)預(yù)測

    ai_reloc_network.h引入后,ai_datatypes_format.h和formats_list.h報(bào)錯(cuò)的原因?

    當(dāng)準(zhǔn)備使用神經(jīng)網(wǎng)絡(luò)的relocatable方式,將ai_reloc_network.h頭文件加入程序編譯后,ai_datatypes_format.h在cubeIDE和Keilc里分別報(bào)如下錯(cuò)誤
    發(fā)表于 03-14 06:23

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場景以及優(yōu)勢進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算
    發(fā)表于 03-12 08:09

    智能制造的個(gè)特點(diǎn)是什么?

    智能制造的個(gè)特點(diǎn),如同顆璀璨的繁星,引領(lǐng)著制造業(yè)邁向全新的高度。制造業(yè)智能化升級(jí)已經(jīng)站在風(fēng)口的浪尖,成為全球政策的“新寵”和未來工業(yè)變革的主流趨勢。
    的頭像 發(fā)表于 02-23 10:43 ?1122次閱讀
    智能制造的<b class='flag-5'>五</b><b class='flag-5'>個(gè)</b>特點(diǎn)是什么?

    關(guān)于變頻器的15個(gè)要點(diǎn)知識(shí)(2/2)

    ? ? ? ?接上《關(guān)于變頻器的15個(gè)要點(diǎn)知識(shí)(1/2)》 8、失速防止功能是什么意思? 如果給定的加速時(shí)間過短,變頻器的輸出頻率變化遠(yuǎn)遠(yuǎn)超過轉(zhuǎn)速(電角頻率)的變化,變頻器將因流過過電流而跳閘,運(yùn)轉(zhuǎn)
    的頭像 發(fā)表于 02-02 15:59 ?457次閱讀
    <b class='flag-5'>關(guān)于</b>變頻器的15<b class='flag-5'>個(gè)</b><b class='flag-5'>要點(diǎn)</b>知識(shí)(2/2)
    主站蜘蛛池模板: 国产人妻人伦精品1国产| 99久久免费视频6| 亚洲精品97福利在线| 中文字幕在线不卡精品视频99| 成人精品视频| 亚洲视频精品在线观看| 6080YYY午夜理论片在线观看| 国产精华av午夜在线观看| 免费撕开胸罩吮胸视频| 亚洲国产在线精品国 | 好姑娘社区在线视频| 国产亚洲人成在线视频| 和美女啪啪啪动态图| 欧美性情video sexo视频| 我的好妈妈8高清在线观看WWW| 亚洲精品久久AV无码蜜桃| pkf女尸studiosxnxx| 久久亚洲精品无码A片大香大香| 蜜桃传媒在线观看入口| 欧美亚洲日韩自拍高清中文| 亚洲中文字幕一二三四区苍井空| 国产97视频在线观看| 精品视频久久久久| 小SAO货水真多把你CAO烂| 中文字幕在线视频网站| 国产一区内射最近更新| 午夜办公室在线观看高清电影| 成人在线观看免费视频| 男人插曲视频大全免费网站| 天津相声广播在线收听| 爱暖暖1000部免费| 嗯别插太快好深再深点| 67194成网页发布在线观看| 精品亚洲视频在线观看 | 久久久久久久久a免费| 青青操久久| 亚洲国产高清在线观看视频| 最近日本MV字幕免费观看在线| 国内精品乱码卡一卡2卡三卡| 午夜理伦大片一级| 国产精品ⅴ视频免费观看|