色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI大模型瘋長,存儲扛住了嗎?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-04-15 14:31 ? 次閱讀

科技云報道原創(chuàng)。

AI大模型正在倒逼數(shù)字基礎(chǔ)設(shè)施產(chǎn)業(yè)加速升級。

過去一年半,AI大模型標(biāo)志性的應(yīng)用相繼出現(xiàn),從ChatGPT到Sora一次次刷新人們的認(rèn)知。震撼的背后,是大模型參數(shù)指數(shù)級的增長。

這種數(shù)據(jù)暴漲的壓力,快速傳導(dǎo)到了大模型的底層基礎(chǔ)設(shè)施。作為支撐大模型的底座“三大件”——算力、網(wǎng)絡(luò)、存儲,都在快速的迭代。

算力方面,英偉達(dá)用了兩年的時間就將GPU從H100升級到了H200,讓模型的訓(xùn)練性能提升了5倍。

網(wǎng)絡(luò)方面,從之前的25G升級到現(xiàn)在的200G,網(wǎng)絡(luò)帶寬提升了6倍。隨著RDMA大規(guī)模的應(yīng)用,網(wǎng)絡(luò)延遲也降低了60%。

存儲方面,華為、阿里云、百度智能云、騰訊云等大廠,都相繼推出了面向AI大模型的存儲方案。

那么作為基礎(chǔ)設(shè)施的三大件之一的存儲,在AI大模型的場景下到底發(fā)生了哪些變化?又有哪些新的技術(shù)挑戰(zhàn)?

AI大模型帶來的 存儲挑戰(zhàn)

算力、算法、數(shù)據(jù),在發(fā)展AI過程中的重要性早已為人所熟知,但是作為數(shù)據(jù)的承載,存儲卻往往被忽略。

在訓(xùn)練AI大模型的過程中,需要大量數(shù)據(jù)的交換,存儲作為數(shù)據(jù)的基礎(chǔ)硬件,并非僅僅只是簡單地記錄數(shù)據(jù),而是深刻參與到了數(shù)據(jù)歸集、流轉(zhuǎn)、利用等大模型訓(xùn)練的全流程。

如果存儲性能不強(qiáng),那么可能需要耗費大量時間才能完成一次訓(xùn)練,這就會嚴(yán)重制約大模型的發(fā)展迭代。

事實上,不少企業(yè)在開發(fā)及實施大模型應(yīng)用過程中,已經(jīng)開始意識到存儲系統(tǒng)所面臨的巨大挑戰(zhàn)。

從AI大模型的研發(fā)生產(chǎn)流程看,可分為數(shù)據(jù)采集、清洗、訓(xùn)練和應(yīng)用四個階段,各階段都對存儲提出了新的要求,比如:

在數(shù)據(jù)采集環(huán)節(jié),由于原始訓(xùn)練數(shù)據(jù)規(guī)模海量,且來源多樣,企業(yè)希望能夠有一個大容量、低成本、高可靠的數(shù)據(jù)存儲底座。

在數(shù)據(jù)清洗階段,網(wǎng)絡(luò)上收集的原始數(shù)據(jù)是不能直接用于AI模型訓(xùn)練的,需要將多格式、多協(xié)議的數(shù)據(jù)進(jìn)行清洗、去重、過濾、加工,行業(yè)內(nèi)稱其為“數(shù)據(jù)預(yù)處理”。

與傳統(tǒng)單模態(tài)小模型訓(xùn)練相比,多模態(tài)大模型所需的訓(xùn)練數(shù)據(jù)量是其1000倍以上,一個典型的百TB級大模型數(shù)據(jù)集,預(yù)處理時長超過10天,占比AI數(shù)據(jù)挖掘全流程的30%。

同時,數(shù)據(jù)預(yù)處理伴隨高并發(fā)處理,對算力消耗巨大。這就要求存儲能夠提供多協(xié)議、高性能的支持,用標(biāo)準(zhǔn)文件的方式完成海量數(shù)據(jù)的清洗和轉(zhuǎn)換,以縮短數(shù)據(jù)預(yù)處理的時長。

在模型訓(xùn)練環(huán)節(jié),通常會出現(xiàn)訓(xùn)練集加載慢、易中斷、數(shù)據(jù)恢復(fù)時間長等問題。

相較于傳統(tǒng)學(xué)習(xí)模型,大模型訓(xùn)練參數(shù)、訓(xùn)練數(shù)據(jù)集指數(shù)級增加,如何實現(xiàn)海量小文件數(shù)據(jù)集快速加載,降低 GPU等待時間是關(guān)鍵。

目前,主流預(yù)訓(xùn)練模型已經(jīng)有千億級參數(shù),而頻繁的參數(shù)調(diào)優(yōu)、網(wǎng)絡(luò)不穩(wěn)定、服務(wù)器故障等多種因素帶來訓(xùn)練過程不穩(wěn)定,易中斷返工,需要Checkpoints機(jī)制來確保訓(xùn)練回退到還原點,而不是初始點。

當(dāng)前,由于Checkpoints需要天級的恢復(fù)時長,導(dǎo)致大模型整體訓(xùn)練周期陡增,而面對單次超大的數(shù)據(jù)量和未來小時級的頻度要求,需要認(rèn)真考慮如何降低Checkpoints恢復(fù)時長。

因此,存儲能否快速地讀寫checkpoint(檢查點)文件,也成了能否高效利用算力資源、提高訓(xùn)練效率的關(guān)鍵。

在應(yīng)用階段,存儲需要提供比較豐富的數(shù)據(jù)審核的能力,來滿足鑒黃鑒暴安全合規(guī)的訴求,保證大模型生成的內(nèi)容是合法、合規(guī)的方式去使用。

總的來說,AI大模型訓(xùn)練的效率要達(dá)到極致,減少不必要的浪費,必須在數(shù)據(jù)上下功夫。準(zhǔn)確地說,必須要在數(shù)據(jù)存儲技術(shù)上進(jìn)行創(chuàng)新。

AI倒逼存儲技術(shù)創(chuàng)新

根據(jù)投資機(jī)構(gòu)ARK Invest預(yù)算,到2030年,產(chǎn)業(yè)有望訓(xùn)練出比GPT-3多57倍參數(shù)、多720倍Token的AI模型,成本將從今天的170億美元降至60萬美元。隨著計算價格降低,數(shù)據(jù)將成為大模型生產(chǎn)的主要限制因素。

面對數(shù)據(jù)桎梏問題,不少企業(yè)已經(jīng)開始進(jìn)行前瞻性布局。

比如百川智能、智譜、元象等大模型企業(yè),都已采用騰訊云AIGC云存儲解決方案來提升效率。

數(shù)據(jù)顯示,騰訊云AIGC云存儲解決方案,可將大模型的數(shù)據(jù)清洗和訓(xùn)練效率均提升一倍,需要的時間縮短一半。

科大訊飛、中科院等大模型企業(yè)和機(jī)構(gòu),則采用了華為AI存儲相關(guān)產(chǎn)品

數(shù)據(jù)顯示,華為OceanStor A310可實現(xiàn)從數(shù)據(jù)歸集、預(yù)處理到模型訓(xùn)練、推理應(yīng)用的AI全流程海量數(shù)據(jù)管理,簡化數(shù)據(jù)歸集流程,減少數(shù)據(jù)搬移,預(yù)處理效率提升30%。

目前,國內(nèi)各大廠商也相繼發(fā)布了面向AI大模型場景的存儲方案。

2023年7月,華為發(fā)布兩款面向AI大模型的存儲產(chǎn)品——OceanStor A310深度學(xué)習(xí)數(shù)據(jù)湖存儲和FusionCube A3000訓(xùn)/推超融合一體機(jī)。

2023年11月云棲大會上,阿里云推出一系列針對大模型場景的存儲產(chǎn)品創(chuàng)新,用AI技術(shù)賦能AI業(yè)務(wù),幫助用戶更輕松地管理大規(guī)模多模態(tài)數(shù)據(jù)集,提高模型訓(xùn)練、推理的效率和準(zhǔn)確性。

2023年12月,百度智能云發(fā)布了“百度滄?!ご鎯Α苯y(tǒng)一技術(shù)底座,同時面向數(shù)據(jù)湖存儲和AI存儲能力進(jìn)行了全面增強(qiáng)。

2024年4月,騰訊云宣布云存儲解決方案面向AIGC場景全面升級,針對AI大模型數(shù)據(jù)采集清洗、訓(xùn)練、推理、數(shù)據(jù)治理全流程提供全面、高效的云存儲支持。

綜合各大廠商的存儲技術(shù)創(chuàng)新,可以發(fā)現(xiàn)技術(shù)方向較為統(tǒng)一,都是基于AI大模型生產(chǎn)研發(fā)的全流程,對存儲產(chǎn)品進(jìn)行有針對性的性能優(yōu)化。

以騰訊云為例,在數(shù)據(jù)采集與清洗環(huán)節(jié),首先需要存儲能夠支持多協(xié)議、高性能、大帶寬。

因此,騰訊云對象存儲COS能夠支持單集群管理百 EB 級別存儲規(guī)模,提供便捷、高效的數(shù)據(jù)公網(wǎng)接入能力,并支持多種協(xié)議,充分支持大模型PB級別的海量數(shù)據(jù)采集。

同時,數(shù)據(jù)清洗時,大數(shù)據(jù)引擎需要快速地讀取并過濾出有效數(shù)據(jù)。騰訊云對象存儲COS通過自研數(shù)據(jù)加速器GooseFS提升數(shù)據(jù)訪問性能,實現(xiàn)了高達(dá)數(shù)TBps的讀取帶寬,支撐計算高速運行,大大提升數(shù)據(jù)清洗效率。

在模型訓(xùn)練環(huán)節(jié),通常需要每2-4小時保存一次訓(xùn)練成果,以便能在GPU故障時時能回滾。

騰訊云自主研發(fā)并行文件存儲CFS Turbo ,面向AIGC訓(xùn)練場景的進(jìn)行了專門優(yōu)化,每秒總讀寫吞吐達(dá)到TiB/s級別,每秒元數(shù)據(jù)性能高達(dá)百萬OPS,均為業(yè)界第一。3TB checkpoint 寫入時間從10分鐘,縮短至10秒內(nèi),使大模型訓(xùn)練效率大幅提升。

大模型推理場景對數(shù)據(jù)安全與可追溯性提出更高要求。

騰訊云數(shù)據(jù)萬象CI為此提供圖片隱式水印、AIGC內(nèi)容審核、智能數(shù)據(jù)檢索MetaInsight等能力,為數(shù)據(jù)生產(chǎn)從“用戶輸入——預(yù)處理——內(nèi)容審核——版權(quán)保護(hù)——安全分發(fā)——信息檢索”業(yè)務(wù)全流程提供有力支撐,優(yōu)化AIGC內(nèi)容生產(chǎn)與管理模式,順應(yīng)監(jiān)管導(dǎo)向,拓寬存儲邊界。

同時,隨著訓(xùn)練數(shù)據(jù)和推理數(shù)據(jù)的增長,需要提供低成本的存儲能力,減少存儲開銷。騰訊云對象存儲服務(wù)提供了高達(dá)12個9的數(shù)據(jù)持久性和99.995%的數(shù)據(jù)可用性,能夠為業(yè)務(wù)提供持續(xù)可用的存儲服務(wù)。

總的來說,隨著AI大模型的推進(jìn),數(shù)據(jù)存儲出現(xiàn)了新的趨勢。市場渴望更高性能、大容量、低成本的存儲產(chǎn)品,并加速大模型各個環(huán)節(jié)的融合和效率提升。

而各大廠商也在通過技術(shù)創(chuàng)新不斷滿足大模型各環(huán)節(jié)的需求,為企業(yè)實施大模型降低門檻。

在AI大模型的倒逼下,存儲創(chuàng)新已在路上。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4332

    瀏覽量

    85953
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31155

    瀏覽量

    269485
  • 騰訊云
    +關(guān)注

    關(guān)注

    0

    文章

    214

    瀏覽量

    16815
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    363

    瀏覽量

    1561
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2491

    瀏覽量

    2870
收藏 人收藏

    評論

    相關(guān)推薦

    AI模型托管原理分析

    AI模型托管是指將訓(xùn)練好的AI模型部署在云端或邊緣服務(wù)器上,由第三方平臺提供模型運行、管理和優(yōu)化等服務(wù)。以下,
    的頭像 發(fā)表于 11-07 09:33 ?207次閱讀

    ai模型ai框架的關(guān)系是什么

    AI模型AI框架是人工智能領(lǐng)域中兩個重要的概念,它們之間的關(guān)系密切且復(fù)雜。 AI模型的定義和特點
    的頭像 發(fā)表于 07-16 10:07 ?4w次閱讀

    ai模型和傳統(tǒng)ai的區(qū)別在哪?

    AI模型和傳統(tǒng)AI的區(qū)別主要體現(xiàn)在以下幾個方面: 數(shù)據(jù)量和訓(xùn)練規(guī)模 AI模型通常需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,以獲得更好的性能。相比之下,傳統(tǒng)
    的頭像 發(fā)表于 07-16 10:06 ?1423次閱讀

    AI模型AI框架的關(guān)系

    在探討AI模型AI框架的關(guān)系時,我們首先需要明確兩者的基本概念及其在人工智能領(lǐng)域中的角色。AI模型通常指的是具有極大規(guī)模、高度復(fù)雜性和
    的頭像 發(fā)表于 07-15 11:42 ?1150次閱讀

    AI模型與傳統(tǒng)AI的區(qū)別

    AI模型(如LLM,即大型語言模型)與傳統(tǒng)AI在多個方面存在顯著的區(qū)別。以下將從技術(shù)層面、應(yīng)用場景、性能表現(xiàn)、計算資源和成本、以及發(fā)展趨勢和挑戰(zhàn)等角度進(jìn)行詳細(xì)闡述。
    的頭像 發(fā)表于 07-15 11:37 ?2889次閱讀

    AI模型與小模型的優(yōu)缺點

    在人工智能(AI)的廣闊領(lǐng)域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度,我們可以將其大致分為AI模型
    的頭像 發(fā)表于 07-10 10:39 ?2908次閱讀

    stm32f4的板子配置can,發(fā)完can_sampel can2就卡住了的原因?

    分析儀發(fā)送沒有返回,是卡住了嗎
    發(fā)表于 07-09 07:32

    降價潮背后:大模型落地門檻真的降了嗎

    “比起價格門檻,AI模型的應(yīng)用門檻,更難跨越?!贝?b class='flag-5'>模型爭相降價下,AI應(yīng)用的門檻真的降低了嗎?答案還真不一定。因為除了價格門檻,
    的頭像 發(fā)表于 06-13 08:04 ?275次閱讀
    降價潮背后:大<b class='flag-5'>模型</b>落地門檻真的降<b class='flag-5'>了嗎</b>?

    ESP32-S3-EYE卡住了無法啟動時什么原因?qū)е碌模?/a>

    剛買的ESP32-S3-EYE,卡住了無法啟動,是硬件算壞了嗎,
    發(fā)表于 06-05 07:10

    STM CUBE AI錯誤導(dǎo)入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    為什么Cubeai導(dǎo)入模型的時候報錯[AI:persondetection] ModuleNotFoundError: No module named \'_socket\'?

    在使用CubeIde導(dǎo)入ai模型進(jìn)行模型分析的時候報錯[AI:persondetection] ModuleNotFoundError: No module named \'_sock
    發(fā)表于 05-21 06:44

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開發(fā)套件評測4

    設(shè)計中集成硬件安全模塊(HSM),該模塊可以提供安全的存儲、加密和解密服務(wù)。 安全密鑰管理 :使用HSM生成、存儲和管理用于保護(hù)AI模型的加密密鑰。 2.
    發(fā)表于 03-19 11:18

    cubemx ai導(dǎo)入onnx模型后壓縮失敗了怎么解決?

    cubemx ai導(dǎo)入onnx模型后壓縮失敗。請問我怎么解決
    發(fā)表于 03-19 07:58

    AI模型遠(yuǎn)程控制啟動車輛(原創(chuàng))

    AI模型
    還沒吃飯
    發(fā)布于 :2024年03月18日 15:18:29

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 03-14 07:09
    主站蜘蛛池模板: 偷尝禁果H1V1幸运的山熊| FREEXXX性乌克兰XXX| 久久精品国产在热亚洲完整版| 2019午夜福合集不打码| 日本免费一本天堂在线| 好男人WWW免费高清视频在线| 99久久999久久久综合精品涩| 亚洲AV无码影院在线播放| 男男被强bl高h文| 国产精品你懂得| 99久久免费看国产精品| 亚洲视频黄| 无码内射成人免费喷射| 女人爽到高潮嗷嗷叫视频| 久久66热在线视频精品| 国产精品第十页| 啊灬啊别停灬用力啊在线观看视频 | 国产精品久久久久久久久久影院| 999久久久无码国产精蜜柚| 亚洲一区二区影院| 午夜男人免费福利视频| 日韩欧美视频一区二区| 欧美大香线蕉线伊人久久| 看了n遍舍不得删的黄文| 精品国产麻豆免费人成网站| 国产免费内射又粗又爽密桃视频| 成人在线免费视频| mm625亚洲人成电影网| 97人视频国产在线观看| 在线 国产 欧美 专区| 亚洲国产精品自在自线观看| 午夜DV内射一区二区| 色中色论坛网站| 色戒在线完整观看在线播放版| 欧美亚洲国内日韩自拍视频| 男女啪啪久久精品亚洲A| 麻豆久久婷婷五月国产| 久久综合久综合久久鬼色| 久久久久嫩草影院精品| 久久99国产精品一区二区| 精品久久中文字幕有码|