色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布源2.0-M32開(kāi)源大模型,模算效率大幅提升

浪潮AIHPC ? 來(lái)源:浪潮AIHPC ? 2024-05-29 09:34 ? 次閱讀

5月28日,浪潮信息發(fā)布“源2.0-M32”開(kāi)源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基礎(chǔ)上,創(chuàng)新性地提出和采用了“基于注意力機(jī)制的門(mén)控網(wǎng)絡(luò)”技術(shù),構(gòu)建包含32個(gè)專(zhuān)家(Expert)的混合專(zhuān)家模型(MoE),并大幅提升了模型算力效率,模型運(yùn)行時(shí)激活參數(shù)37億,在業(yè)界主流基準(zhǔn)評(píng)測(cè)中性能全面對(duì)標(biāo)700億參數(shù)的LLaMA3開(kāi)源大模型。

算法層面源2.0-M32提出并采用了一種新型的算法結(jié)構(gòu):基于注意力機(jī)制的門(mén)控網(wǎng)絡(luò)(Attention Router),針對(duì)MoE模型核心的專(zhuān)家調(diào)度策略,這種新的算法結(jié)構(gòu)關(guān)注專(zhuān)家模型之間的協(xié)同性度量,有效解決傳統(tǒng)門(mén)控網(wǎng)絡(luò)下,選擇兩個(gè)或多個(gè)專(zhuān)家參與計(jì)算時(shí)關(guān)聯(lián)性缺失的問(wèn)題,使得專(zhuān)家之間協(xié)同處理數(shù)據(jù)的水平大為提升。源2.0-M32采用源2.0-2B為基礎(chǔ)模型設(shè)計(jì),沿用并融合局部過(guò)濾增強(qiáng)的注意力機(jī)制(LFA, Localized Filtering-based Attention),通過(guò)先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語(yǔ)言的局部和全局的語(yǔ)言特征,對(duì)于自然語(yǔ)言的關(guān)聯(lián)語(yǔ)義理解更準(zhǔn)確,進(jìn)而提升了模型精度。

9ad71f44-1cea-11ef-b74b-92fbcf53809c.png

Figure1基于注意力機(jī)制的門(mén)控網(wǎng)絡(luò)(Attention Router)

■ 數(shù)據(jù)層面,源2.0-M32基于2萬(wàn)億的token進(jìn)行訓(xùn)練、覆蓋萬(wàn)億量級(jí)的代碼、中英文書(shū)籍、百科、論文及合成數(shù)據(jù)。大幅擴(kuò)展代碼數(shù)據(jù)占比至47.5%,從6類(lèi)最流行的代碼擴(kuò)充至619類(lèi),并通過(guò)對(duì)代碼中英文注釋的翻譯,將中文代碼數(shù)據(jù)量增大至1800億token。結(jié)合高效的數(shù)據(jù)清洗流程,滿(mǎn)足大模型訓(xùn)練“豐富性、全面性、高質(zhì)量”的數(shù)據(jù)集需求。基于這些數(shù)據(jù)的整合和擴(kuò)展,源2.0-M32在代碼生成、代碼理解、代碼推理、數(shù)學(xué)求解等方面有著出色的表現(xiàn)。

■ 算力層面,源2.0-M32采用了非均勻流水并行的方法,綜合運(yùn)用流水線(xiàn)并行+數(shù)據(jù)并行的策略,顯著降低了大模型對(duì)芯片間P2P帶寬的需求,為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。針對(duì)MoE模型的稀疏專(zhuān)家計(jì)算,采用合并矩陣乘法的方法,模算效率得到大幅提升。

基于在算法、數(shù)據(jù)和算力方面全面創(chuàng)新,源2.0-M32的性能得以大幅提升,在多個(gè)業(yè)界主流的評(píng)測(cè)任務(wù)中,展示出了較為先進(jìn)的能力表現(xiàn),在MATH(數(shù)學(xué)競(jìng)賽)、ARC-C(科學(xué)推理)榜單上超越了擁有700億參數(shù)的LLaMA3大模型

9b0363c4-1cea-11ef-b74b-92fbcf53809c.jpg

Figure2 源2.0-M32業(yè)界主流評(píng)測(cè)任務(wù)表現(xiàn)

源2.0-M32大幅提升了模型算力效率,在實(shí)現(xiàn)與業(yè)界領(lǐng)先開(kāi)源大模型性能相當(dāng)?shù)耐瑫r(shí),顯著降低了在模型訓(xùn)練、微調(diào)和推理所需的算力開(kāi)銷(xiāo)。在模型推理運(yùn)行階段,M32處理每token所需算力為7.4GFLOPs,而LLaMA3-70B所需算力為140GFLOPs。在模型微調(diào)訓(xùn)練階段,對(duì)1萬(wàn)條平均長(zhǎng)度為1024 token的樣本進(jìn)行全量微調(diào),M32消耗算力約0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力約為0.05PD。M32憑借特別優(yōu)化設(shè)計(jì)的模型架構(gòu),在僅激活37億參數(shù)的情況下,取得了和700億參數(shù)LLaMA3相當(dāng)?shù)男阅芩剑乃懔H為L(zhǎng)LaMA3的1/19,從而實(shí)現(xiàn)了更高的模算效率。

浪潮信息人工智能首席科學(xué)家吳韶華表示:當(dāng)前業(yè)界大模型在性能不斷提升的同時(shí),也面臨著所消耗算力大幅攀升的問(wèn)題,對(duì)企業(yè)落地應(yīng)用大模型帶來(lái)了極大的困難和挑戰(zhàn)。源2.0-M32是浪潮信息在大模型領(lǐng)域持續(xù)耕耘的最新探索成果,通過(guò)在算法、數(shù)據(jù)、算力等方面的全面創(chuàng)新,M32不僅可以提供與業(yè)界領(lǐng)先開(kāi)源大模型相當(dāng)?shù)男阅埽梢源蠓档痛竽P退杷懔ο摹?strong>大幅提升的模算效率將為企業(yè)開(kāi)發(fā)應(yīng)用生成式AI提供模型高性能、算力低門(mén)檻的高效路徑。M32開(kāi)源大模型配合企業(yè)大模型開(kāi)發(fā)平臺(tái)EPAI(Enterprise Platform of AI),將助力企業(yè)實(shí)現(xiàn)更快的技術(shù)迭代與高效的應(yīng)用落地,為人工智能產(chǎn)業(yè)的發(fā)展提供堅(jiān)實(shí)的底座和成長(zhǎng)的土壤,加速產(chǎn)業(yè)智能化進(jìn)程。


審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1794

    文章

    47642

    瀏覽量

    239646
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2541

    瀏覽量

    3019
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    514

    瀏覽量

    521

原文標(biāo)題:浪潮信息發(fā)布源2.0-M32開(kāi)源大模型,模算效率大幅提升,37億激活參數(shù)性能對(duì)標(biāo)LLaMA3-700億

文章出處:【微信號(hào):浪潮AIHPC,微信公眾號(hào):浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    浪潮信息與智研究院攜手共建大模型多元力生態(tài)

    近日,浪潮信息與北京智人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構(gòu)建大模型多元開(kāi)源創(chuàng)新生態(tài)。 此次合作旨在
    的頭像 發(fā)表于 12-31 11:49 ?274次閱讀

    浪潮信息與智研究院達(dá)成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智研究院達(dá)成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元開(kāi)源創(chuàng)新生態(tài),提升
    的頭像 發(fā)表于 12-26 10:25 ?210次閱讀

    捷通達(dá)攜手浪潮信息,ERP系統(tǒng)性能大幅提升

    的共同努力,捷通達(dá)成功將原有的SAP HANA系統(tǒng)升級(jí)為浪潮信息新一代SAP HANA數(shù)據(jù)庫(kù)一體機(jī)解決方案。這一升級(jí)不僅大幅提升了系統(tǒng)的運(yùn)行效率,更使得ERP系統(tǒng)的數(shù)據(jù)查詢(xún)時(shí)間
    的頭像 發(fā)表于 12-24 14:36 ?209次閱讀

    浪潮信息發(fā)布KOS AI定制版,大幅提升模型訓(xùn)練效率

    浪潮信息近期推出了“元腦服務(wù)器操作系統(tǒng)KOS AI定制版”,為人工智能領(lǐng)域帶來(lái)了革命性的變化。這款定制版操作系統(tǒng)通過(guò)簡(jiǎn)單的兩步操作,即可實(shí)現(xiàn)大模型訓(xùn)練環(huán)境的快速部署。
    的頭像 發(fā)表于 10-30 17:23 ?572次閱讀

    浪潮信息源2.0模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開(kāi)源模型2.0已全面適配百度PaddleNLP。這一舉措標(biāo)志著大模型開(kāi)發(fā)
    的頭像 發(fā)表于 10-17 18:15 ?554次閱讀

    2.0-M32模型發(fā)布量化版 運(yùn)行顯存僅需23GB 性能可媲美LLaMA3

    北京2024年8月23日?/美通社/ -- 近日,浪潮信息發(fā)布2.0-M32模型4bit和8bit量化版,性能比肩700億參數(shù)的LLaM
    的頭像 發(fā)表于 08-25 22:06 ?349次閱讀
    <b class='flag-5'>源</b><b class='flag-5'>2.0-M32</b>大<b class='flag-5'>模型</b><b class='flag-5'>發(fā)布</b>量化版 運(yùn)行顯存僅需23GB 性能可媲美LLaMA3

    浪潮信息攜全棧智產(chǎn)品和方案亮相WAIC 2024

    7月4日,2024世界人工智能大會(huì)(WAIC2024)在上海開(kāi)幕。大會(huì)聚焦大模型力、機(jī)器人、自動(dòng)駕駛等重點(diǎn)領(lǐng)域,吸引眾多國(guó)內(nèi)外知名人工智能企業(yè)參會(huì)。作為全球領(lǐng)先的IT基礎(chǔ)設(shè)施供應(yīng)商,浪潮信息參加
    的頭像 發(fā)表于 07-05 18:04 ?1521次閱讀

    浪潮信息重磅發(fā)布2.0-M32開(kāi)源模型

    浪潮信息近日發(fā)布了一款全新的開(kāi)源模型——“2.0-M32”。這款大
    的頭像 發(fā)表于 06-05 14:50 ?825次閱讀

    浪潮信息發(fā)布2.0-M32開(kāi)源模型

    浪潮信息近日推出了革命性的“2.0-M32開(kāi)源模型。該模型
    的頭像 發(fā)表于 05-29 09:08 ?701次閱讀

    浪潮信息發(fā)布企業(yè)大模型開(kāi)發(fā)平臺(tái)&quot;元腦企智&quot;EPAI,加速AI創(chuàng)新落地

    北京2024年4月18日?/美通社/ -- 4月17日,在2024浪潮信息生態(tài)伙伴大會(huì)(IPF2024)上,浪潮信息發(fā)布企業(yè)大模型開(kāi)發(fā)平臺(tái)"元腦企智"EPAI(Enterprise P
    的頭像 發(fā)表于 04-18 21:21 ?487次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>企業(yè)大<b class='flag-5'>模型</b>開(kāi)發(fā)平臺(tái)&quot;元腦企智&quot;EPAI,加速AI創(chuàng)新落地

    浪潮信息發(fā)布企業(yè)大模型開(kāi)發(fā)平臺(tái)“元腦企智”EPAI

    4月17日,在2024浪潮信息生態(tài)伙伴大會(huì)(IPF2024)上,浪潮信息重磅發(fā)布企業(yè)大模型開(kāi)發(fā)平臺(tái)“元腦企智”EPAI(Enterprise Platform of AI),為企業(yè)AI
    的頭像 發(fā)表于 04-18 10:12 ?414次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>企業(yè)大<b class='flag-5'>模型</b>開(kāi)發(fā)平臺(tái)“元腦企智”EPAI

    浪潮信息&quot;2.0&quot;大模型YuanChat支持英特爾最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息與英特爾正式宣布,浪潮信息"2.0系列基礎(chǔ)大模型"已和最新的英特爾? 酷
    的頭像 發(fā)表于 03-27 22:52 ?547次閱讀
    <b class='flag-5'>浪潮信息</b>&quot;<b class='flag-5'>源</b><b class='flag-5'>2.0</b>&quot;大<b class='flag-5'>模型</b>YuanChat支持英特爾最新商用AI PC

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息2.0系列基礎(chǔ)大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺(tái)完成適配,本地推理速
    的頭像 發(fā)表于 03-27 13:50 ?682次閱讀
    <b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b><b class='flag-5'>效率</b>工具“YuanChat”

    潞晨科技Colossal-AI與浪潮信息AIStation完成兼容性互認(rèn)證

    近日,潞晨科技的Colossal-AI大模型開(kāi)發(fā)工具和浪潮信息的AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺(tái)成功完成了兼容性互認(rèn)證。這一合作意味著用戶(hù)可以在AIStation平臺(tái)上便捷地部署與調(diào)度Colossal-AI系統(tǒng),從而極大提升
    的頭像 發(fā)表于 03-06 10:18 ?870次閱讀

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開(kāi)發(fā)效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型開(kāi)發(fā)工具與浪潮信息AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺(tái)完成兼容性互認(rèn)證。基于AIStation平臺(tái)部署與調(diào)度
    的頭像 發(fā)表于 03-01 09:43 ?520次閱讀
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>開(kāi)發(fā)<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍
    主站蜘蛛池模板: 国产区免费在线观看 | 国产精品第一综合首页 | 青娱乐极品视觉盛宴国产视频 | 免费完整版观看 | 成人性生交大片免费看4 | 夜里18款禁用的免费B站动漫 | 欧美影院在线观看完整版 mp4 | 波多野结衣教师系列6 | 亚洲精品久久久久中文字幕二区 | 老司机午夜影院试看区 | 啪啪漫画无遮挡全彩h网站 啪啪漫画无遮挡全彩h同人 | 久久精品久久精品 | 日本午夜福利无码高清 | 国产亚洲精品第一区香蕉 | 伊人青青久 | 97午夜精品 | 亚洲国产精品一区二区久久第 | 中文字幕亚洲乱码熟女在线萌芽 | 久久久精品日本一区二区三区 | 中文亚洲大香伊蕉不卡一区 | 香蕉精品国产自在现线拍 | 蜜芽最新域名解析网站 | 超清无码波多野吉衣与黑人 | RAPPER性骚扰大开黄腔 | WWW国产色情在线观看APP | 九九久久国产 | 成人精品视频在线观看 | 国产又色又爽又刺激在线播放 | 97精品伊人久久大香线蕉app | 亚洲精品高清在线观看 | 欧美午夜理伦三级在线观看 | 狠狠干女人| 日本无码专区亚洲麻豆 | 日本熟妇多毛XXXXX视频 | 男女做爽爽爽视频免费软件 | 乌克兰18性hd | 日韩中文字幕欧美在线视频 | 4484在线观看视频 | 国产毛多水多高潮高清 | 16女下面流水不遮图免费观看 | 超嫩校花被灌醉在线观看 |