色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發布源2.0基礎大模型,千億參數全面開源

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-11-28 09:10 ? 次閱讀

11月27日,浪潮信息發布"源2.0"基礎大模型,并宣布全面開源。源2.0基礎大模型包括1026億、518億、21億等三種參數規模的模型,在編程、推理、邏輯等方面展示出了先進的能力。

當前,大模型技術正在推動生成式人工智能產業迅猛發展,而基礎大模型的關鍵能力則是大模型在行業和應用落地能力表現的核心支撐,但基礎大模型的發展也面臨著在算法、數據和算力等方面的諸多挑戰。源2.0基礎大模型則針對性地提出了新的改進方法并獲得了能力的提升。

算法方面,源2.0提出并采用了一種新型的注意力算法結構:局部注意力過濾增強機制(LFA:Localized Filtering-based Attention)。LFA通過先學習相鄰詞之間的關聯性,然后再計算全局關聯性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯語義理解更準確、更人性,提升了模型的自然語言表達能力,進而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


數據方面,源2.0通過使用中英文書籍、百科、論文等高質量中英文資料,降低了互聯網語料內容占比,結合高效的數據清洗流程,為大模型訓練提供了高質量的專業數據集和邏輯推理數據集。為了獲取中文數學數據,我們清洗了從2018年至今約12PB的互聯網數據,但僅獲取到了約10GB的數學數據,投入巨大,收益較小。為了更高效地獲得相對匱乏的高質量中文數學及代碼數據集,源2.0采用了基于大模型的數據生產及過濾方法,在保證數據的多樣性的同時也在每一個類別上提升數據質量,獲取了一批高質量的數學與代碼預訓練數據。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均勻流水并行的方法,綜合運用流水線并行+優化器參數并行+數據并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現顯存瓶頸導致的訓練效率降低的問題,該方法顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環境提供了一種高性能的訓練方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作為千億級基礎大模型,在業界公開的評測上進行了代碼生成、數學問題求解、事實問答方面的能力測試,測試結果顯示,源2.0在多項模型評測中,展示出了較為先進的能力表現。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面開源策略,全系列模型參數和代碼均可免費下載使用。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    335

    文章

    28342

    瀏覽量

    230008
  • 浪潮
    +關注

    關注

    1

    文章

    474

    瀏覽量

    24348
  • 大模型
    +關注

    關注

    2

    文章

    2941

    瀏覽量

    3681
收藏 0人收藏

    評論

    相關推薦

    浪潮信息與智研究院攜手共建大模型多元算力生態

    近日,浪潮信息與北京智人工智能研究院正式簽署戰略合作協議,雙方將緊密合作,共同構建大模型多元算力開源創新生態。 此次合作旨在提升大模型創新
    的頭像 發表于 12-31 11:49 ?476次閱讀

    浪潮信息與智研究院達成戰略合作協議

    近日,浪潮信息與智研究院達成戰略合作協議,雙方將緊密協作共建大模型多元算力開源創新生態,提升大模型創新研發的算力效率,降低大
    的頭像 發表于 12-26 10:25 ?419次閱讀

    浪潮信息發布""Yuan-EB,刷新RAG檢索最高成績

    近日,浪潮信息在AI領域取得了重大突破,成功發布了其嵌入模型""Yuan-EB(Yuan-embedding-1.0)。在備受矚目的C-MTEB榜單中,"
    的頭像 發表于 12-25 15:54 ?409次閱讀

    浪潮信息發布”Yuan-EB助力RAG檢索精度新高

    近日,浪潮信息發布”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務第一名,以78.41的平均精度刷新大
    的頭像 發表于 11-26 13:54 ?443次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG檢索精度新高

    浪潮信息源2.0模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開源模型2.0全面適配百度PaddleNLP。這一舉措標志著大
    的頭像 發表于 10-17 18:15 ?808次閱讀

    浪潮信息發布AIStation V5,全面支持大模型開發流程與高效算力調度

    北京2024年7月11日?/美通社/ -- 7月9日,在"元腦中國行"全國巡展濟南站上,浪潮信息發布AIStation 人工智能開發平臺V5升級版,具備全面的大模型流程支持能力,幫助企
    的頭像 發表于 07-12 09:37 ?548次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>AIStation V5,<b class='flag-5'>全面</b>支持大<b class='flag-5'>模型</b>開發流程與高效算力調度

    浪潮信息推出AIGC存儲解決方案

    近日,在科技創新的浪潮中,浪潮信息成功舉辦了“元腦中國行”全國巡展的杭州站活動,此次盛會不僅匯聚了業界的精英與目光,更見證了浪潮信息在AIGC(人工智能生成內容)領域的一次重大突破。會上,浪潮
    的頭像 發表于 07-03 11:16 ?1008次閱讀

    浪潮信息重磅發布2.0-M32”開源模型

    浪潮信息近日發布了一款全新的開源模型——“2.0-M32”。這款大
    的頭像 發表于 06-05 14:50 ?951次閱讀

    畢昇大模型應用開發平臺+浪潮信息AIStation,讓大模型定制更簡單

    北京2024年6月5日?/美通社/ -- 近日,畢昇大模型應用開發平臺與浪潮信息AIStation智能業務生產創新平臺完成兼容性互認證。基于畢昇和浪潮信息AIStation,用戶通過預置的畢昇助手
    的頭像 發表于 06-05 11:58 ?777次閱讀
    畢昇大<b class='flag-5'>模型</b>應用開發平臺+<b class='flag-5'>浪潮信息</b>AIStation,讓大<b class='flag-5'>模型</b>定制更簡單

    浪潮信息發布2.0-M32開源模型,模算效率大幅提升

    5月28日,浪潮信息發布2.0-M32”開源模型。“
    的頭像 發表于 05-29 09:34 ?646次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b><b class='flag-5'>源</b><b class='flag-5'>2.0</b>-M32<b class='flag-5'>開源</b>大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息發布2.0-M32”開源模型

    浪潮信息近日推出了革命性的“2.0-M32”開源模型。該模型
    的頭像 發表于 05-29 09:08 ?837次閱讀

    浪潮信息發布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統,結合新一代數據加速引擎DataTurbo,為用戶提供卓越的存儲解決方案。
    的頭像 發表于 05-14 10:03 ?788次閱讀

    為大模型專門優化 浪潮信息發布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎
    的頭像 發表于 05-10 16:37 ?633次閱讀
    為大<b class='flag-5'>模型</b>專門優化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>分布式全閃存儲AS13000G7-N系列

    通義千問開源千億參數模型

    通義千問近日開源了其首個千億參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型
    的頭像 發表于 05-08 11:01 ?981次閱讀

    浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列

    近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎DataTurbo,
    的頭像 發表于 05-08 09:38 ?781次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>為大<b class='flag-5'>模型</b>專門優化的分布式全閃存儲AS13000G7-N系列
    主站蜘蛛池模板: 国产精品成人啪精品视频免费观看 | 亚洲国产欧美日韩在线一区 | 亚洲天堂视频网站 | ewp系列虐杀在线视频 | 亚洲AV香蕉一区区二区三区蜜桃 | 狠狠插综合| 成人性生交大片免费看4 | 人妻超级精品碰碰在线97视频 | 免费成年人在线视频 | 久久电影精品久久99久久 | 爆操日本美女 | 午夜AV亚洲一码二中文字幕青青 | 久久囯产精品777蜜桃传媒 | 暖暖视频免费观看高清完整版 | 免费看毛片的网址 | 美女伸开两腿让我爽 | 国产精品人成视频免费999 | 超碰免费碰免费视频 | 国产欧美一本道无码 | 欧美激情精品久久久久 | 国产高清免费观看 | 国产三级多多影院 | 射漂亮黑b丝女 | 国产高清视频在线观看不卡v | 国产日韩精品一区二区在线观看 | 久久久久999| 丰满大爆乳波霸奶 | 韩剧甜性涩爱 | 国产美女又黄又爽又色视频网站 | 久久秋霞理伦片 | 精品久久久爽爽久久久AV | 国产综合视频在线观看一区 | 一品道门在线视频 | 性感尼姑风流寺 | 91精品福利一区二区 | 久久精品WWW人人爽人人 | 亚洲麻豆精品成人A在线观看 | 最新日本免费一区 | 夜色爽爽爽久久精品日韩 | 伊人久久大香网 | 亚洲理论片在线中文字幕 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品