色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

王小川大模型首亮相!70億參數霸榜,清北搶先用

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-06-15 17:56 ? 次閱讀

【新智元導讀】今天,百川智能正式發布70億參數開源中英文大模型——baichuan-7B,一舉拿下多個評測榜單最佳成績。

時隔兩個月,王小川組建的「百川智能」在6月15日正式推出首個70億參數中英文預訓練大模型——baichuan-7B。

baichuan-7B不僅在C-Eval、AGIEval和Gaokao中文權威評測榜單上,以顯著優勢全面超過了ChatGLM-6B等其他大模型,并且在MMLU英文權威評測榜單上,大幅領先LLaMA-7B。

目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平臺發布。

c7982e4a-0b59-11ee-962d-dac502259ad0.png

Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7B

Github:https://github.com/baichuan-inc/baichuan-7B

Model Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary

多個中文評估基準拿下7B最佳

為了驗證模型的各項能力,baichuan-7B在C-Eval、AGIEval和Gaokao三個最具影響力的中文評估基準進行了綜合評估,并且均獲得了優異成績,它已經成為同等參數規模下中文表現最優秀的原生預訓練模型。

c7cb6530-0b59-11ee-962d-dac502259ad0.png

在AGIEval的評測里,baichuan-7B綜合評分達到34.4分,遠超LLaMA-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他開源模型。

在中文C-EVAL的評測中,baichuan-7B的綜合評分達到了42.8分,超過了ChatGLM-6B的38.9分,甚至比某些參數規模更大的模型還要出色。

在Gaokao評測中,baichuan-7B的綜合評分達到了36.2分,顯著領先于同參數規模的各種其他預訓練模型。

c7f185b2-0b59-11ee-962d-dac502259ad0.png

https://cevalbenchmark.com/static/leaderboard_zh.html(2023-06-15)

AGIEval評測基準由微軟研究院發起,旨在全面評估基礎模型在人類認知和問題解決相關任務上的能力,包含了中國的高考、司法考試,以及美國的SAT、LSAT、GRE和GMAT等20個公開且嚴謹的官方入學和職業資格考試。

C-Eval評測基準由上海交通大學、清華大學以及愛丁堡大學聯合創建,是面向中文語言模型的綜合考試評測集,覆蓋了52個來自不同行業領域的學科。

Gaokao評測基準是復旦大學研究團隊創建的評測框架,以中國高考題目作為數據集,用于測試大模型在中文語言理解和邏輯推理能力方面的表現。

MMLU基準大幅領先LLaMA-7B

baichuan-7B不僅在中文方面表現優異,在英文上表現同樣亮眼。

在MMLU的評測中baichuan-7B綜合評分高達42.5分,大幅領先英文開源預訓練模型LLaMA-7B的34.2分以及中文開源模型ChatGLM-6B的36.9分。

c81e6528-0b59-11ee-962d-dac502259ad0.png

MMLU由加州大學伯克利分校等知名高校共同打造,集合了科學、工程、數學、人文、社會科學等領域的57個科目,主要目標是對模型的英文跨學科專業能力進行深入測試。其內容廣泛,從初級水平一直涵蓋到高級專業水平。

萬億數據、4K上下文、高效穩定訓練

訓練語料對大模型的訓練結果至關重要。在構建預訓練語料庫方面,百川智能以高質量中文語料為基礎,同時融合了優質的英文數據。

具體來說,原始數據包括自行抓取的海量中英文互聯網數據和部分開源的中英文數據,以及大量高質量知識性數據。

c8319c42-0b59-11ee-962d-dac502259ad0.png

在數據質量方面,通過質量模型對數據進行打分,對原始數據集進行篇章級和句子級的精確篩選。

在內容多樣性方面,利用自研超大規模局部敏感哈希聚類系統和語義聚類系統,對數據進行了多層次多粒度的聚類,最終構建了包含1.2萬億token的兼顧質量和多樣性的預訓練數據。

相較于其他同參數規模的開源中文預訓練模型,數據量提高了超過50%。

在萬億優質中英文數據的基礎上,為了更好地提升訓練效率,baichuan-7B深度整合了模型算子來加快計算流程,并針對任務負載和集群配置,自適應優化了模型并行策略以及重計算策略。

通過高效的訓練過程調度通信,baichuan-7B成功地實現了計算與通信的高效重疊,進而達到了超線性的訓練加速,在千卡集群上訓練吞吐達到180+Tflops的業界領先水平。

同時,已有的開源模型窗口長度在2K以內,對于一些長文本建模任務,如需要引入外部知識做搜索增強的場景,更長的處理長度有助于模型在訓練與推理階段捕獲越多的上下文信息,2K的處理長度存在比較大的制約。

c8432ab6-0b59-11ee-962d-dac502259ad0.png

經過優化的分詞算法

baichuan-7B基于高效的attention算子優化實現了萬級別超長動態窗口的擴張能力,本次開源的預訓練模型開放了4K上下文窗口,使模型應用場景更加廣泛。

此外,baichuan-7B還對模型訓練流程進行了深度優化,采用了更科學且穩定的訓練流程和超參數選擇,使得 baichuan-7B模型的收斂速度大大提升。

與同等參數規模的模型相比,baichuan-7B在困惑度(PPL)和訓練損失(training loss)等關鍵性能指標上表現更加優秀。

c85606b8-0b59-11ee-962d-dac502259ad0.png

開源免費可商用,清北已搶先體驗

秉持開源精神,baichuan-7B代碼采用Apache-2.0協議,模型權重采用了免費商用協議,只需進行簡單登記即可免費商用。

baichuan-7B此次開源的內容十分豐富,包含了推理代碼、INT4量化實現、微調代碼,以及預訓練模型的權重。

其中,微調代碼方便用戶對模型進行調整和優化;推理代碼與INT4量化實現則有助于開發者低成本地進行模型的部署和應用;預訓練模型權重開源后,用戶則可以直接使用預訓練模型進行各種實驗研究。

據了解,北京大學和清華大學兩所頂尖大學已率先使用baichuan-7B模型推進相關研究工作,并計劃在未來與百川智能深入合作,共同推動baichuan-7B模型的應用和發展。

清華大學互聯網司法研究院院長、計算機系教授劉奕群認為, baichuan-7B模型在中文上的效果表現十分出色,它免費商用的開源方式展現出開放的態度,不僅貢獻社區,也推動技術發展。團隊計劃基于baichuan-7B模型開展司法人工智能領域的相關研究。

北京大學人工智能研究院助理教授楊耀東認為,baichuan-7B模型的開源將對于中文基礎語言模型的生態建設及學術研究產生重要推動作用,同時他也表示將持續關注相關領域探索,并且在中文大語言模型的安全和對齊上進行進一步深入研究。

百川智能CEO王小川表示:「本次開源模型的發布是百川智能成立2個月后的第一個里程碑,對百川智能而言是一個良好的開局。baichuan-7B模型,不僅能為中國的AGI事業添磚加瓦,也為世界大模型開源社區貢獻了新的力量。」

技術團隊專訪

Q:baichuan-7B如何處理幻覺問題,未來該如何提高結果正確性?

A:大模型在可見的未來還不能徹底解決幻覺問題,一方面通過強化學習來讓模型知道自己不知道,有效緩解幻覺,更重要的是需要靠「搜索增強」引入外部知識來逐步解決幻覺問題。

Q:baichuan-7B能帶來哪些商用價值?

A:baichuan-7B作為在多個榜單評測效果成績最佳的7B開源可商用大模型,填補了市場上缺乏優質的針對中文優化的7B大模型的空白,是開發者理想的7B大模型底座。同時在商用價值方面,能夠在例如文本生成,自動化寫作,數據分析,知識問答,中英翻譯,個性化交互和專業領域個人小助手,比如醫療領域,給用戶帶來巨大的價值。

Q:baichuan-7B在評測榜的成績達到最初的訓練模型預期了嗎?

A:打榜并不是我們的目的,我們相信好的數據和算法能力,評測自然會有好的結果,這次baichuan-7B在多個最具影響力的評測中的優異表現也驗證了百川的這個理念。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    536

    瀏覽量

    10311
  • 大模型
    +關注

    關注

    2

    文章

    2524

    瀏覽量

    2991

原文標題:王小川大模型首亮相!70億參數霸榜,清北搶先用|獨家專訪

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中國移動與中國石油發布700參數昆侖大模型

    近日,中國移動與中國石油在北京聯合舉辦了700參數昆侖大模型建設成果發布會,正式推出了這一行業重量級的大模型。 據悉,700
    的頭像 發表于 12-04 11:17 ?428次閱讀

    奧飛數據擬1.3轉讓四華拓70%股權

    近日,奧飛數據發布了一項重要公告,宣布公司擬以1.3元人民幣的價格轉讓其持有的四華拓光通信股份有限公司(以下簡稱“四華拓”)70%的股權。 根據公告內容,此次交易完成后,奧飛數據
    的頭像 發表于 12-04 11:14 ?504次閱讀

    2024 工博會|能德創展臺精彩搶先

    2024 工博會|能德創展臺精彩搶先看 第24屆中國國際工業博覽會(以下簡稱“工博會”)將于9月24-28日在國家會展中心(上海)舉辦,能德創將攜最新的伺服產品及行業解決方案亮相
    的頭像 發表于 09-19 14:40 ?339次閱讀
    2024 工博會|<b class='flag-5'>清</b>能德創展臺精彩<b class='flag-5'>搶先</b>看

    技術亮相2024年DIC國際顯示展覽會

    2024年DIC國際顯示展覽會在上海開幕,匯技術以“數自融合,彰顯未來”為主題,攜工業機器人、視覺檢測、驅動與控制產品、行業解決方案、數字能源解決方案等驚艷亮相。期間,京東方董事長陳炎順、中國
    的頭像 發表于 09-13 16:07 ?742次閱讀

    模型廠商“輸血”不斷,百智能完成50元A輪融資!

    有重磅消息曝出:知名大模型公司百智能已經成功收獲了價值50元的A輪融資。由此,我們不禁感嘆,大模型廠商們的“輸血”和“續命”之戰,還在激烈的上演著。
    的頭像 發表于 07-31 14:47 ?653次閱讀
    大<b class='flag-5'>模型</b>廠商“輸血”不斷,百<b class='flag-5'>川</b>智能完成50<b class='flag-5'>億</b>元A輪融資!

    視語坤模型智能體平臺亮相2024世界人工智能大會

    視語坤模型智能體平臺兼容多種多尺寸的大語言模型及多模態模型,并可以使用訓推平臺組件進行模型微調,以適配不同的應用場景。平臺還具備外掛知識
    的頭像 發表于 07-09 14:38 ?273次閱讀
    視語坤<b class='flag-5'>川</b>大<b class='flag-5'>模型</b>智能體平臺<b class='flag-5'>亮相</b>2024世界人工智能大會

    凱迪仕全渠道TOP1 ,全域曝光100

    618年中狂歡盛典,已正式落下帷幕。智能鎖行業領頭羊凱迪仕,憑借過硬的科技產品力和品牌勢能,在全域流量加持以及傳奇大師K70新品強勢曝光之下,天貓、京東、抖音各平臺,穩居各類型榜單榜首,繼續以
    的頭像 發表于 06-21 20:10 ?339次閱讀
    凱迪仕<b class='flag-5'>霸</b><b class='flag-5'>榜</b>全渠道TOP1 ,全域曝光100<b class='flag-5'>億</b>!

    智能發布Baichuan 4大模型款AI助手“百小應”

    智能近日發布了其新一代基座大模型Baichuan 4,并同步推出了款AI助手“百小應”。這款AI助手是在Baichuan 4強大能力的基礎上,結合先進的搜索技術精心打造而成。
    的頭像 發表于 05-23 14:15 ?650次閱讀

    中國主板市場4月遇冷 華碩依然

    中國主板市場4月遇冷 華碩依然 根據博板堂的統計數據顯示,2024年4月份我國大陸主板市場出貨量出現普遍下滑的情況。與3月份對比來說,環比下降18%; 與去年4月份對比的話,同比增長17%。 根據博板堂的出貨量榜單來看,華碩、技嘉、微星、七彩虹位列前四,華碩依然
    的頭像 發表于 05-18 16:11 ?1827次閱讀

    微軟自研5000參數模型曝光

    微軟近日曝光了其內部正在秘密研發的巨型AI模型——MAl-1,這款模型擁有驚人的5000參數。據微軟首席技術官Kevin Scott確認,MAl-1的研發工作確實在穩步推進中,并且該
    的頭像 發表于 05-08 09:56 ?475次閱讀

    通義千問推出1100參數開源模型

    通義千問近日震撼發布1100參數的開源模型Qwen1.5-110B,這一舉措標志著通義千問在AI領域邁出了重大步伐。該模型成為通義千問全系列首個千億級
    的頭像 發表于 05-06 10:49 ?611次閱讀

    螞蟻推出20參數多模態遙感模型SkySense

    據了解,負責開發的百靈團隊利用自身擁有的19遙感影像數據集進行了預訓練,從而生成了具有20.6參數的SkySense大模型。官方稱其為全球范圍內
    的頭像 發表于 02-28 15:53 ?717次閱讀

    谷歌發布全球最強開源大模型Gemma

    谷歌近日宣布,其全新開源大模型Gemma正式亮相。Gemma被譽為全球性能最強大、同時也是最輕量級的模型系列,分為2B(20參數)和7B(
    的頭像 發表于 02-22 14:51 ?853次閱讀

    奧特曼發布模型Sora OpenAI首個文生視頻模型Sora正式亮相

    奧特曼發布模型Sora OpenAI首個文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個文生視頻模型Sora正式
    的頭像 發表于 02-18 17:41 ?1019次閱讀

    智能發布超千億大模型Baichuan 3

    智能近日發布了超千億參數的大語言模型Baichuan 3,引發了業界的廣泛關注。這款模型在多個權威通用能力評測中表現卓越,展現了其強大的語義理解和生成能力。
    的頭像 發表于 01-31 14:58 ?895次閱讀
    主站蜘蛛池模板: 打卡中国各地奋斗第一线| 日韩毛片大全| 中文字幕绝色少妇性| 快乐激情站| 99视频精品全部免费 在线| 日韩免费一区| 好男人社区| 99久久国内精品成人免费| 丝袜足控免费网站xx91| 久久精品国产免费| 吃奶摸下的激烈免费视频| 亚洲欧美人成视频在线| 欧美日韩精品| 国语自产拍大学生在线观看| 最新 国产 精品 精品 视频| 日韩人妻双飞无码精品久久| 久久se精品一区二区国产| 超碰97人人做人人爱少妇| 亚洲国产五月综合网| 欧美成 人 网 站 免费| 国语自产二区高清国语自产拍| chinese极品嫩模videos| 亚洲精品沙发午睡系列| 人人看人人看| 久久视频在线视频| 国产二级一片内射视频播放| 最近免费中文字幕大全免费| 婷婷激情综合色五月久久竹菊影视| 久久亚洲AV成人无码国产漫画| 大胸美女被吊起来解开胸罩| 伊人亚洲综合网色| 天美传媒在线观看完整高清| 美国69xxxx59| 婚后被调教当众高潮H喷水| 动漫H片在线播放免费高清| 中文字幕永久在线| 亚洲精品国产高清不卡在线| 日本精油按摩| 男人和女人一级黄色大片| 久久AV无码AV高潮AV不卡| 国产精品久久人妻无码网站一区L|