西西人体大胆77777视频,特级毛片免费观看视频,香蕉视频在线观看网址

1 月 16 日，InfoQ 獲悉，經過了半個月的部分客戶的內測和反饋，MiniMax 全量發布大語言模型 abab6，該模型為國內首個 MoE（Mixture-of-Experts）大語言模型。

早在上個月舉辦的數字中國論壇成立大會暨數字化發展論壇的一場分論壇上，MiniMax 副總裁魏偉就曾透露將于近期發布國內首個基于 MoE 架構的大模型，對標 OpenAI GPT-4。

在 MoE 結構下，abab6 擁有大參數帶來的處理復雜任務的能力，同時模型在單位時間內能夠訓練足夠多的數據，計算效率也可以得到大幅提升。改進了 abab5.5 在處理更復雜、對模型輸出有更精細要求場景中出現的問題。為什么選擇 MoE 架構？

那么，MoE 到底是什么？MiniMax 的大模型為何要使用使用 MoE 架構？

MoE 架構全稱專家混合（Mixture-of-Experts），是一種集成方法，其中整個問題被分為多個子任務，并將針對每個子任務訓練一組專家。MoE 模型將覆蓋不同學習者（專家）的不同輸入數據。

圖片來源：https ://arxiv.org/pdf/1701.06538.pdf

有傳聞稱，GPT-4 也采用了相同的架構方案。

2023 年 4 月，MiniMax 發布了開放平臺。過去半年多，MiniMax 陸續服務了近千家客戶，包括金山辦公、小紅書、騰訊、小米和閱文在內的多家頭部互聯網公司，MiniMax 開放平臺平均單日的 token 處理量達到了數百億。

MiniMax 在官微中發文稱：“這半年多來，客戶給我們提供了很多有價值的反饋和建議。例如，大家認為我們做得比較好的地方有：在寫作、聊天、問答等場景中，abab5.5 的表現不錯，達到了 GPT-3.5 的水平。”

但是和最先進的模型 GPT-4 相比，仍有明顯差距。這主要體現在處理更復雜的、對模型輸出有精細要求的場景時，存在一定概率違反用戶要求的輸出格式，或是在推理過程中發生錯誤。當然，這不僅是 abab5.5 的問題，也是目前除 GPT-4 以外，幾乎所有大語言模型存在的缺陷。

為了解決這個問題，進一步提升模型在復雜任務下的效果，MiniMax 技術團隊從去年 6 月份起開始研發 MoE 模型——abab6 是 MiniMax 的第二版 MoE 大模型（第一版 MoE 大模型已應用于其 C 端產品中）。

雖然MiniMax 并未透露Abab6 的具體參數，但據MiniMax 透露，Abab6 比上一個版本大了一個量級。更大的模型意味著 abab6 可以更好的從訓練語料中學到更精細的規律，完成更復雜的任務。

但僅擴大參數量會帶來新的問題：降低模型的推理速度以及更慢的訓練時間。在很多應用場景中，訓練推理速度和模型效果同樣重要。為了保證 abab6 的運算速度，MiniMax 技術團隊使用了 MoE (Mixture of Experts 混合專家模型）結構。在該結構下，模型參數被劃分為多組“專家”，每次推理時只有一部分專家參與計算。基于 MoE 結構，abab6 可以具備大參數帶來的處理復雜任務的能力；計算效率也會得到提升，模型在單位時間內能夠訓練足夠多的數據。

目前大部分大語言模型開源和學術工作都沒有使用 MoE 架構。為了訓練 abab6，MiniMax 還自研了高效的 MoE 訓練和推理框架，也發明了一些 MoE 模型的訓練技巧。到目前為止，abab6 是國內第一個千億參數量以上的基于 MoE 架構的大語言模型。

測評結果

為了對比各模型在復雜場景下的表現，MiniMax 對 abab6、abab5.5、GPT-3.5、GPT-4、Claude 2.1 和 Mistral-Medium 商用進行了自動評測。在簡單的任務上，abab5.5 已經做得比較好，因此 MiniMax 選擇了三種涵蓋了較復雜的問題的評測方法：

IFEval：這個評測主要測試模型遵守用戶指令的能力。在測試時，提問者會問模型一些帶有約束條件的問題，例如“以 XX 為標題，列出三個具體對方法，每個方法的描述不超過兩句話”，然后統計有多少回答嚴格滿足了約束條件。

MT-Bench：這個評測衡量模型的英文綜合能力。提問者會問模型多個類別的問題，包括角色扮演、寫作、信息提取、推理、數學、代碼、知識問答。MiniMax 技術團隊會用另一個大模型（GPT-4）對模型的回答打分，并統計平均分。

AlignBench：該評測反映了模型的中文綜合能力測試，測試形式與 MT-Bench 類似。

測評及對比結果如下：

注：對比模型均選擇各自最新、效果最好的版本，分別為 Claude-2.1、Mistral-Medium 商用、GPT-3.5-Turbo-0613、GPT-4-1106-preview；GPT-3.5-Turbo-0613 略好于 GPT-3.5-Turbo-1106 。abab6 是 1 月 15 號的版本。

可以看出，abab6 在三個測試集中均明顯好于前一代模型 abab5.5。在指令遵從、中文綜合能力和英文綜合能力上，abab6 大幅超過了 GPT-3.5。和 Claude 2.1 相比，abab6 也在指令遵從、中文綜合能力和英文綜合能力上略勝一籌。相較于 Mistral 的商用版本 Mistral-Medium，abab6 在指令遵從和中文綜合能力上都優于 Mistral-Medium，在英文綜合能力上與 Mistral- Medium 旗鼓相當。

如果想體驗 MiniMax MoE 大模型，可訪問 MiniMax 開放平臺官網：api.minimax.chat

ps：MiniMax 方面稱，模型還在持續訓練中，遠沒有收斂，歡迎大家反饋。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

語言模型

語言模型

+關注

關注
0

文章
538

瀏覽量
10315
OpenAI

OpenAI

+關注

關注
9

文章
1123

瀏覽量
6639
大模型

大模型

+關注

關注
2

文章
2541

瀏覽量
3026

原文標題：對標OpenAI GPT-4，MiniMax 國內首個 MoE 大語言模型全量上線

文章出處：【微信號：AI前線，微信公眾號：AI前線】歡迎添加關注！文章轉載請注明出處。

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

基于GPT-4的模型——CriticGPT，這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計，其獨特的作用在于，讓人們能夠用GPT-4來查找GP

發表于 06-29 09:55 ?582次閱讀

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力，成為了許多開發者的首選工具。獲取GPT-4 API Key并將其應用于項目

發表于 06-24 17:40 ?2512次閱讀

國內直聯使用ChatGPT 4.0 API Key使用和多模態GPT4o API調用開發教程！

1. 前言 ChatGPT-4o API 是 OpenAI 提供的強大工具，可用于自然語言處理和多模態任務。在國內直聯使用這些服務需要一些配置和技巧。本文將詳細介紹

發表于 06-08 00:33 ?5462次閱讀

開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

?目前，OpenAI新模型GPT-4o和GPT-4 Turbo的價格如下： GPT-4o 對比 GPT-

發表于 05-29 16:00 ?1.2w次閱讀

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

當地時間5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上，這種迭代擁有顯著的改進。在發布會的演示中，OpenAI展示

發表于 05-27 15:43

OpenAI推出面向所有用戶的AI模型GPT-4o

在周一的直播盛會上，OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機器人ChatGPT提供更強大、更經濟的支持。

發表于 05-15 09:23 ?434次閱讀

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

電子發燒友網報道（文/李彎彎）當地時間5月13日，OpenAI舉行春季發布會，宣布將推出桌面版ChatGPT，并發布全新旗艦AI模型GPT-4

發表于 05-15 00:15 ?7890次閱讀

OpenAI發布GPT-4o模型，供全體用戶免費使用

OpenAI首席技術官穆里·穆拉蒂（Muri Murati）指出，GPT-4o具備與GPT-4相同的智能水平，且在文本、圖像及語音處理方面有顯著進步。

發表于 05-14 11:17 ?547次閱讀

OpenAI計劃宣布ChatGPT和GPT-4更新

人工智能領域的領軍企業OpenAI近日宣布，將于5月13日進行一場產品更新直播，屆時將揭曉ChatGPT和GPT-4的新進展。這一消息立即引發了外界對OpenAI下一項重大技術發布的廣泛猜測和期待。

發表于 05-13 11:06 ?617次閱讀

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo 4月23日，商湯科技董事長兼CEO徐立在2024商湯技術交流日上發布了行業首

發表于 04-24 16:49 ?1159次閱讀

OpenAI設立日本辦事處，研發日文版GPT-4

此外，OpenAI 還計劃推出適用于日語環境的 GPT-4 定制版模型。據悉，該模型在處理日文文本時表現更為出色，運行速度最高可提升至三倍；同時，其在翻譯和總結日語文本方面的性能和性價

發表于 04-15 16:04 ?514次閱讀

OpenAI推出Vision模型版GPT-4 Turbo，融合文本與圖像理解

據悉，此模型沿用GPT-4 Turbo系列特有的12.8萬token窗口規模及截至2023年12月的知識庫架構，其創新亮點則是強大的視覺理解功能。

發表于 04-10 10:49 ?436次閱讀

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

起初，Copilot作為Bing Chat AI助手推出，初期采用GPT-3.5模型，隨后升級至GPT-4取得顯著進步，如今再次更新至性能卓越的GPT-4 Turbo

發表于 03-13 13:42 ?767次閱讀

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

據悉，“朗讀”功能支持37種語言，且能夠自主識別文本類型并對應相應的發音。值得關注的是，該功能對GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多

發表于 03-05 15:48 ?995次閱讀

全球最強大模型易主，GPT-4被超越

近日，AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型，其中包括最強版Claude 3 Opus。據該公司稱，Claude 3系列在推理、數學、編碼、多語言理解和視覺方面全面超越了包括GPT-4在內的所

發表于 03-05 09:58 ?695次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

對標OpenAI GPT-4，MiniMax國內首個MoE大語言模型全量上線

評論

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

國內直聯使用ChatGPT 4.0 API Key使用和多模態GPT4o API調用開發教程！

開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

OpenAI推出面向所有用戶的AI模型GPT-4o

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

OpenAI發布GPT-4o模型，供全體用戶免費使用

OpenAI計劃宣布ChatGPT和GPT-4更新

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

OpenAI設立日本辦事處，研發日文版GPT-4

OpenAI推出Vision模型版GPT-4 Turbo，融合文本與圖像理解

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

全球最強大模型易主，GPT-4被超越