色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

李開復(fù)4個多月后“放大招”:對標(biāo)OpenAI、谷歌,發(fā)布“全球最強(qiáng)”開源大模型

jf_WZTOguxH ? 來源:AI前線 ? 2023-11-06 15:47 ? 次閱讀

今天,由李開復(fù)打造的 AI 大模型創(chuàng)業(yè)公司“零一萬物”發(fā)布了一系列開源大模型:Yi-34B 和 Yi-6B。

Yi-34B 是一個雙語(英語和中文)基礎(chǔ)模型,經(jīng)過 340 億個參數(shù)訓(xùn)練,明顯小于 Falcon-180B 和 Meta LlaMa2-70B 等其他開放模型。在發(fā)布會中,李開復(fù)稱其數(shù)據(jù)采集、算法研究、團(tuán)隊配置均為世界第一梯隊,對標(biāo) OpenAI、谷歌一線大廠,并抱有成為世界第一的初衷和決心。同時,他表示 Yi-34B 是“全球最強(qiáng)開源模型”,其通用能力、知識推理、閱讀理解等多指標(biāo)均處于全球榜單首位。

零一萬物團(tuán)隊也進(jìn)行了一系列打榜測試,具體成績包括:

Hugging Face 英文測試榜單,以 70.72 分?jǐn)?shù)位列全球第一;

以小博大,作為國產(chǎn)大模型碾壓 Llama-2 70B 和 Falcon-180B 等一眾大模型(參數(shù)量僅為后兩者的 1/2、1/5);

C-Eval 中文能力排行榜位居第一,超越了全球所有開源模型;

MMLU、BBH 等八大綜合能力表現(xiàn)全部勝出,Yi-34B 在通用能力、知識推理、閱讀理解等多項指標(biāo)評比中“擊敗全球玩家”;

......

9f292822-7c62-11ee-939d-92fbcf53809c.jpg

9f458350-7c62-11ee-939d-92fbcf53809c.jpg

然而,在發(fā)布中,也有一點(diǎn)需要指出,那就是 Yi 系列模型在 GSM8k 和 MBPP 的數(shù)學(xué)以及代碼測評方面表現(xiàn)不如 GPT 模型出色。這是因?yàn)閳F(tuán)隊希望在預(yù)訓(xùn)練階段希望先盡可能保留模型的通用能力,所以訓(xùn)練數(shù)據(jù)中沒有加入過多數(shù)學(xué)和代碼數(shù)據(jù)。后續(xù)他們計劃在開源系列中推出專注于代碼和數(shù)學(xué)領(lǐng)域的繼續(xù)訓(xùn)練模型。

200K 上下文窗口, 能處理 40 萬字文本

值得注意的是,此次開源的 Yi-34B 模型,將發(fā)布全球最長、可支持 200K 超長上下文窗口(context window)版本,可以處理約 40 萬漢字超長文本輸入。這意味著 Yi-34B 不僅能提供更豐富的語義信息,理解超過 1000 頁的 PDF 文檔,還讓很多依賴于向量數(shù)據(jù)庫構(gòu)建外部知識庫的場景,都可以用上下文窗口來進(jìn)行替代。

相比之下,OpenAI 的 GPT-4 上下文窗口只有 32K,文字處理量約 2.5 萬字。今年三月,硅谷知名 AI 2.0 創(chuàng)業(yè)公司 Anthropic 的 Claude2-100K 將上下文窗口擴(kuò)展到了 100K 規(guī)模,零一萬物直接加倍,并且是第一家將超長上下文窗口在開源社區(qū)開放的大模型公司。

在語言模型中,上下文窗口是大模型綜合運(yùn)算能力的金指標(biāo)之一,對于理解和生成與特定上下文相關(guān)的文本至關(guān)重要,擁有更長窗口的語言模型可以處理更豐富的知識庫信息,生成更連貫、準(zhǔn)確的文本。

此外,在文檔摘要、基于文檔的問答等下游任務(wù)中,長上下文的能力發(fā)揮著關(guān)鍵作用,行業(yè)應(yīng)用場景廣闊。在法律、財務(wù)、傳媒、檔案整理等諸多垂直場景里,更準(zhǔn)確、更連貫、速度更快的長文本窗口功能,可以成為人們更可靠的 AI 助理,讓生產(chǎn)力得到大幅提升。然而,受限于計算復(fù)雜度、數(shù)據(jù)完備度等問題,上下文窗口規(guī)模擴(kuò)充從計算、內(nèi)存和通信的角度存在各種挑戰(zhàn),因此大多數(shù)發(fā)布的大型語言模型僅支持幾千 tokens 的上下文長度。為了解決這個限制,零一萬物技術(shù)團(tuán)隊實(shí)施了一系列優(yōu)化,包括:計算通信重疊、序列并行、通信壓縮等。通過這些能力增強(qiáng),實(shí)現(xiàn)了在大規(guī)模模型訓(xùn)練中近 100 倍的能力提升。

實(shí)現(xiàn) 40% 訓(xùn)練成本下降

AI Infra(AI Infrastructure 人工智能基礎(chǔ)架構(gòu)技術(shù))主要涵蓋大模型訓(xùn)練和部署提供各種底層技術(shù)設(shè)施,包括處理器操作系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計算平臺等等,是模型訓(xùn)練背后極其關(guān)鍵的“保障技術(shù)”,這是大模型行業(yè)至今較少受到關(guān)注的硬技術(shù)領(lǐng)域。

李開復(fù)曾經(jīng)表示,“做過大模型 Infra 的人比做算法的人才更稀缺”,而超強(qiáng)的 Infra 能力是大模型研發(fā)的核心護(hù)城河之一。在芯片、GPU 等算力資源緊缺的當(dāng)下,安全和穩(wěn)定成為大模型訓(xùn)練的生命線。零一萬物的 Infra 技術(shù)通過“高精度”系統(tǒng)、彈性訓(xùn)和接力訓(xùn)等全棧式解決方案,確保訓(xùn)練高效、安全地進(jìn)行。

憑借其強(qiáng)大的 AI Infra 支撐,零一萬物團(tuán)隊表示,Yi-34B 模型訓(xùn)練成本實(shí)測下降 40%,實(shí)際訓(xùn)練完成達(dá)標(biāo)時間與預(yù)測的時間誤差不到一小時,進(jìn)一步模擬上到千億規(guī)模訓(xùn)練成本可下降多達(dá) 50%。截至目前,零一萬物 Infra 能力實(shí)現(xiàn)故障預(yù)測準(zhǔn)確率超過 90%,故障提前發(fā)現(xiàn)率達(dá)到 99.9%,不需要人工參與的故障自愈率超過 95%,有力保障了模型訓(xùn)練的順暢進(jìn)行。

零一萬物背后

今年 7 月,李開復(fù)博士正式官宣并上線了其籌組的“AI 2.0”新公司:零一萬物。此前李開復(fù)曾表示,AI 大語言模型是中國不能錯過的歷史機(jī)遇,零一萬物就是在今年 3 月下旬,由他親自帶隊孵化的新品牌。

在接受外媒采訪時,他談到了創(chuàng)辦零一萬物的動機(jī):“我認(rèn)為需求是創(chuàng)新之母,中國顯然存在巨大的需求,”“與其他國際地區(qū)不同,中國無法訪問 OpenAI 和谷歌,因?yàn)檫@兩家公司沒有在中國提供他們的產(chǎn)品。因此,我認(rèn)為有很多人正在努力為市場創(chuàng)造解決方案。這是剛需。”

眾所周知,構(gòu)建大模型是一項耗資巨大的事業(yè)。為了維持現(xiàn)金密集型業(yè)務(wù),零一萬物從一開始就制定了商業(yè)化計劃。雖然該公司將繼續(xù)開源其一些模型,但其目標(biāo)是構(gòu)建最先進(jìn)的專有模型,作為各種商業(yè)產(chǎn)品的基礎(chǔ)。

李開復(fù)表示,他們非常清楚這些大型語言模型需要大量計算,花費(fèi)巨大。“我們籌集到了大量資金,其中大部分都花在了 GPU 上。”與中國其他 LLM 玩家一樣,零一萬物也需要積極儲備 GPU 以應(yīng)對美國制裁。在發(fā)布會中,李開復(fù)表示零一萬物現(xiàn)在的供應(yīng)至少足以滿足未來 12-18 個月的需求。

美國的制裁也讓中國企業(yè)注重優(yōu)化計算能力,李開復(fù)表示:“借助一支非常高質(zhì)量的基礎(chǔ)設(shè)施團(tuán)隊,每 1000 個 GPU,我們也許能夠從中擠出 2000 個 GPU 的工作負(fù)載。”

從一些報道中,我們可以了解到,零一萬物員工規(guī)模已超過 100 人,半數(shù)是來自國內(nèi)外大廠的 LLM 專家。其中,零一萬物技術(shù)副總裁及 AI Alignment 負(fù)責(zé)人是 Google Bard/Assistant 早期核心成員,主導(dǎo)或參與了從 Bert、LaMDA 到大模型在多輪對話、個人助理、AI Agent 等多個方向的研究和工程落地;首席架構(gòu)師曾在 Google Brain 與 Jeff Dean、Samy Bengio 等合作,為 TensorFlow 的核心創(chuàng)始成員之一。

零一萬物的商業(yè)化之路很大程度上取決于其為其昂貴的 AI 模型找到適合的產(chǎn)品市場的能力。“中國在大模型方面并不領(lǐng)先于美國,但毫無疑問,中國可以構(gòu)建比美國開發(fā)商更好的應(yīng)用程序,這主要是因?yàn)檫^去 12 年左右建立的非凡的移動互聯(lián)網(wǎng)生態(tài)系統(tǒng),”李開復(fù)說道。

李開復(fù)表示,這家初創(chuàng)公司的最終目標(biāo)是成為一個外部開發(fā)人員可以輕松構(gòu)建應(yīng)用程序的生態(tài)系統(tǒng)。“我們的職責(zé)不僅僅是推出好的研究模型,更重要的是讓應(yīng)用程序開發(fā)變得容易,這樣才能有優(yōu)秀的應(yīng)用程序,”他說。“歸根結(jié)底。這是一場生態(tài)系統(tǒng)游戲。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    557

    瀏覽量

    10591
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1196

    瀏覽量

    8227
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2941

    瀏覽量

    3681

原文標(biāo)題:李開復(fù)4個多月后“放大招”:對標(biāo)OpenAI、谷歌,發(fā)布“全球最強(qiáng)”開源大模型

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍(lán)海?

    時間思考后再做出回答,而傳統(tǒng)大模型是直接給出回答,但往往這個回答并不準(zhǔn)確。 ? OpenAI介紹稱,OpenAI o1模型解決了很多傳統(tǒng)模型
    發(fā)表于 09-14 00:04 ?1705次閱讀
    <b class='flag-5'>OpenAI</b><b class='flag-5'>發(fā)布</b>o1大<b class='flag-5'>模型</b>,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍(lán)海?

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    開源新一代通義千問模型Qwen3。據(jù)悉,Qwen3模型參數(shù)量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等
    的頭像 發(fā)表于 04-30 16:08 ?71次閱讀

    低至¥2.27/h!就能使用全球最強(qiáng)開元模型——千問 QwQ-32B

    ABSTRACT摘要捷智算平臺上新全球最強(qiáng)開元模型——千問QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通義千問發(fā)布的最新開源
    的頭像 發(fā)表于 03-19 12:34 ?337次閱讀
    低至¥2.27/h!就能使用<b class='flag-5'>全球</b><b class='flag-5'>最強(qiáng)</b>開元<b class='flag-5'>模型</b>——千問 QwQ-32B

    OpenAI報告GPT-4o及4o-mini模型性能下降,正緊急調(diào)查

    近日,全球領(lǐng)先的AI研究機(jī)構(gòu)OpenAI發(fā)布了一份事故報告,引起了業(yè)界的廣泛關(guān)注。報告中指出,OpenAI目前正面臨GPT-4o和
    的頭像 發(fā)表于 01-23 10:22 ?715次閱讀

    OpenAI:GPT-4o及4o-mini模型性能下降,正展開調(diào)查

    近期,OpenAI發(fā)布了一份事故報告,指出其GPT-4o及4o-mini模型遭遇了性能下降的問題。這一消息引起了業(yè)界的廣泛關(guān)注和討論。 據(jù)
    的頭像 發(fā)表于 01-21 10:34 ?531次閱讀

    Orion模型即將面世,OpenAI采用新發(fā)布模式

    據(jù)最新報道,OpenAI計劃在今年12月推出其新款前沿模型,代號為“Orion”。這款模型將采用與以往不同的發(fā)布模式,引發(fā)廣泛關(guān)注。 與GPT-4
    的頭像 發(fā)表于 10-25 10:11 ?569次閱讀

    OpenAI即將發(fā)布“草莓”推理大模型

    科技界迎來新動態(tài),據(jù)可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發(fā)布——預(yù)計在兩周內(nèi),將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務(wù)中。這款以卓越推理能力為核心的大
    的頭像 發(fā)表于 09-11 16:53 ?718次閱讀

    Meta發(fā)布全新開源模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標(biāo)志著Meta在AI領(lǐng)域的又一重大突破。Meta創(chuàng)始人馬克·扎克伯格親自站臺,盛贊Llama 3.1為“業(yè)內(nèi)頂尖水準(zhǔn)”的AI
    的頭像 發(fā)表于 07-24 18:25 ?1660次閱讀

    全球首個芯片設(shè)計開源模型SemiKong正式發(fā)布

    在科技日新月異的今天,全球首個芯片設(shè)計開源模型SemiKong的正式發(fā)布,無疑為半導(dǎo)體行業(yè)投下了一枚震撼彈,預(yù)示著一場深刻的行業(yè)變革即將拉開序幕。這款由Aitomatic與FPT S
    的頭像 發(fā)表于 07-14 10:01 ?1219次閱讀

    谷歌發(fā)布新型大語言模型Gemma 2

    在人工智能領(lǐng)域,大語言模型一直是研究的熱點(diǎn)。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言
    的頭像 發(fā)表于 06-29 09:48 ?632次閱讀

    OpenAI競爭對手Anthropic發(fā)布最強(qiáng)模型Claude 3.5 Sonnet

    AI在不斷加速演進(jìn)中;各個巨頭也是你追我趕, 今年3月,Anthropic推出了Claude 3系列模型OpenAI在5月份推出了GPT-4o。 6月Anthropic又推出了Claude
    的頭像 發(fā)表于 06-21 14:52 ?1128次閱讀

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當(dāng)?shù)貢r間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會的演示中,
    發(fā)表于 05-27 15:43

    OpenAI發(fā)布全新GPT-4o模型

    近日,OpenAI宣布推出全新的GPT-4o模型,標(biāo)志著人工智能領(lǐng)域的一大技術(shù)飛躍。這款模型不僅具備強(qiáng)大的生成能力,還能精準(zhǔn)理解用戶意圖,提供智能化的回答。
    的頭像 發(fā)表于 05-17 11:48 ?792次閱讀

    OpenAI推出全新大語言模型

    今日凌晨,科技界迎來了一次激動人心的突破。OpenAI正式發(fā)布了全新的旗艦模型GPT-4o,這一模型展現(xiàn)了跨視頻、音頻、文本進(jìn)行實(shí)時推理的驚
    的頭像 發(fā)表于 05-14 11:53 ?766次閱讀

    微軟準(zhǔn)備推出新的AI模型谷歌OpenAI競爭

    據(jù)報道,微軟在向OpenAI投資超過100億美元后,首次成功訓(xùn)練了一名為“MAI-1”的內(nèi)部人工智能模型。這一模型規(guī)模龐大,足以與谷歌、A
    的頭像 發(fā)表于 05-08 10:45 ?684次閱讀
    主站蜘蛛池模板: 欧美一级成人影院免费的 | 18禁黄无遮挡禁游戏在线下载 | 亚洲免费无码av线观看 | 国产综合无码一区二区色蜜蜜 | ping色堂| 麻豆一区二区三区蜜桃免费 | 少妇伦子伦情品无吗 | 亚洲综合日韩中文字幕v在线 | 亚洲 欧美 国产 综合 播放 | 国产亚洲精品久久久久久白晶晶 | 一本道高清不卡v免费费 | 精品含羞草免费视频观看 | 国产精品自在在线午夜精品 | 国产精品99久久久久久WWW | 国产免费人成在线视频有码 | seyeye高清视频在线 | 免费夜色污私人影院网站 | 久久国产精品麻豆AV影视 | 亚洲精品嫩草研究院久久 | JIZZ19学生第一次 | 小伙无套内射老女人 | 超h高h肉h文教室生理课 | 爱情岛论坛免费在线观看 | 99久久99久久久精品齐齐鬼色 | 亚洲人成在线播放无码 | 国产婷婷午夜无码A片 | 午夜影院美女 | 久久久久免费视频 | 性欧美13处14处破 | jizz丝袜 | 我在厨房摸岳的乳HD在线观看 | 谁有成人网站地址 | 97人人超碰国产精品最新蜜芽 | 51精品国产AV无码久久久 | 色色色久久久免费视频 | 麻豆天美国产一区在线播放 | 樱花草在线影视WWW日本动漫 | 日韩欧美高清一区 | H狠狠躁死你H | Chinesetube国产中文 | 国产在线播放不卡 |

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品