Claude-3力壓GPT-4榮膺最佳大語(yǔ)言模型

近日，LMSYS Org發(fā)布最新的基準(zhǔn)測(cè)試報(bào)告，顯示Cordulas公司的Claude-3在平臺(tái)大語(yǔ)言模型中的得分略勝OpenAI的GPT-4。

值得注意的是，LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校以及卡內(nèi)基梅隆大學(xué)共同發(fā)起設(shè)立的研究組織。

日前，這家機(jī)構(gòu)推出了一項(xiàng)名為Chatbot Arena的服務(wù)，這是針對(duì)大語(yǔ)言模型（LLM）進(jìn)行評(píng)估的基準(zhǔn)平臺(tái)，該平臺(tái)采用眾包形式對(duì)大型語(yǔ)言模型進(jìn)行匿名隨機(jī)競(jìng)爭(zhēng)打分，參考源于競(jìng)技比賽領(lǐng)域中廣泛應(yīng)用的Elo評(píng)分體系。

分?jǐn)?shù)評(píng)價(jià)結(jié)果主要取決于用戶的投票意向，每次由系統(tǒng)隨機(jī)挑選兩個(gè)不同的大語(yǔ)言模型參與與用戶的對(duì)話，同時(shí)，為保障客觀性，匿名選擇哪個(gè)版本的大模型表現(xiàn)優(yōu)秀至關(guān)重要。

自去年啟動(dòng)以來(lái)，GPT-4一直占據(jù)評(píng)測(cè)榜單之首。然而，昨日，由Anthropos推出的Claude 3 Opus以微弱優(yōu)勢(shì)戰(zhàn)勝了GPT-4，將OpenAI的LLM擠出了首位。

考慮到細(xì)微差距及誤差風(fēng)險(xiǎn)，委員會(huì)決定授予Claude 3與GPT-4并列第一的榮譽(yù)，GPT-4的另外一個(gè)預(yù)設(shè)版也被列入并列第一的行列。此外，更引人注目的是，Claude 3 Haiku成功躋身前十名。Haiku是Anthropos針對(duì)本地規(guī)模的新型模型，功能類(lèi)似谷歌的GeminiNano。

相較Opus參數(shù)高達(dá)幾萬(wàn)億，Haiku體型更為緊湊，運(yùn)行速度更快。據(jù)LMSYS數(shù)據(jù)顯示，Haikn在評(píng)測(cè)成績(jī)中排名第七，與GPT-4表現(xiàn)不遑多讓。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6192

瀏覽量
105804
語(yǔ)言模型

語(yǔ)言模型

+關(guān)注

關(guān)注
0

文章
538

瀏覽量
10315
GPT

GPT

+關(guān)注

關(guān)注
0

文章
359

瀏覽量
15465

評(píng)論

相關(guān)推薦

Llama 3 與 GPT-4 比較

沿。一、技術(shù)架構(gòu) Llama 3和GPT-4都是基于深度學(xué)習(xí)的自然語(yǔ)言處理（NLP）模型，但它們的設(shè)計(jì)理念和技術(shù)細(xì)節(jié)有所不同。 Llama 3

發(fā)表于 10-27 14:17 ?427次閱讀

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯(cuò)

基于GPT-4的模型——CriticGPT，這款模型專(zhuān)為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì)，其獨(dú)特的作用在于，讓人們能夠用GPT-4來(lái)查找GP

發(fā)表于 06-29 09:55 ?578次閱讀

Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

Anthropic 發(fā)布Claude 3.5 Sonnet最新模型新模型在推理、知識(shí)和編碼能力評(píng)估方面超越了以前的版本和競(jìng)爭(zhēng)對(duì)手GPT 4

發(fā)表于 06-21 15:43 ?879次閱讀

Anthropic Claude 3大模型重磅來(lái)襲！微美全息（WIMI.US）全力沖刺加入GPT革命！

在AI邏輯基準(zhǔn)測(cè)試中超過(guò)了ChatGPT-4。 Claude 3 Opus 超越 GPT-4 ? Anthropic聲稱(chēng)，Claude

發(fā)表于 03-27 10:59 ?378次閱讀

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

起初，Copilot作為Bing Chat AI助手推出，初期采用GPT-3.5模型，隨后升級(jí)至GPT-4取得顯著進(jìn)步，如今再次更新至性能卓越的GPT-4 Turbo

發(fā)表于 03-13 13:42 ?767次閱讀

Anthropic 發(fā)布 Claude 3 系列大模型和 AI 助手

的表現(xiàn)超越了 GPT-4/3.5 和 Gemini 1.0 Ultra/Pro。 ? 目前Opus 和 Sonnet 已可通過(guò) claude網(wǎng)站和 Claude API 使用,而 Haiku 將在未來(lái)幾周內(nèi)推出。

發(fā)表于 03-08 12:29 ?459次閱讀

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

的GPT-4被拉下神壇， Claude 3很可能對(duì)GPT-4實(shí)現(xiàn)全方位的碾壓。 Anthropic發(fā)布3個(gè)

發(fā)表于 03-06 22:22 ?696次閱讀

Anthropic發(fā)布Claude 3系列大語(yǔ)言模型，挑戰(zhàn)OpenAI領(lǐng)先地位

人工智能領(lǐng)域的創(chuàng)業(yè)公司Anthropic推出了其備受矚目的Claude 3系列大型語(yǔ)言模型。該系列包括Claude

發(fā)表于 03-06 18:11 ?1324次閱讀

全球最強(qiáng)大模型易主，Claude 3全面超越GPT-4

由谷歌和亞馬遜支持的AI初創(chuàng)公司Anthropic近日發(fā)布了其全新的Claude 3模型家族，該家族包含三個(gè)重要成員：Claude 3 Op

發(fā)表于 03-06 10:44 ?793次閱讀

OpenAI推出ChatGPT新功能：朗讀，支持37種語(yǔ)言，兼容GPT-4和GPT-3

據(jù)悉，“朗讀”功能支持37種語(yǔ)言，且能夠自主識(shí)別文本類(lèi)型并對(duì)應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是，該功能對(duì)GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態(tài)交互”（multimodal capab

發(fā)表于 03-05 15:48 ?992次閱讀

Anthropic推出Claude 3大型語(yǔ)言模型，在認(rèn)知任務(wù)性能上創(chuàng)新高

據(jù)官方披露，Claude 3 旗艦 Opus 在大學(xué)生和研究生范疇的學(xué)術(shù)知識(shí)、復(fù)雜數(shù)理任務(wù)了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。

發(fā)表于 03-05 11:16 ?566次閱讀

全球最強(qiáng)大模型易主，GPT-4被超越

近日，AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型，其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱(chēng)，

發(fā)表于 03-05 09:58 ?694次閱讀

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹(shù)立AI新標(biāo)桿

近日，AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型，該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能，成

發(fā)表于 03-05 09:49 ?727次閱讀

Anthropic發(fā)布Claude 3系列，超越GPT-4和Gemini Ultra

人工智能領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型，包括Claude 3 Opus、

發(fā)表于 03-05 09:43 ?710次閱讀

全球最強(qiáng)大模型易主：GPT-4被超越，Claude 3系列嶄露頭角

近日，人工智能領(lǐng)域迎來(lái)了一場(chǎng)革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型，該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵指標(biāo)

發(fā)表于 03-05 09:42 ?694次閱讀

微云疏影
專(zhuān)欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 對(duì)比各家主流MCU指標(biāo)，國(guó)產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號(hào)和數(shù)字信號(hào)的區(qū)別和特點(diǎn)

New 方正電機(jī)成為小鵬汽車(chē)驅(qū)動(dòng)電機(jī)供應(yīng)商，總需求量預(yù)計(jì)達(dá)35萬(wàn)臺(tái)
New 雷諾-吉利動(dòng)力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

Llama 7B大語(yǔ)言模型本地部署全攻略！一步步教你輕松上手

英碼科技
3小時(shí)前

134 閱讀

先進(jìn)電動(dòng)汽車(chē)的電壓轉(zhuǎn)換策略在48V電動(dòng)汽車(chē)供電網(wǎng)絡(luò)中部署區(qū)域架構(gòu)

Vicor
9小時(shí)前

305 閱讀

解析汽車(chē)拋負(fù)載Load Dump：load dump產(chǎn)生原因與TVS并聯(lián)保護(hù)方案

力特奧維斯Littelfuse
10小時(shí)前

253 閱讀

泰克示波器在直流充電樁電流紋波測(cè)試中的應(yīng)用

泰克科技
10小時(shí)前

265 閱讀

互補(bǔ)場(chǎng)效應(yīng)晶體管的結(jié)構(gòu)和作用

中科院半導(dǎo)體所
10小時(shí)前

260 閱讀

電源工程師整理：自激推挽逆變器原理資料

o_dream
5.43 MB

免費(fèi)

55下載

PanGu.vim中文排版自動(dòng)規(guī)范化Vim插件

ah此生不換
0.01 MB

免費(fèi)

0下載

poclbm比特幣挖礦機(jī)

熊本熊
0.04 MB

2積分

2下載

Austin消息推送平臺(tái)

任憑風(fēng)吹
0.00 MB

2積分

3下載

HMC6343加速度計(jì)模塊

1123127317
0.03 MB

免費(fèi)

0下載

誰(shuí)有MA96781的手冊(cè)，官網(wǎng)找不到

jf_36971340
20小時(shí)前

79 閱讀

STM32串口接受中斷使用C++STL中的queue導(dǎo)致所有中斷失效

jf_24052194
20小時(shí)前

317 閱讀

請(qǐng)問(wèn)如何用Verilog實(shí)現(xiàn)將ascaii碼數(shù)值字符串轉(zhuǎn)換成定點(diǎn)數(shù)？

MrNICE
1天前

375 閱讀

【RA-Eco-RA2L1-48PIN-V1.0開(kāi)發(fā)板試用】——移植MultiButton按鍵庫(kù)

jf_43382582
1天前

270 閱讀

PI公司驅(qū)動(dòng)器，使用時(shí)有響聲正常嗎？

Akyoou
1天前

634 閱讀

推薦專(zhuān)欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Claude-3力壓GPT-4榮膺最佳大語(yǔ)言模型

評(píng)論

Llama 3 與 GPT-4 比較

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯(cuò)

Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

Anthropic Claude 3大模型重磅來(lái)襲！微美全息（WIMI.US）全力沖刺加入GPT革命！

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

Anthropic 發(fā)布 Claude 3 系列大模型和 AI 助手

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

Anthropic發(fā)布Claude 3系列大語(yǔ)言模型，挑戰(zhàn)OpenAI領(lǐng)先地位

全球最強(qiáng)大模型易主，Claude 3全面超越GPT-4

OpenAI推出ChatGPT新功能：朗讀，支持37種語(yǔ)言，兼容GPT-4和GPT-3

Anthropic推出Claude 3大型語(yǔ)言模型，在認(rèn)知任務(wù)性能上創(chuàng)新高

全球最強(qiáng)大模型易主，GPT-4被超越

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹(shù)立AI新標(biāo)桿

Anthropic發(fā)布Claude 3系列，超越GPT-4和Gemini Ultra

全球最強(qiáng)大模型易主：GPT-4被超越，Claude 3系列嶄露頭角