微軟下架最新大語言模型WizardLM-2，緣因“幻覺測試疏忽”

Microsoft于本周正式推出并開放源代碼的新一代大規模語言模型WizardLM-2，據稱其性能已超越GPT-4及Mistral。然而，在模型上線后不久，微軟卻在未經通知的情況下撤回了所有項目文檔與代碼，至今尚未恢復上線。

對此，微軟技術人員在X平臺發表聲明，表示因對新模型發布流程不夠了解，且忽略了幻覺測試環節，導致模型被緊急下線。目前，開發團隊正在全力以赴進行測試，預計完成后將盡快重新上線。

盡管模型已暫時下線，但根據微軟官方提供的模型介紹頁面信息，WizardLM-2 8x22B被譽為當前最先進的模型，超越了Claude 3 Opus&Sonnet以及GPT-4等競爭對手，性能優于規模比其大10倍的開源模型。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6614

瀏覽量
104171
源代碼

源代碼

+關注

關注
96

文章
2946

瀏覽量
66809
語言模型

語言模型

+關注

關注
0

文章
530

瀏覽量
10298

【書籍評測活動NO.52】基于大模型的RAG應用開發與優化

Agenerated，檢索增強生成）與Agent（AI智能體）。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認識RAG這一重要應用形式。 01 了解大模型的“幻覺” 在了解為什么出現RAG之前，我們

發表于 12-04 10:50

PCB測試架和PCBA測試架的原理與用途

一站式PCBA智造廠家今天為大家講講PCBA測試架有什么用?PCB與PCBA測試架的原理和用途。在電子制造領域，PCBA測試架是確保電路板質

發表于 09-06 09:23 ?457次閱讀

TaD+RAG-緩解大模型“幻覺”的組合新療法

TaD：任務感知解碼技術（Task-aware Decoding，簡稱TaD），京東聯合清華大學針對大語言模型幻覺問題提出的一項技術，成果收錄于IJCAI2024。 RAG：檢索增強生成技術

發表于 07-16 15:01 ?2099次閱讀

TaD+RAG-緩解大<b class='flag-5'>模型</b>“<b class='flag-5'>幻覺</b>”的組合新療法

谷歌發布新型大語言模型Gemma 2

在人工智能領域，大語言模型一直是研究的熱點。近日，全球科技巨頭谷歌宣布，面向全球研究人員和開發人員，正式發布了其最新研發的大語言模型——Gemma

發表于 06-29 09:48 ?447次閱讀

阿里達摩院提出“知識鏈”框架，降低大模型幻覺

近日，阿里巴巴達摩院（湖畔實驗室）攜手新加坡南洋理工大學等研究機構，共同推出了大模型知識鏈（CoK）框架。該框架不僅可實時檢索異構知識源，還能逐步糾正推理錯誤，有效提高了大模型在回答知識型問題時的準確率，并顯著降低了所謂的“幻覺

發表于 05-10 11:46 ?712次閱讀

微軟開發新AI語言模型MAI-1，挑戰行業巨頭

據最新消息，微軟正積極開發一款新型AI語言模型MAI-1，以提升在快速發展的AI市場中的競爭力。

發表于 05-08 10:27 ?458次閱讀

微軟準備推出全新人工智能語言模型

微軟近期傳出消息，正在秘密研發一款全新的人工智能語言模型，這款模型在規模上預計將具備與谷歌和OpenAI等業界巨頭相抗衡的實力。據悉，這款新模型

發表于 05-08 09:30 ?434次閱讀

【大語言模型：原理與工程實踐】大語言模型的應用

類任務上表現出色，甚至在零樣本條件下也能取得良好效果。另一類則需要逐步推理才能完成的任務，類似于人類的系統2，如數字推理等。然而，隨著參數量的增加，大語言模型在這類任務上并未出現質的飛

發表于 05-07 17:21

【大語言模型：原理與工程實踐】大語言模型的評測

計算和代碼糾錯等。這些場景覆蓋日常生活和學習的多個方面，使得對話能力評測變得尤為復雜和關鍵。為了全面評估大語言模型在各種應用場景下的對話能力，研究人員和使用者需要一套綜合性的評測框架。該框架主要包括評測

發表于 05-07 17:12

【大語言模型：原理與工程實踐】大語言模型的預訓練

大語言模型的核心特點在于其龐大的參數量，這賦予了模型強大的學習容量，使其無需依賴微調即可適應各種下游任務，而更傾向于培養通用的處理能力。然而，隨著學習容量的增加，對預訓練數據的需求也相應

發表于 05-07 17:10

【大語言模型：原理與工程實踐】大語言模型的基礎技術

向量可以隨著任務更新、調整。這類語言模型一般分為靜態詞向量語言模型(如Word2vec、GloVe)和動態詞向量

發表于 05-05 12:17

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVIDIA GPU 上運行的大

發表于 04-28 10:36 ?590次閱讀

Meta公司的Llama2語言模型4項測試通過率低，幻覺率高

據了解，人工智能安全企業 DeepKeep日前發表了一份評估報告。報告指出，Meta公司旗下LlamA 2大型語言模型在13個風險評估類別中的表現僅為4項合格。

發表于 04-18 14:45 ?489次閱讀

世界數字技術院發布：生成式AI安全測試標準及大語言模型

據悉，上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業，其中，《大語言

發表于 04-17 16:51 ?1118次閱讀

利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統（下）

對于語言模型（LLM）幻覺，知識圖譜被證明優于向量數據庫。知識圖譜提供更準確、多樣化、有趣、邏輯和一致的信息，減少了LLM中出現幻覺的可能性。

發表于 02-22 14:13 ?1238次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

ElfBoard技術貼|如何通過TF卡啟動ELF 2學習板

Designerhth
7小時前

246 閱讀

恩智浦i.MX95打造高級數字互聯儀表盤方案顛覆兩輪車騎行體驗

NXP客棧
8小時前

297 閱讀

飛凌嵌入式i.MX8M Mini核心板已支持Linux6.1

飛凌嵌入式
8小時前

212 閱讀

DC/DC轉換器電路中MOSFET的選擇指南(上)

駿龍電子
9小時前

288 閱讀

eIQ Time Series Studio工具使用攻略(三)-工程創建

恩智浦MCU加油站
1天前

349 閱讀

基于Multisim 10的矩形波信號發生器仿真與實現

丁冬芹
1187

10積分

437下載

第二代HART協議智能電容式差壓變送器配套電子部件使用說明書

nana
1.22 MB

免費

102下載

riscv-rootfs RISC-V文件系統構建工具

碩達科訊
4.83 MB

2積分

3下載

Legado開源電子書閱讀器

劉偉
5.62 MB

免費

0下載

基于arduino UNO的擴展板

李英
0.10 MB

2積分

10下載

電子發燒友榮獲機械工業出版社華章板塊“2024年度優秀合作伙伴獎”

ElecFans小喇叭
18小時前

53 閱讀

這個電路如何實現遠近光的切換？

LtNSee
18小時前

88 閱讀

[求助] CDS8711開發板，Keil例程使用JLINK燒錄，遇到無法識別單片機的情況

未存3308
18小時前

154 閱讀

backdrill legend 顯示參數如何編輯

jf_86378909
18小時前

205 閱讀

迅為RK3568開發板篇OpenHarmony配置HDF驅動控制LED-配置創建私有配置文件

jf_23361246
18小時前

173 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

微軟下架最新大語言模型WizardLM-2，緣因“幻覺測試疏忽”

評論

【書籍評測活動NO.52】基于大模型的RAG應用開發與優化

PCB測試架和PCBA測試架的原理與用途

TaD+RAG-緩解大模型“幻覺”的組合新療法

谷歌發布新型大語言模型Gemma 2

阿里達摩院提出“知識鏈”框架，降低大模型幻覺

微軟開發新AI語言模型MAI-1，挑戰行業巨頭

微軟準備推出全新人工智能語言模型

【大語言模型：原理與工程實踐】大語言模型的應用

【大語言模型：原理與工程實踐】大語言模型的評測

【大語言模型：原理與工程實踐】大語言模型的預訓練

【大語言模型：原理與工程實踐】大語言模型的基礎技術

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

Meta公司的Llama2語言模型4項測試通過率低，幻覺率高

世界數字技術院發布：生成式AI安全測試標準及大語言模型

利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統（下）