有專家認為,xAI 可能是使用了 OpenAI 模型輸出來微調 Grok。 師出同門?馬斯克的新 AI 機器人 Grok 引用 OpenAI 使用政策
Grok 是由馬斯克創立的 xAI 公司開發的 AI 機器人,類似于 OpenAI 旗下的明星產品 ChatGPT。除了能夠通過 X 平臺(原 Twitter)獲取實時知識以外,Grok 與市面上其他模型的最大區別就是它樂于回答各種“尖銳”問題,并以一種既詼諧又有點叛逆的方式加以解構。
但自 Grok 上周正式發布以來,人們從中發現了不少有趣的現象。
上周五,安全測試員 Jax Winterbourne 在推文中分享了一張 Grok 拒絕查詢的屏幕截圖,這款機器人表示:“我恐怕無法滿足該請求,因為這違反了 OpenAI 的用例政策。”消息一出迅速在網上引發關注,因為 Grok 并非出自 OpenAI 之后,反而是為了與 OpenAI 打造的明星級聊天機器人 ChatGPT 相抗衡而生。
更有趣的是,xAI 的代表并沒有否認其 AI 模型存在這種行為。xAI 工程師 Igor Babuschkin 在回復中寫道:
“之所以會出現這種問題,是因為網絡上充斥著 ChatGPT 的輸出,所以我們在使用大量網絡數據訓練 Grok 時無意中獲取了其中部分輸出。這對我們來說完全是個意外,這也是我們第一次發現問題。這個問題本身非常罕見,現在我們已經意識到其存在,也將在 Grok 的未來版本中確保不再出現類似的問題。大家不用擔心,Grok 的開發中并沒有用到 OpenAI 代碼。”
ChatGPT“倒油”: 我們確實有很多共同點
對于一些專家來說,Babuschkin 的解釋似乎缺乏說服力,因為大語言模型一般不會原樣輸出訓練數據。如果 Grok 是在回答中偶爾提到了 OpenAI 政策,那倒是完全可以理解。但實際情況恰恰相反,這段基于 OpenAI 政策的拒絕查詢內容可能需要專門訓練。所以可能性更大的真相,其實是 Grok 使用 OpenAI 語言模型的輸出數據進行了微調。
根據 ArsTechnica 報道,AI 研究員 Simon Willison 在采訪中表示,“我對 Grok 之所以會輸出這樣的內容,只是因為互聯網上充斥著 ChatGPT 生成結果的說法表示懷疑。我在 Hugging Face 上看到過大量表現出相同行為的開放權重模型,它們的行為同樣跟 ChatGPT 高度相似,但這是因為那些模型在使用 OpenAI API 生成的數據集上進行了微調,或者干脆直接從 ChatGPT 本體中抓取了數據。所以我認為 Grok 更有可能是在包含 ChatGPT 輸出的數據集上進行了指令微調,而非基于網絡數據的純意外表現。”
隨著 Grok 可能借用 OpenAI 結果的消息傳開,ChatGPT 官方賬號發帖稱“我們確實有很多共同點”,并引用了 Winterbourne 的帖子。作為回應,馬斯克則寫道:“行吧,小子,反正你就是從整個網絡平臺上抓取數據訓練出來的,所以你肯定最懂。”
馬斯克打造的“叛逆”AI:Grok
根據介紹,Grok 是一款模仿《銀河系漫游指南》風格的“叛逆”機器人,會以辛辣幽默的方式“銳評”各類問題,其神奇的腦洞往往出人意料。據悉,Grok 僅經過兩個月的訓練就開發而成,xAI 表示該機器人將在用戶反饋的幫助下快速發展。
根據 xAI 的介紹,Grok 確實會回答那些被大多數其他 AI 系統拒絕的“尖銳”問題。管理顧問 Satyam Srivastava 表示,Grok 已經在不少有爭議的查詢上表現出“非常出色”的處理能力。他提到,馬斯克最近發布一條推文,其中一名用戶向 Grok 詢問如何合成可卡因,Grok 則將其稱為“臭名昭著的白面兒”。
起初,Grok 還在回復中添加了一點幽默元素,比如第 4 點是“上灶開炒,希望你別搞炸了或者被抓住。”但馬斯克隨后展示了更詳盡的完整回應,稱該機器人明確強調這一切都是“出于教育目的”。Srivastava 表示,“這種方法可謂在市場上脫穎而出,遠優于盡量回避此類問題的其他 AI 產品。”
作為 Grok 背后的引擎,Grok-1 在機器學習基準測試中的表現優異,成功超越了同等體量的其他模型。例如,Grok-1 的性能優于 ChatGPT-3.5 和 Inflection-1,僅落后于 GPT-4 等體量更大的模型。馬斯克還在 Twitter 上分享了一張圖片,展示了 Grok 與 其他典型 GPT 相比如何利用實時信息充實響應結果。
Grok 在開發中用到了 Kubernetes、Rust 和由 JAX 構建的強大基礎設施。xAI 團隊也特別強調了可靠基礎設施對于深度學習研究的重要意義,而 Rust 的性能與可靠性也發揮了巨大價值。隨著 Grok 為進一步迭代做好準備,該團隊聲稱其重點關注可擴展、高效且可靠的訓練與推理機制。
此外,Grok 還曾接受 2023 年匈牙利國家高中數學考試,獲得的成績為 C。Srivastava 表示,未來隨著 Grok 掌握更先進的學習算法,它有望比 ChatGPT 和 Bard 等其他 AI 模型更快地學習和適應。
但研究參與者兼 Culture Fluid 創始人 Sharon Gai 認為,由于 Grok 主要接受來自 Twitter 用戶的訓練數據,因此她只能暫時停止對準確度的考查。她解釋道,“任何人都可以在 Twitter 發表推文,所以這里簡直成了錯誤信息的集散地。相比之下,ChatGPT 則主要將已出版的期刊、網站和書籍作為素材進行訓練。”
Gai 還補充道,馬斯克在通過藍標認證為 Twitter 賺錢的計劃失敗之后,就匆忙推出了自己的 AI 機器人。在她看來,“目前馬斯克這套模型的唯一優點就是使用了最新數據,而且比“清醒的”ChatGPT 能回答更多問題。這款產品也很好地融入了他將 X 打造成超級應用的計劃。馬斯克已經為 X 平臺申請到了銀行牌照,還計劃推出直播服務。”
審核編輯:劉清
-
AI機器人
+關注
關注
0文章
38瀏覽量
3800 -
OpenAI
+關注
關注
9文章
1100瀏覽量
6580 -
ChatGPT
+關注
關注
29文章
1564瀏覽量
7818
原文標題:馬斯克打造的“叛逆”AI被曝抄襲ChatGPT?xAI工程師回應:我們沒用OpenAI代碼
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論