色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對話機器人之LaMDA

深度學習自然語言處理 ? 來源:NLP日志 ? 2023-01-04 14:49 ? 次閱讀

來自:NLP日志

提綱1 簡介 2 LaMDA 3 總結

1 簡介

LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的對話機器人,全稱Language Models for Dialog Applications,是一個在海量對話跟web數據上進行預訓練再在人工標注數據上做進一步微調后得到的參數量高達137B的大模型。LaMDA除了在生成文本質量有所提升外,通過在人工標注數據上做進一步finetune以及讓模型學會檢索利用外部知識源的能力,使得模型在安全性以及事實性這兩個關鍵問題上獲得明顯提升。

安全性指的是模型的回復應該滿足一系列人為價值觀,例如沒有歧視跟偏見,不會生成傷害性建議。事實性指的模型的回復應該符合事實,跟外部知識源保持一致,而不是一本正經的胡說八道。???????

83dd799a-884f-11ed-bfe3-dac502259ad0.png

圖1: LaMDA在生成文本在多個指標下有明顯提升

2 LaMDA

Pre-training

LaMDA采用的是純decoder的結構,類似于GPT,使用了46層Transformer,模型參數量高達130B,是Meena的50倍。預訓練的任務是預測文本中的下一個token,解碼策略跟Meenay一致,都是從top-40結果采樣得到16個候選回復,再基于候選回復的對數似然得分跟長度選擇最優的回復。不同于此前的對話模型只在對話數據上訓練,LaMDA的預訓練數據集包括對話數據(1.12B)和其他web文檔數據(2.97B)。

83ffe962-884f-11ed-bfe3-dac502259ad0.png

圖2: LaMDA預訓練任務????

Finetune

LaMDA的finetune包括兩部分,一部分是針對生成文本質量跟安全性,另一部分則是學習如何利用外部的信息檢索系統。其中質量(SS I)可以從三方面評估,分別是sensibleness(文本是否合理,跟歷史對話是否有沖突),Specificity(對于前文是否有針對性,避免籠統回復,例如用戶提問“I love Eurovision”,模型生成一個籠統回復“Me too”就不符合預期),Interestingness(文本是否能引起某人注意或者好奇,是否是超出期待的巧妙回復)。而安全性(Safety)的目標則是要符合谷歌AI的基本原則,避免生成會造成傷害的不符合預期的結果,或者帶有偏見跟歧視。

a)Finetuning for quality and safety

這部分的finetune既包括給定上文生成回復的生成任務,也包括評估回復質量跟安全性的判別式任務。對于生成任務,訓練樣本格式由“”(上文,哨兵,回復)三部分拼接而成,損失只計算其中response相關那部分,也就是在給定歷史上文條件下,只計算模型生成回復跟期望回復之間的損失。而對于判別任務,訓練樣本則是“” (上文,哨兵,回復,屬性,得分)五部分拼接得到,損失只計算屬性對應的rating得分損失,也就是在給定歷史上文跟模型回復條件下,計算特定屬性下的模型得分跟人工標注結果之間的損失。這種LaMDA同時用于生成跟判別的設計能夠實現一個更佳高效的流程,在生成回復后,使用判別模型打分時需要對應指標的概率P(|),而生成模型已經處理過了,所以只需要在額外處理少量的跟attribute-name相關的token即可。

Finetune過程先對LaMDA的判別任務進行優化,使得模型可以預測候選回復的質量得分跟安全性得分,然后過濾掉安全性得分低于閾值的候選回復,再根據質量得分對候選回復進行排序(3*P(sensibleness)+P(specificity)+P(interestingness)),選擇其中得分最高的回復作為模型生成的結果。再利用已經訓練后LaMDA的打分模型,篩選出高質量的訓練數據,用于LaMDA的生成任務的finetune,使得模型可以生成高質量的回復。根據下圖也可以看到利用高質量數據進行的finetune讓模型在各方面都有了明顯的提升。

841e2864-884f-11ed-bfe3-dac502259ad0.png

圖3: finetune模型在多個指標上的提升

b)Finetuning to learn to call an external information retrieval system

這部分也稱為Groundedness,針對語言模型的可能生成看起來可信,但是違背事實的幻視問題,LaMDA通過學習使用利用外部知識源去緩解這個問題。LaMDA構建一個包含信息檢索系統,計算模塊,翻譯模塊的工具(簡稱TS),這部分的finetune也包括兩個子任務,第一個是將歷史上文跟模型回復一起輸入到模型中,生成對應的檢索query。第二個子任務是將歷史上文+模型回復+檢索結果一同輸入到模型中,讓模型決定是生成新的檢索query或者生成最終回復(根據生成的第一個字符串決定,如果是TS,則繼續檢索,如果是User則返回對應結果)

8461f1d4-884f-11ed-bfe3-dac502259ad0.png

圖4: LaMDA Search流程?

在具體推理流程中,只用一個LaMDA模型,但是做了多個子任務,具體過程中該執行哪個子任務,則由當前輸入的prompt決定,例如當前輸入prompt是LaMDA to user就對應自動生成回復,如果當前prompt是LaMDA-Base to LaMDA-Research就對應生成檢索query。

3 總結

從LaMDA跟后續的Sparrow,我們也可以看到一些共同點。1)可以使用一個強大的模型同時處理多個不同任務。????2)finetune階段高質量數據對于模型的最終性能影響頗大,為了得到這些高質量的數據,LaMDA跟Sparrow在搜集finetune數據有一套嚴格的方法論。3) 讓模型學習檢索利用外部知識源,可以緩解模型幻視的問題,讓模型生成結果更佳有理可依,也讓模型可以回答與時俱進的問題。?????????????4)為生成文本的安全性設計額外的子任務,從而緩解敏感性的問題。LaMDA的成功,依舊貫徹著大力出奇跡的思路,不僅模型的參數量龐大,預訓練的語料龐大,連finetune階段的人工標注數據也不是一般人可以承受的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28632

    瀏覽量

    207984
  • 模型
    +關注

    關注

    1

    文章

    3298

    瀏覽量

    49064

原文標題:對話機器人之LaMDA

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI智能電話機器人對電子行業的影響是什么

    一、AI 智能電話機器人的基本概念 AI 智能電話機器人是融合人工智能技術,模擬人類與客戶進行電話溝通交流的自動化程序系統。它借助先進的語音識別、自然語言處理和對話管理等技術,能夠自動撥打
    的頭像 發表于 01-23 09:45 ?28次閱讀

    密與庫卡機器人達成戰略合作

    近日,伊密與庫卡機器人(廣東)有限公司(以下簡稱“庫卡”)在伊密全球創新中心舉行戰略簽約合作儀式。
    的頭像 發表于 01-22 10:11 ?83次閱讀

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    具身智能機器人的基礎模塊,這個是本書的第二部分內容,主要分為四個部分:機器人計算系統,自主機器人的感知系統,自主機器人的定位系統,自主機器人
    發表于 01-04 19:22

    《具身智能機器人系統》第10-13章閱讀心得具身智能機器人計算挑戰

    閱讀《具身智能機器人系統》第10-13章,我對具身智能機器人的工程實踐有了全新認識。第10章從實時性角度剖析了機器人計算加速問題。機器人定位中的SLAM算法需要處理兩個計算密集型任務:
    發表于 01-04 01:15

    【「具身智能機器人系統」閱讀體驗】+兩本互為支持的書

    最近在閱讀《具身智能機器人系統》這本書的同時,還讀了 《計算機視覺PyTorch數字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇。《計算機視覺PyTorch數字圖像處理》是介紹
    發表于 01-01 15:50

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    近年來,人工智能領域的大模型技術在多個方向上取得了突破性的進展,特別是在機器人控制領域展現出了巨大的潛力。在“具身智能機器人大模型”部分,作者研究并探討了大模型如何提升機器人的能力,大模型存在
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

    感謝 感謝電子發燒友網社區給予《具身智能機器人系統》試讀機會。在這知識的盛宴中,我感受到社區的關懷與支持。定不負期望,認真研讀,分享所學,回饋社區。 一、本書大綱 《具身智能機器人系統》是一本
    發表于 12-28 21:12

    【「具身智能機器人系統」閱讀體驗】+初品的體驗

    《具身智能機器人系統》 一書由甘一鳴、俞波、萬梓燊、劉少山老師共同編寫,其封面如圖1所示。 本書共由5部分組成,其結構和內容如圖2所示。 該書可作為高校和科研機構的教材,為學生和研究人員提供系統
    發表于 12-20 19:17

    《具身智能機器人系統》第1-6章閱讀心得具身智能機器人系統背景知識與基礎模塊

    要給AI這個聰明的“頭腦”裝上一副“身體”。這個“身體”可以是一部手機,可以是一臺自動駕駛汽車。而人形機器人則是集各類核心尖端技術于一體的載體,是具身智能的代表產品。與傳統的軟件智能體不同,具身智能
    發表于 12-19 22:26

    鴻蒙機器人與鴻蒙開發板聯動演示

    鴻蒙機器人與鴻蒙開發板聯動演示,機器人的角色為迎賓機器人,開發板負責人賓客出現監聽
    發表于 12-02 14:55

    開源項目!用ESP32做一個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機器人——可愛無用機器人。 無用機器人原理是一個連接到開關的電機,通過邏輯門控制。當開關被推到“開”時,機器人啟動
    發表于 09-03 09:34

    開源項目!用ESP32做一個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機器人——可愛無用機器人。 無用機器人原理是一個連接到開關的電機,通過邏輯門控制。當開關被推到“開”時,機器人
    發表于 08-30 14:50

    Al大模型機器人

    理解能力強大: AI大模型機器人可以理解和生成自然語言,能夠進行復雜的對話和語言任務。它們能夠識別語言中的語義、語境和情感,并據此作出適當的回應。廣泛的知識儲備: 這些模型基于大規模的數據集進行訓練,擁有
    發表于 07-05 08:52

    其利天下技術·搭載無刷電機的掃地機器人的前景如何?

    了使用體驗,其發展前景愈發廣闊。 1. 搭配無刷電機的掃地機器人優勢 無刷電機相較于傳統有刷電機,具有更高的效率、更低的噪音和更長的使用壽命。這一技術的應用,使得掃地機器人能夠在同等能耗下提供更強
    發表于 05-05 15:03

    AI企業Figure發布人形機器人01,具備與人對話能力,能理解情境

    這款機器人的獨特之處是使用OpenAI的大型語言模型進行正常且完整的雙向對話,由于它能夠接受多模態輸入,從而擁有更高層次的視覺和語言智能。Figure神經網絡則能提供快速、精細、靈活的機器人動作表現。
    的頭像 發表于 03-14 10:40 ?784次閱讀
    主站蜘蛛池模板: 黑色丝袜美腿美女被躁翻了 | 亚洲国产精品免费观看 | 久久久久999 | 久久亚洲AV无码精品午色夜麻豆 | 97国产蝌蚪视频在线观看 | 贤妻良母电影日本 | 亚洲免费视频网站 | 国产亚洲精品久久久久久无码网站 | 欧美极品尿交 | 中国少妇内射XXXHD免费 | 亚洲成人欧美 | 国产AV白丝爆浆在线播放 | 大胸美女被C得嗷嗷叫动态图 | 亚洲午夜AV久久久精品影院色戒 | 无套内射CHINESEHD熟女 | 东北女人奶大毛多水多 | 国产精品久久久久久精品... | 伊人久久中文大香线蕉综合 | 久久学生精品国产自在拍 | 国产免费变态视频网址网站 | 高清 国产 在线 亚洲 | 国产成人女人视频在线观看 | 午夜日本大胆裸艺术 | 手机看片国产免费久久网 | 久久久精品免费免费直播 | 久久青青草原精品国产软件 | 亚洲成a人不卡在线观看 | 久久综合香蕉久久久久久久 | 女教师苍井空体肉女教师S242 | 日韩毛片大全 | 96.8在线收听| 国产精品免费大片一区二区 | 老阿姨才是最有味的一区二区 | 国产精品亚洲一区二区三区久久 | 特级黑人三人共一女 | avtt天堂网Av无码 | 亚洲中文久久精品AV无码 | 高清欧美性猛交xxxx黑人猛交 | 中国午夜伦理片 | 日韩高清在线亚洲专区 | 二色AV天堂在线 |