色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>ChatGPT能否成為下一代搜索引擎

ChatGPT能否成為下一代搜索引擎

2023-02-10 | pdf | 1.44 MB | 次下載 | 免費

資料介紹

前 言 OpenAI這家公司又放大招了,繼發(fā)布GPT、GPT2和GPT3模型后,本月初發(fā)布了ChatGPT模型【也被稱為GPT3.5】,結(jié)合大家的測試效果來看,該模型效果確實很震撼,在人工智能圈子引起了不小的轟動。在AI發(fā)展相對處于低谷期的今天,如此震撼的模型發(fā)布出來,確實為該行業(yè)帶來一陣暖風,本文就詳細解讀一下該模型。

  在“人工標注數(shù)據(jù)+強化學(xué)習(xí)”框架下,具體而言,InstructGPT的訓(xùn)練過程分為以下三個階段:

  第一階段:冷啟動階段的監(jiān)督策略模型

  靠GPT 3本身,盡管它很強,但是它很難理解人類不同類型指令中蘊含的不同意圖,也很難判斷生成內(nèi)容是否是高質(zhì)量的結(jié)果。為了讓GPT 3初步具備理解指令中蘊含的意圖,首先會從測試用戶提交的prompt(就是指令或問題)中隨機抽取一批,靠專業(yè)的標注人員,給出指定prompt的高質(zhì)量答案,然后用這些人工標注好的數(shù)據(jù)來Fine-tune GPT 3模型。經(jīng)過這個過程,我們可以認為 GPT 3初步具備了理解人類prompt中所包含意圖,并根據(jù)這個意圖給出相對高質(zhì)量回答的能力,但是很明顯,僅僅這樣做是不夠的。

  第二階段:訓(xùn)練回報模型(RewardModel,RM)

  這個階段的主要目的是通過人工標注訓(xùn)練數(shù)據(jù),來訓(xùn)練回報模型。具體而言,隨機抽樣一批用戶提交的prompt(大部分和第一階段的相同),使用第一階段Fine-tune好的冷啟動模型,對于每個prompt,由冷啟動模型生成K個不同的回答,于是模型產(chǎn)生出了,…。數(shù)據(jù)。之后,標注人員對K個結(jié)果按照很多標準(上面提到的相關(guān)性、富含信息性、有害信息等諸多標準)綜合考慮進行排序,給出K個結(jié)果的排名順序,這就是此階段人工標注的數(shù)據(jù)。接下來,我們準備利用這個排序結(jié)果數(shù)據(jù)來訓(xùn)練回報模型,采取的訓(xùn)練模式其實就是平常經(jīng)常用到的pair-wiselearning to rank。對于K個排序結(jié)果,兩兩組合,形成 ( k 2 ) \binom{k}{2} (2k) 個訓(xùn)練數(shù)據(jù)對,ChatGPT采取pair-wiseloss來訓(xùn)練Reward Model。RM模型接受一個輸入,給出評價回答質(zhì)量高低的回報分數(shù)Score。對于一對訓(xùn)練數(shù)據(jù),我們假設(shè)人工排序中answer1排在answer2前面,那么Loss函數(shù)則鼓勵RM模型對的打分要比 的打分要高。歸納下:在這個階段里,首先由冷啟動后的監(jiān)督策略模型為每個prompt產(chǎn)生K個結(jié)果,人工根據(jù)結(jié)果質(zhì)量由高到低排序,以此作為訓(xùn)練數(shù)據(jù),通過pair-wiselearning to rank模式來訓(xùn)練回報模型。對于學(xué)好的RM模型來說,輸入,輸出結(jié)果的質(zhì)量得分,得分越高說明產(chǎn)生的回答質(zhì)量越高。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應(yīng)用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學(xué)會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費
主站蜘蛛池模板: h版动漫在线播放的网站| 亚洲 成人网| 三级视频黄色| 99re5久久热在线| 精品视频久久久久| 性色少妇AV蜜臀人妻无码| qvod播放电影| 牛牛在线1视频| 2017欧美狠狠色| 伦理片97影视网| 在线亚洲中文精品第1页| 久久人妻少妇嫩草AV蜜桃99| 年轻的女职工在线观看| 精品无码国产自产在线观看| 国产午夜精品久久理论片小说| 国产爱豆剧果冻传媒在线| 波多野结衣二区| 成人国产免费| 丰满人妻按磨HD| 国产精品久久久久久日本| 国产高清在线观看| 国产日韩欧美有码在线视频| 国产欧美无码亚洲毛片| 国产又粗又猛又爽又黄的免费视频 | 麻豆国产精品久久人妻| 久久性综合亚洲精品电影网| 玖玖爱精品视频| 啦啦啦WWW在线观看免费高清版 | 内射人妻骚骚骚| 欧洲美女人 一级毛片| 入禽太深免费观看| 小SAO货叫大声点妓女| 亚洲黄色免费观看| 伊人久久大香线蕉综合电影 | 好男人在线观看视频观看高清视频免费 | 漂亮的保姆3中文版完整版| 青青草原91| 琪琪伦伦影院理论片| 北条麻妃のレズナンパ | 男女啪啪抽搐呻吟高潮动态图| 啊好大好厉害好爽真骚|