色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

檢索增強(qiáng)型生成(RAG)系統(tǒng)詳解

SSDFans ? 來(lái)源:SSDFans ? 2024-12-24 10:44 ? 次閱讀
近年來(lái),人工智能取得了巨大的飛躍,這主要?dú)w功于大型語(yǔ)言模型(LLMs)。LLMs非常擅長(zhǎng)理解和生成類似人類的文本,它們促成了多種新工具的創(chuàng)建,比如先進(jìn)的聊天機(jī)器人AI作家。

盡管LLMs在生成流暢且類似人類的文本方面表現(xiàn)出色,但它們有時(shí)在事實(shí)準(zhǔn)確性上存在困難。當(dāng)準(zhǔn)確性非常重要時(shí),這可能是一個(gè)巨大的問(wèn)題。

那么,這個(gè)問(wèn)題的解決方案是什么呢?答案是檢索增強(qiáng)型生成(RAG)系統(tǒng)。

RAG集成了像GPT這樣的模型的強(qiáng)大功能,并增加了從外部來(lái)源查找信息的能力,比如專有數(shù)據(jù)庫(kù)、文章和內(nèi)容。這有助于AI產(chǎn)生不僅寫得好,而且在事實(shí)和上下文正確性方面也更準(zhǔn)確的文本。

通過(guò)結(jié)合生成文本的能力與查找和使用準(zhǔn)確相關(guān)信息的力量,RAG開(kāi)辟了許多新的可能性。它有助于彌合僅僅編寫文本的AI與能夠使用實(shí)際知識(shí)的AI之間的差距。

在這篇文章中,我們將更仔細(xì)地研究RAG,它是如何工作的,它在哪里被使用,以及它可能如何改變我們未來(lái)與AI的互動(dòng)。

讓我們從一個(gè)正式的RAG定義開(kāi)始:

檢索增強(qiáng)型生成(RAG)是一個(gè)AI框架,它通過(guò)將大型語(yǔ)言模型(LLMs)與外部知識(shí)庫(kù)連接起來(lái)來(lái)增強(qiáng)它們。這允許訪問(wèn)最新的、準(zhǔn)確的信息,提高其結(jié)果的相關(guān)性和事實(shí)準(zhǔn)確性。

現(xiàn)在,讓我們用簡(jiǎn)單的語(yǔ)言來(lái)解釋,以便容易理解。

我們都使用過(guò)像ChatGPT這樣的AI聊天機(jī)器人來(lái)回答我們的問(wèn)題。這些由大型語(yǔ)言模型(LLMs)驅(qū)動(dòng),它們是在大量互聯(lián)網(wǎng)內(nèi)容/數(shù)據(jù)上訓(xùn)練和構(gòu)建的。它們?cè)趲缀跛兄黝}上都能產(chǎn)生類似人類的文本,看起來(lái)它們似乎能夠完美地回答我們所有的問(wèn)題,但并不總是這樣。它們有時(shí)分享的信息可能不準(zhǔn)確,事實(shí)上不正確。

這就是RAG發(fā)揮作用的地方。以下是它的工作原理

1.提出一個(gè)問(wèn)題。

2.RAG搜索經(jīng)過(guò)策劃的知識(shí)庫(kù)中的可靠信息。

3.檢索相關(guān)信息。

4.將這些信息傳遞給LLM。

5.LLM使用這些準(zhǔn)確信息作出回答。

這個(gè)過(guò)程的結(jié)果是得到由準(zhǔn)確信息支持的回應(yīng)。

讓我們用一個(gè)例子來(lái)理解這一點(diǎn):想象你想知道國(guó)際航班的行李限額。一個(gè)傳統(tǒng)的LLM像ChatGPT可能會(huì)說(shuō):“通常,你可以托運(yùn)一個(gè)重達(dá)50磅的行李和一個(gè)隨身行李。但具體請(qǐng)咨詢你的航空公司。”一個(gè)RAG增強(qiáng)系統(tǒng)會(huì)說(shuō):“對(duì)于X航空公司,經(jīng)濟(jì)艙乘客可以托運(yùn)一個(gè)50磅的行李和一個(gè)17磅的隨身行李。商務(wù)艙可以獲得兩個(gè)70磅的行李。注意運(yùn)動(dòng)器材等特殊物品的規(guī)則,并總是在辦理登機(jī)手續(xù)時(shí)驗(yàn)證。”

你注意到區(qū)別了嗎?RAG提供了針對(duì)實(shí)際航空公司政策的具體、更準(zhǔn)確的信息。總之,RAG使這些系統(tǒng)更可靠和值得信賴。在開(kāi)發(fā)更適用于現(xiàn)實(shí)世界的AI系統(tǒng)方面非常重要。

RAG如何工作

現(xiàn)在我們已經(jīng)對(duì)RAG有了一個(gè)很好的了解,讓我們了解它是如何工作的。首先,讓我們從一個(gè)簡(jiǎn)單的架構(gòu)圖開(kāi)始。

RAG的關(guān)鍵組件

從上面的架構(gòu)圖中,從用戶問(wèn)題到問(wèn)題最終答案之間,有三個(gè)關(guān)鍵組件對(duì)RAG的工作至關(guān)重要。

1.知識(shí)庫(kù)

2.檢索器

3.生成器

現(xiàn)在,讓我們一個(gè)一個(gè)地了解它們。

知識(shí)庫(kù)

這是包含所有可以引用來(lái)回答所有問(wèn)題的文檔、文章或數(shù)據(jù)的存儲(chǔ)庫(kù)。這需要不斷更新新的和相關(guān)信息,以便回應(yīng)是準(zhǔn)確的,并向用戶提供最相關(guān)和最新的信息。

從技術(shù)角度來(lái)看,這通常使用向量數(shù)據(jù)庫(kù)如Pinecone、FAISS等來(lái)存儲(chǔ)文本作為數(shù)值表示(嵌入),從而允許快速和高效的搜索。

檢索器

它負(fù)責(zé)找到與用戶問(wèn)題相關(guān)的文檔或數(shù)據(jù)。當(dāng)提出一個(gè)問(wèn)題時(shí),檢索器會(huì)快速搜索知識(shí)庫(kù)以找到最相關(guān)的信息。

從技術(shù)角度來(lái)看,這通常使用密集檢索方法,如Dense Passage Retrieval或BM25。這些方法將用戶問(wèn)題轉(zhuǎn)換為知識(shí)庫(kù)中使用的那種數(shù)值表示,并與相關(guān)信息匹配。

生成器

它負(fù)責(zé)生成與用戶問(wèn)題相關(guān)且上下文相關(guān)的連貫內(nèi)容。它從檢索器那里獲取信息,并用它來(lái)構(gòu)建回答這個(gè)問(wèn)題的回應(yīng)。

從技術(shù)角度來(lái)看,這由大型語(yǔ)言模型(LLM)如GPT-4或開(kāi)源替代品如LLAMA或BERT提供動(dòng)力。這些模型是在大量數(shù)據(jù)集上訓(xùn)練的,可以根據(jù)它們接收的輸入生成類似人類的文本。

RAG的好處和應(yīng)用

現(xiàn)在我們知道了RAG是什么以及它如何工作,讓我們探索它提供的一些好處以及RAG的應(yīng)用。

RAG的好處

最新的知識(shí)

與傳統(tǒng)的AI模型(如ChatGPT)不同,它們僅限于訓(xùn)練數(shù)據(jù),RAG系統(tǒng)可以訪問(wèn)并利用知識(shí)庫(kù)中最新的信息。

增強(qiáng)準(zhǔn)確性和減少幻覺(jué)

RAG通過(guò)使用知識(shí)庫(kù)中的事實(shí)、最新信息來(lái)提高回應(yīng)的準(zhǔn)確性。這在很大程度上減少了“AI幻覺(jué)”的問(wèn)題——即AI生成更合理但錯(cuò)誤的信息的實(shí)例。

定制化和專業(yè)化

公司可以根據(jù)自己的特定需求構(gòu)建RAG系統(tǒng),使用專門的知識(shí)庫(kù)并創(chuàng)建特定領(lǐng)域的AI助手。

透明度和可解釋性

RAG系統(tǒng)通常可以提供其信息的來(lái)源,使用戶更容易理解來(lái)源、驗(yàn)證聲明,并理解回應(yīng)背后的推理。

可擴(kuò)展性和效率

RAG允許高效使用計(jì)算資源。與其不斷重新訓(xùn)練大型模型或構(gòu)建新模型,組織可以更新他們的知識(shí)庫(kù),使AI系統(tǒng)的擴(kuò)展和維護(hù)變得更容易。

RAG的應(yīng)用

客戶服務(wù)

RAG使客戶支持聊天機(jī)器人更智能、更有幫助。這些聊天機(jī)器人可以訪問(wèn)知識(shí)庫(kù)中的最新信息,并提供精確和上下文的答案。

個(gè)性化助手

公司可以創(chuàng)建定制的AI助手,可以利用他們獨(dú)特和專有的數(shù)據(jù)。通過(guò)利用組織內(nèi)部關(guān)于政策、程序和其他數(shù)據(jù)的文件,這些助手可以快速有效地回答員工的查詢。

客戶之聲

組織可以使用RAG分析并從廣泛的客戶反饋渠道中提取可操作的洞察,以全面了解客戶體驗(yàn)、情感和需求。這使他們能夠快速識(shí)別和解決關(guān)鍵問(wèn)題,做出數(shù)據(jù)驅(qū)動(dòng)的決策,并根據(jù)客戶反饋的完整畫(huà)面不斷改進(jìn)他們的產(chǎn)品。

RAG的未來(lái)

RAG已經(jīng)成為人工智能領(lǐng)域改變游戲規(guī)則的技術(shù),結(jié)合了大型語(yǔ)言模型的威力與動(dòng)態(tài)信息檢索。許多組織已經(jīng)在利用這一點(diǎn),并為他們的需求構(gòu)建定制解決方案。

展望未來(lái),RAG將改變我們與信息互動(dòng)和做決策的方式。未來(lái)的RAG系統(tǒng)將:

·具有更大的上下文理解和增強(qiáng)的個(gè)性化;

·超越文本,并整合圖像、音視頻,成為多模態(tài)系統(tǒng)

·擁有實(shí)時(shí)知識(shí)庫(kù)更新;

·與許多工作流程無(wú)縫集成,提高生產(chǎn)力和增強(qiáng)協(xié)作。

結(jié)論

總之,RAG將徹底改變我們與AI和信息的互動(dòng)方式。通過(guò)縮小AI生成內(nèi)容與其事實(shí)準(zhǔn)確性之間的差距,RAG將為智能AI系統(tǒng)奠定舞臺(tái),這些系統(tǒng)不僅更有能力,而且更準(zhǔn)確、更值得信賴。隨著這種技術(shù)的不斷發(fā)展,我們與信息的互動(dòng)將比以往任何時(shí)候都更高效、更準(zhǔn)確。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33553

    瀏覽量

    274142
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    557

    瀏覽量

    10591

原文標(biāo)題:RAG,看這一篇就夠了!

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升

    帶來(lái)了前所未有的智能問(wèn)答體驗(yàn)。 RAG增強(qiáng)型與傳統(tǒng)生成式AI的關(guān)鍵差異: 圖2:DeepSeek模型增強(qiáng)RAG能力前后效果對(duì)比圖 升級(jí)點(diǎn)2:
    發(fā)表于 04-18 14:43

    《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫(kù)

    應(yīng)用。第六章深入探討了RAG架構(gòu)的工作原理,該技術(shù)通過(guò)在推理過(guò)程中實(shí)時(shí)檢索和注入外部知識(shí)來(lái)增強(qiáng)模型的生成能力。RAG架構(gòu)的核心是
    發(fā)表于 03-07 19:49

    【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】RAG基本概念

    RAG應(yīng)用架構(gòu)具備清晰的分層設(shè)計(jì)。知識(shí)庫(kù)構(gòu)建層,著重于將各類非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效處理,轉(zhuǎn)化為計(jì)算機(jī)能夠理解的形式,通過(guò)向量化編碼技術(shù)為數(shù)據(jù)賦予數(shù)字特征,并建立動(dòng)態(tài)索引以便快速查詢更新。檢索增強(qiáng)層,采用
    發(fā)表于 02-08 00:22

    【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+第一章初體驗(yàn)

    3降低幻覺(jué)風(fēng)險(xiǎn):通過(guò)引入權(quán)威數(shù)據(jù)源(如學(xué)術(shù)論文、企業(yè)文檔),RAG生成過(guò)程提供“事實(shí)錨點(diǎn)”,減少模型虛構(gòu)內(nèi)容的可能性。 4輕量化部署:開(kāi)發(fā)者無(wú)需頻繁微調(diào)大模型,僅需優(yōu)化檢索模塊即可提升系統(tǒng)
    發(fā)表于 02-07 10:42

    【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

    引入外部知識(shí)庫(kù)來(lái)增強(qiáng)生成模型的能力。而Embedding在 Embedding模型將用戶的問(wèn)題和文檔庫(kù)中的文本轉(zhuǎn)換為向量表示,這是RAG系統(tǒng)進(jìn)行信息檢索和文本
    發(fā)表于 01-17 19:53

    借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

    面對(duì)大量不斷迭代的新知識(shí),大模型必須“終身學(xué)習(xí)”才能滿足實(shí)際應(yīng)用的需求。RAG(Retrieval-augmented Generation,檢索增強(qiáng)生成)讓生成式大模型能夠利用外部的
    的頭像 發(fā)表于 12-19 14:32 ?534次閱讀
    借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型<b class='flag-5'>RAG</b>

    RAG的概念及工作原理

    檢索增強(qiáng)型生成RAG系統(tǒng)正在重塑我們處理AI驅(qū)動(dòng)信息的方式。作為架構(gòu)師,我們需要理解這些系統(tǒng)
    的頭像 發(fā)表于 12-17 13:41 ?1242次閱讀
    <b class='flag-5'>RAG</b>的概念及工作原理

    浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

    近日,浪潮信息發(fā)布 “源”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務(wù)第一名,以78.41的平均精度刷新大模型RAG檢索最高成績(jī),將基于元腦企
    的頭像 發(fā)表于 11-26 13:54 ?445次閱讀
    浪潮信息發(fā)布“源”Yuan-EB助力<b class='flag-5'>RAG</b><b class='flag-5'>檢索</b>精度新高

    使用TMS320C6000增強(qiáng)型DMA的應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《使用TMS320C6000增強(qiáng)型DMA的應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 10-23 09:48 ?0次下載
    使用TMS320C6000<b class='flag-5'>增強(qiáng)型</b>DMA的應(yīng)用

    使用OpenVINO和LlamaIndex構(gòu)建Agentic-RAG系統(tǒng)

    RAG 系統(tǒng)的全稱是 Retrieval-augmented Generation,本質(zhì)上是 Prompt Engineering,通過(guò)在 Prompt 中注入檢索得到的外部數(shù)據(jù),可以有效地
    的頭像 發(fā)表于 10-12 09:59 ?597次閱讀
    使用OpenVINO和LlamaIndex構(gòu)建Agentic-<b class='flag-5'>RAG</b><b class='flag-5'>系統(tǒng)</b>

    增強(qiáng)型HotRod QFN封裝:實(shí)現(xiàn)低EMI性能

    電子發(fā)燒友網(wǎng)站提供《增強(qiáng)型HotRod QFN封裝:實(shí)現(xiàn)低EMI性能.pdf》資料免費(fèi)下載
    發(fā)表于 08-26 11:37 ?0次下載
    <b class='flag-5'>增強(qiáng)型</b>HotRod QFN封裝:實(shí)現(xiàn)低EMI性能

    增強(qiáng)型MOS管的結(jié)構(gòu)解析

    增強(qiáng)型MOS管(Enhancement MOSFET)是一種重要的場(chǎng)效應(yīng)晶體管,具有高輸入阻抗、低輸入電流、高速開(kāi)關(guān)和低噪聲等優(yōu)點(diǎn),被廣泛應(yīng)用于電子設(shè)備中。以下是對(duì)增強(qiáng)型MOS管結(jié)構(gòu)的詳細(xì)解析。
    的頭像 發(fā)表于 07-24 10:51 ?2423次閱讀

    TaD+RAG-緩解大模型“幻覺(jué)”的組合新療法

    TaD:任務(wù)感知解碼技術(shù)(Task-aware Decoding,簡(jiǎn)稱TaD),京東聯(lián)合清華大學(xué)針對(duì)大語(yǔ)言模型幻覺(jué)問(wèn)題提出的一項(xiàng)技術(shù),成果收錄于IJCAI2024。 RAG檢索增強(qiáng)生成技術(shù)
    的頭像 發(fā)表于 07-16 15:01 ?2533次閱讀
    TaD+<b class='flag-5'>RAG</b>-緩解大模型“幻覺(jué)”的組合新療法

    mos管增強(qiáng)型與耗盡的區(qū)別是什么

    MOSFET(金屬-氧化物-半導(dǎo)體場(chǎng)效應(yīng)晶體管)是一種廣泛應(yīng)用于電子設(shè)備中的半導(dǎo)體器件,具有高輸入阻抗、低驅(qū)動(dòng)功率和良好的線性特性等優(yōu)點(diǎn)。根據(jù)導(dǎo)電溝道的形成方式,MOSFET可以分為增強(qiáng)型和耗盡
    的頭像 發(fā)表于 07-14 11:32 ?5892次閱讀

    如何手?jǐn)]一個(gè)自有知識(shí)庫(kù)的RAG系統(tǒng)

    RAG通常指的是"Retrieval-Augmented Generation",即“檢索增強(qiáng)生成”。這是一種結(jié)合了檢索(Retrieva
    的頭像 發(fā)表于 06-17 14:59 ?848次閱讀
    主站蜘蛛池模板: 青柠在线电影高清免费观看 | 三男强一女90分钟在线观看 | 久久草福利自拍视频在线观看 | 成人天堂资源WWW在线 | 日本伦子欲| 午夜精品久久久久久久爽牛战 | 国产午夜精品一区二区 | 老湿司午夜爽爽影院榴莲视频 | 亚洲日韩一区精品射精 | 国产精品伦一区二区三级视频 | 亚洲破处女 | hdsex老太婆70 | 精品久久久久久久高清 | 福利社影院| 久久精品免费电影 | 无码国产色欲XXXX视频 | 99热在线精品视频 | 国产精品第1页 | 中国老头oldday tv | 俄罗斯美女性生活 | 精品国产露脸久久AV麻豆 | 一二三四在线观看高清电视剧 | 免费亚洲视频 | 天天综合网网欲色 | 国产高清国内精品福利色噜噜 | 强奸日本美女小游戏 | 亚洲激情一区 | 亚洲福利天堂网福利在线观看 | 午夜神器18以下不能进免费 | 最近中文字幕完整版免费高清 | WWW国产亚洲精品久久麻豆 | 午夜阳光影院在线观看视频 | 久久免费资源福利资源站 | 高H短篇辣肉纯肉 | 欧美日韩中文国产一区发布 | 99久久精品全部 | 伊人影院综合 | 久热人人综合人人九九精品视频 | 欧洲vs美洲完整视频 | 亚洲粉嫩美白在线 | 国产露脸无码A区久久蘑菇 国产露脸无码A区久久 |

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品