盡管LLMs在生成流暢且類似人類的文本方面表現(xiàn)出色,但它們有時(shí)在事實(shí)準(zhǔn)確性上存在困難。當(dāng)準(zhǔn)確性非常重要時(shí),這可能是一個(gè)巨大的問(wèn)題。
那么,這個(gè)問(wèn)題的解決方案是什么呢?答案是檢索增強(qiáng)型生成(RAG)系統(tǒng)。
RAG集成了像GPT這樣的模型的強(qiáng)大功能,并增加了從外部來(lái)源查找信息的能力,比如專有數(shù)據(jù)庫(kù)、文章和內(nèi)容。這有助于AI產(chǎn)生不僅寫得好,而且在事實(shí)和上下文正確性方面也更準(zhǔn)確的文本。
通過(guò)結(jié)合生成文本的能力與查找和使用準(zhǔn)確相關(guān)信息的力量,RAG開(kāi)辟了許多新的可能性。它有助于彌合僅僅編寫文本的AI與能夠使用實(shí)際知識(shí)的AI之間的差距。
在這篇文章中,我們將更仔細(xì)地研究RAG,它是如何工作的,它在哪里被使用,以及它可能如何改變我們未來(lái)與AI的互動(dòng)。
讓我們從一個(gè)正式的RAG定義開(kāi)始:
檢索增強(qiáng)型生成(RAG)是一個(gè)AI框架,它通過(guò)將大型語(yǔ)言模型(LLMs)與外部知識(shí)庫(kù)連接起來(lái)來(lái)增強(qiáng)它們。這允許訪問(wèn)最新的、準(zhǔn)確的信息,提高其結(jié)果的相關(guān)性和事實(shí)準(zhǔn)確性。
現(xiàn)在,讓我們用簡(jiǎn)單的語(yǔ)言來(lái)解釋,以便容易理解。
我們都使用過(guò)像ChatGPT這樣的AI聊天機(jī)器人來(lái)回答我們的問(wèn)題。這些由大型語(yǔ)言模型(LLMs)驅(qū)動(dòng),它們是在大量互聯(lián)網(wǎng)內(nèi)容/數(shù)據(jù)上訓(xùn)練和構(gòu)建的。它們?cè)趲缀跛兄黝}上都能產(chǎn)生類似人類的文本,看起來(lái)它們似乎能夠完美地回答我們所有的問(wèn)題,但并不總是這樣。它們有時(shí)分享的信息可能不準(zhǔn)確,事實(shí)上不正確。
這就是RAG發(fā)揮作用的地方。以下是它的工作原理:
1.提出一個(gè)問(wèn)題。
2.RAG搜索經(jīng)過(guò)策劃的知識(shí)庫(kù)中的可靠信息。
3.檢索相關(guān)信息。
4.將這些信息傳遞給LLM。
5.LLM使用這些準(zhǔn)確信息作出回答。
這個(gè)過(guò)程的結(jié)果是得到由準(zhǔn)確信息支持的回應(yīng)。
讓我們用一個(gè)例子來(lái)理解這一點(diǎn):想象你想知道國(guó)際航班的行李限額。一個(gè)傳統(tǒng)的LLM像ChatGPT可能會(huì)說(shuō):“通常,你可以托運(yùn)一個(gè)重達(dá)50磅的行李和一個(gè)隨身行李。但具體請(qǐng)咨詢你的航空公司。”一個(gè)RAG增強(qiáng)系統(tǒng)會(huì)說(shuō):“對(duì)于X航空公司,經(jīng)濟(jì)艙乘客可以托運(yùn)一個(gè)50磅的行李和一個(gè)17磅的隨身行李。商務(wù)艙可以獲得兩個(gè)70磅的行李。注意運(yùn)動(dòng)器材等特殊物品的規(guī)則,并總是在辦理登機(jī)手續(xù)時(shí)驗(yàn)證。”
你注意到區(qū)別了嗎?RAG提供了針對(duì)實(shí)際航空公司政策的具體、更準(zhǔn)確的信息。總之,RAG使這些系統(tǒng)更可靠和值得信賴。在開(kāi)發(fā)更適用于現(xiàn)實(shí)世界的AI系統(tǒng)方面非常重要。
RAG如何工作
現(xiàn)在我們已經(jīng)對(duì)RAG有了一個(gè)很好的了解,讓我們了解它是如何工作的。首先,讓我們從一個(gè)簡(jiǎn)單的架構(gòu)圖開(kāi)始。
RAG的關(guān)鍵組件
從上面的架構(gòu)圖中,從用戶問(wèn)題到問(wèn)題最終答案之間,有三個(gè)關(guān)鍵組件對(duì)RAG的工作至關(guān)重要。
1.知識(shí)庫(kù)
2.檢索器
3.生成器
現(xiàn)在,讓我們一個(gè)一個(gè)地了解它們。
知識(shí)庫(kù)
這是包含所有可以引用來(lái)回答所有問(wèn)題的文檔、文章或數(shù)據(jù)的存儲(chǔ)庫(kù)。這需要不斷更新新的和相關(guān)信息,以便回應(yīng)是準(zhǔn)確的,并向用戶提供最相關(guān)和最新的信息。
從技術(shù)角度來(lái)看,這通常使用向量數(shù)據(jù)庫(kù)如Pinecone、FAISS等來(lái)存儲(chǔ)文本作為數(shù)值表示(嵌入),從而允許快速和高效的搜索。
檢索器
它負(fù)責(zé)找到與用戶問(wèn)題相關(guān)的文檔或數(shù)據(jù)。當(dāng)提出一個(gè)問(wèn)題時(shí),檢索器會(huì)快速搜索知識(shí)庫(kù)以找到最相關(guān)的信息。
從技術(shù)角度來(lái)看,這通常使用密集檢索方法,如Dense Passage Retrieval或BM25。這些方法將用戶問(wèn)題轉(zhuǎn)換為知識(shí)庫(kù)中使用的那種數(shù)值表示,并與相關(guān)信息匹配。
生成器
它負(fù)責(zé)生成與用戶問(wèn)題相關(guān)且上下文相關(guān)的連貫內(nèi)容。它從檢索器那里獲取信息,并用它來(lái)構(gòu)建回答這個(gè)問(wèn)題的回應(yīng)。
從技術(shù)角度來(lái)看,這由大型語(yǔ)言模型(LLM)如GPT-4或開(kāi)源替代品如LLAMA或BERT提供動(dòng)力。這些模型是在大量數(shù)據(jù)集上訓(xùn)練的,可以根據(jù)它們接收的輸入生成類似人類的文本。
RAG的好處和應(yīng)用
現(xiàn)在我們知道了RAG是什么以及它如何工作,讓我們探索它提供的一些好處以及RAG的應(yīng)用。
RAG的好處
最新的知識(shí)
與傳統(tǒng)的AI模型(如ChatGPT)不同,它們僅限于訓(xùn)練數(shù)據(jù),RAG系統(tǒng)可以訪問(wèn)并利用知識(shí)庫(kù)中最新的信息。
增強(qiáng)準(zhǔn)確性和減少幻覺(jué)
RAG通過(guò)使用知識(shí)庫(kù)中的事實(shí)、最新信息來(lái)提高回應(yīng)的準(zhǔn)確性。這在很大程度上減少了“AI幻覺(jué)”的問(wèn)題——即AI生成更合理但錯(cuò)誤的信息的實(shí)例。
定制化和專業(yè)化
公司可以根據(jù)自己的特定需求構(gòu)建RAG系統(tǒng),使用專門的知識(shí)庫(kù)并創(chuàng)建特定領(lǐng)域的AI助手。
透明度和可解釋性
RAG系統(tǒng)通常可以提供其信息的來(lái)源,使用戶更容易理解來(lái)源、驗(yàn)證聲明,并理解回應(yīng)背后的推理。
可擴(kuò)展性和效率
RAG允許高效使用計(jì)算資源。與其不斷重新訓(xùn)練大型模型或構(gòu)建新模型,組織可以更新他們的知識(shí)庫(kù),使AI系統(tǒng)的擴(kuò)展和維護(hù)變得更容易。
RAG的應(yīng)用
客戶服務(wù)
RAG使客戶支持聊天機(jī)器人更智能、更有幫助。這些聊天機(jī)器人可以訪問(wèn)知識(shí)庫(kù)中的最新信息,并提供精確和上下文的答案。
個(gè)性化助手
公司可以創(chuàng)建定制的AI助手,可以利用他們獨(dú)特和專有的數(shù)據(jù)。通過(guò)利用組織內(nèi)部關(guān)于政策、程序和其他數(shù)據(jù)的文件,這些助手可以快速有效地回答員工的查詢。
客戶之聲
組織可以使用RAG分析并從廣泛的客戶反饋渠道中提取可操作的洞察,以全面了解客戶體驗(yàn)、情感和需求。這使他們能夠快速識(shí)別和解決關(guān)鍵問(wèn)題,做出數(shù)據(jù)驅(qū)動(dòng)的決策,并根據(jù)客戶反饋的完整畫(huà)面不斷改進(jìn)他們的產(chǎn)品。
RAG的未來(lái)
RAG已經(jīng)成為人工智能領(lǐng)域改變游戲規(guī)則的技術(shù),結(jié)合了大型語(yǔ)言模型的威力與動(dòng)態(tài)信息檢索。許多組織已經(jīng)在利用這一點(diǎn),并為他們的需求構(gòu)建定制解決方案。
展望未來(lái),RAG將改變我們與信息互動(dòng)和做決策的方式。未來(lái)的RAG系統(tǒng)將:
·具有更大的上下文理解和增強(qiáng)的個(gè)性化;
·超越文本,并整合圖像、音視頻,成為多模態(tài)系統(tǒng)
·擁有實(shí)時(shí)知識(shí)庫(kù)更新;
·與許多工作流程無(wú)縫集成,提高生產(chǎn)力和增強(qiáng)協(xié)作。
結(jié)論
總之,RAG將徹底改變我們與AI和信息的互動(dòng)方式。通過(guò)縮小AI生成內(nèi)容與其事實(shí)準(zhǔn)確性之間的差距,RAG將為智能AI系統(tǒng)奠定舞臺(tái),這些系統(tǒng)不僅更有能力,而且更準(zhǔn)確、更值得信賴。隨著這種技術(shù)的不斷發(fā)展,我們與信息的互動(dòng)將比以往任何時(shí)候都更高效、更準(zhǔn)確。
-
AI
+關(guān)注
關(guān)注
87文章
33553瀏覽量
274142 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
557瀏覽量
10591
原文標(biāo)題:RAG,看這一篇就夠了!
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升
《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫(kù)
【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】RAG基本概念
【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+第一章初體驗(yàn)
【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀
借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

使用TMS320C6000增強(qiáng)型DMA的應(yīng)用

使用OpenVINO和LlamaIndex構(gòu)建Agentic-RAG系統(tǒng)

增強(qiáng)型HotRod QFN封裝:實(shí)現(xiàn)低EMI性能

增強(qiáng)型MOS管的結(jié)構(gòu)解析
TaD+RAG-緩解大模型“幻覺(jué)”的組合新療法

評(píng)論