色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

搭建一個 AI 問答機(jī)器人,需要幾步?

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2024-10-21 15:10 ? 次閱讀

搭建一個企業(yè)內(nèi)部AI 問答機(jī)器人、知識庫的場景,我們可以選擇大廠的云服務(wù),這相對于大多數(shù)用戶來說,是最省事的方案。但很多企業(yè)可能會有一些私有化的數(shù)據(jù),或者受限于企業(yè)內(nèi)部的安全性要求,只能走模型私有化部署的方式。

很多人想到模型私有化部署,會以為要數(shù)據(jù)中心的多臺服務(wù)器來做,其實(shí)不然。

辦公室里搭建 AI 工作站,已經(jīng)可以完美地支持企業(yè)內(nèi)部知識庫和一些POC場景的需求,比如進(jìn)行量化的 70B 模型的訓(xùn)練和推理工作。所以在辦公室環(huán)境下,同樣可以搭建一個 AI 問答機(jī)器人。

贊奇科技基于 NVIDIA ChatRTX 搭建的企業(yè)問答機(jī)器人

但搭建一個AI 問答機(jī)器人又是一個涉及硬件選擇安裝開發(fā)環(huán)境部署的綜合過程。

最近贊奇的工程師團(tuán)隊測試了幾款主流大模型,就采用 AI 工作站搭建一個本地問答機(jī)器人提供了一些建議參考,這里抓一些重點(diǎn)給大家:

第一步 確定需求與目標(biāo)

這一步至關(guān)重要,需要確定以下關(guān)鍵點(diǎn):

性能要求:了解所做任務(wù)的復(fù)雜度,如知識庫所需要采樣的數(shù)據(jù)庫的大小,未來的用戶并發(fā)量等,以此來預(yù)估所需的計算資源和存儲空間等,通常我們可以用現(xiàn)有機(jī)器跑任務(wù)測試的方式來評估。

預(yù)算范圍:明確愿意投入的資金等成本范圍。對預(yù)算沒有概念的小伙伴可以通過詢問,或者參考公開市場價格等方式來加速了解。

第二步 選擇合適的硬件

根據(jù)需求我們來制定硬件配置,AI 工作站比較關(guān)鍵的配置有 GPUCPU、內(nèi)存、機(jī)箱等。

GPU

GPU 是 AI 工作站中非常核心的算力,也是 AI 工作站中需要首先考慮的配件。目前適用于專業(yè) AI 工作站的顯卡主要有 NVIDIA RTX? 5880 Ada (48GB)NVIDIA RTX? 5000 Ada (32GB) 等,這兩款顯卡屬于 NVIDIA 專業(yè)級顯卡,主動散熱功耗很低而且非常穩(wěn)定,靜音也適合辦公室使用。

我們可以看看兩款顯卡的參數(shù):

wKgZoWcV_luAbe-1AAKmYmv-U6k722.png

我們需要根據(jù)算力需求來配置工作站中的顯卡,包括顯卡型號和數(shù)量。AI 工作站可至多支持 4 張高性能專業(yè)顯卡,同時一個工作站中需要配置同一型號的顯卡,并且一般采用單卡、雙卡和四卡的配置。

這就需要我們同時要了解不同型號顯卡的性能,才能來匹配任務(wù)需求。這是個極大的挑戰(zhàn)。很多人對顯卡性能并不熟悉,而且在不同的任務(wù)情況下,顯卡的表現(xiàn)也會有所不同。我們可以參考與我們類似的任務(wù)在顯卡上的測評數(shù)據(jù)來評估。有條件的話,在購買時建議最好提前測試下。

顯卡實(shí)測數(shù)據(jù)

很多企業(yè)采用 AI 工作站來做知識庫、智能問答等應(yīng)用,主要任務(wù)是本地的模型微調(diào)和推理,模型大小普遍選擇在 7B/8B,13B,32B 和 70B。

NVIDIA 解決方案合作伙伴贊奇科技,分別對 AI 工作站中搭載 NVIDIA RTX 5880 Ada、NVIDIA RTX 5000 Ada 的單卡雙卡四卡配置進(jìn)行了模型訓(xùn)練和推理的測試,測試數(shù)據(jù)供大家在選型時參考。

AI 工作站搭載 NVIDIA RTX 5000 Ada 的實(shí)測

NVIDIA RTX 5000 Ada

(圖片源于 NVIDIA)

測試環(huán)境:

CPU: Intel(R) Xeon(R) w5-3433

內(nèi)存:64G DDR5 * 8

GPU: NVIDIA RTX 5000 Ada * 4

操作系統(tǒng):ubuntu22.04

Driver Version: 550.107.02

CUDA: 12.1

推理框架:vllm

測試數(shù)據(jù)(以下數(shù)據(jù)均為多次測試數(shù)據(jù)的平均值):

wKgZoWcV_l2AA6IIAAJulUCUQF0866.pngwKgaoWcV_l2AMwsuAAHiZvbmz2s629.pngwKgZoWcV_l6ASr9zAAGmT9d4jpk924.png


AI 工作站搭載 NVIDIA RTX 5880 Ada 的實(shí)測

NVIDIA RTX 5880 Ada

(圖片源于 NVIDIA)

測試環(huán)境:

CPU: Intel(R) Xeon(R) w5-3433

內(nèi)存:64G DDR5 * 8

GPU: NVIDIA RTX 5880 Ada * 4

操作系統(tǒng):ubuntu 22.04

Driver Version: 550.107.02

CUDA: 12.1
推理框架:vllm

測試數(shù)據(jù)(以下數(shù)據(jù)均為多次測試數(shù)據(jù)的平均值):

wKgZoWcV_l-AExbqAAN3lME3fKU187.pngwKgaoWcV_l-AXDo2AAI6T-7eMQU419.pngwKgZoWcV_mCAINGKAAGzPFsA528770.png

噪音測試

無論是搭載 4 張 NVIDIA RTX 5880 Ada, 還是 4 張 NVIDIA RTX 5000 Ada 的品牌 AI 工作站,在壓測情況下機(jī)器出風(fēng)口測得的噪音水平控制在 50-60 分貝,基本上接近環(huán)境音的水平,辦公室噪音?那是沒有的!

以上測試數(shù)據(jù)均來源于贊奇科技 。

wKgaoWcV_mCAO9wzAAB5yiXrvSU36.jpeg

其他配置

CPU 要注意考慮和 GPU 的匹配問題。實(shí)際使用中,具有較高核心數(shù)和主頻的CPU 運(yùn)行速度更快,更高的緩存也會提升運(yùn)行效率。4卡工作站環(huán)境中內(nèi)存建議 256GB 以上,存儲也要依據(jù)使用需求來確定。

機(jī)箱要考慮電源、噪音、兼容性、擴(kuò)展性等因素,電源的話要計算所有組件的最大功率消耗并留有余量,以應(yīng)對峰值和未來硬件升級的可能。噪音和散熱情況一定要提前了解,因?yàn)檫@會直接影響辦公環(huán)境(還有心情)。

當(dāng)然也可以更省事一點(diǎn)兒,參考我們本次測試所采用的工作站的配置環(huán)境!

第三步

安裝操作系統(tǒng)、配置開發(fā)環(huán)境+

AI 工作站到位安裝好后,可以根據(jù)偏好和軟件兼容性,選擇合適的操作系統(tǒng)、驅(qū)動程序、軟件等進(jìn)行安裝。同時配置開發(fā)環(huán)境所需的工具、模型、數(shù)據(jù)集等。

當(dāng)然,您也可以聯(lián)系我們,一站式配置好軟硬件相關(guān)的環(huán)境,做到開箱即用!

第四步

測試與優(yōu)化

通過運(yùn)行一些基本的小型 AI 項(xiàng)目,驗(yàn)證工作站在實(shí)際任務(wù)中的運(yùn)行速度、穩(wěn)定性、散熱情況、噪音等情況。同時還可以利用 NVIDIA System Management Interface 等工具監(jiān)控 GPU 使用情況,根據(jù)需要調(diào)整代碼或資源配置以提高顯卡效率。

實(shí)際過程中,大部分靠譜廠商出廠過程中會包含上述步驟。此時我們需要做的工作是在上述環(huán)境準(zhǔn)備完善的前提下,上傳自己的數(shù)據(jù),通過 RAG 或者微調(diào)的方式對自己的數(shù)據(jù)做一次整理。接下來,就迎接自己內(nèi)部的問答機(jī)器人吧!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28502

    瀏覽量

    207485
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5013

    瀏覽量

    103247
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31108

    瀏覽量

    269435
收藏 人收藏

    評論

    相關(guān)推薦

    發(fā)現(xiàn)機(jī)器人,《機(jī)器人的中秋祝福》中的機(jī)器人有眼部投影功能哦

    `發(fā)現(xiàn)了機(jī)器人,《機(jī)器人的中秋祝福》中的機(jī)器人有眼部投影功能哦,雙手還挺靈活的,好像是國內(nèi)的,就是外觀比較
    發(fā)表于 09-13 14:40

    如果有AI機(jī)器人,你希望它每天幫你做哪些事?

    完成更多的工作,給人們生活帶來的便利;二來是AI機(jī)器人是否會影響人類的行為動作,最終取代人類。這些被討論了千萬遍的話題,暫時還沒有定論。如果你家里有
    發(fā)表于 10-23 16:03

    AI語音智能機(jī)器人開發(fā)實(shí)戰(zhàn)

    第四期直播PPT下載:第三期直播PPT+程序下載:第二期直播PPT下載:第期直播PPT下載:主題簡介及亮點(diǎn):以AI智能語音陪護(hù)機(jī)器人為載體,徹底講解整個機(jī)器人研發(fā)的全流程,從開發(fā)環(huán)境
    發(fā)表于 01-04 11:48

    聊天機(jī)器人的自動問答技術(shù)實(shí)現(xiàn)

    【原創(chuàng)】聊天機(jī)器人與自動問答技術(shù)
    發(fā)表于 06-03 08:47

    使用旅游機(jī)器人需要注意哪些問題?

    決消費(fèi)者的咨詢問題,機(jī)器人就是很好的載體。機(jī)器人甚至可以把客戶基本的需求都解決了。  如今的人臉識別越來越成熟,機(jī)器人的人臉識別也會成為
    發(fā)表于 06-12 17:04

    AI智能語音機(jī)器人 揭秘讓企業(yè)電銷輕松拓客神器

    創(chuàng)造普惠全民以及企業(yè)的“智”“慧”將來,創(chuàng)建天下最大的AI通訊辦事平臺。作為互聯(lián)網(wǎng)項(xiàng)目領(lǐng)導(dǎo)者,智能電話機(jī)器人先行者,剛推出百應(yīng)全自動電
    發(fā)表于 07-21 22:54

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機(jī)器人開發(fā)

    本帖最后由 馬猛 于 2020-11-26 10:17 編輯 項(xiàng)目名稱:基于HiSpark AI Camera HarmonyOS 智能巡檢機(jī)器人開發(fā)試用計劃:HiSpark AI
    發(fā)表于 11-18 18:15

    【HarmonyOS HiSpark AI Camera】廳堂機(jī)器人

    項(xiàng)目名稱:廳堂機(jī)器人試用計劃:申請理由:機(jī)器人項(xiàng)目集成攝像頭實(shí)現(xiàn)人臉識別跟隨,熟悉鴻蒙系統(tǒng)。項(xiàng)目名稱:廳堂機(jī)器人項(xiàng)目計劃:一個月內(nèi)實(shí)現(xiàn)機(jī)器人
    發(fā)表于 11-19 20:49

    AI智能電銷外呼機(jī)器人-自動撥打電話

    的問題,這點(diǎn)我們是非常自豪的。現(xiàn)在很多市面上的機(jī)器人五花八門的、貼牌的大堆,根本沒有保障,甚至有問題都不知道該找誰處理。而我們的AI外呼機(jī)器人
    發(fā)表于 09-02 10:35

    如何利用樹莓派搭建完整的機(jī)器人系統(tǒng)?

    如何利用樹莓派搭建完整的機(jī)器人系統(tǒng)?
    發(fā)表于 01-18 06:37

    如何搭建實(shí)體機(jī)器人ros底盤

    目錄介紹、底盤主控板二、嵌入式開發(fā)板1. 與上位機(jī)pc的關(guān)系2. 與STM32主控板的關(guān)系介紹自下而上的分析實(shí)體機(jī)器人(差分輪速機(jī)器人搭建中的關(guān)鍵過程。
    發(fā)表于 01-20 07:36

    機(jī)器人是什么?

    機(jī)器人是什么?你可能會對這個問題本身感到困惑。.有意思。.但是在實(shí)際的機(jī)器人技術(shù)中,這是廣闊的領(lǐng)域。機(jī)器人學(xué)這個術(shù)語指的是
    發(fā)表于 03-31 10:31

    制作教育機(jī)器人

    描述K-Bot版本4機(jī)器人的設(shè)計理念是,任何人都可以使用教育機(jī)器人進(jìn)行組裝、編程和教學(xué)活動。主要是為了讓任何教育水平的老師都能在課堂上和學(xué)生起使用它。為了做到這點(diǎn),你只
    發(fā)表于 08-19 07:25

    【入群體驗(yàn)】電子行業(yè)首個群聊式AI問答機(jī)器人正式上線

    什么?智能機(jī)器人工具1、小秋Chat可以做什么2、你可以問報價3、你可以問替代料4、你可以咨詢設(shè)計問題5、幫忙寫程序?qū)懘a6、電子技術(shù)知識7、更多功能等你來發(fā)掘如何加入群聊和小秋Chat起玩群聊AI
    發(fā)表于 04-12 18:02

    如何開發(fā)款自己的智能問答機(jī)器人

    人工智能時代,開發(fā)款自己的智能問答機(jī)器人方面提升自己的AI能力,另方面作為轉(zhuǎn)型
    的頭像 發(fā)表于 01-19 10:26 ?7615次閱讀
    如何開發(fā)<b class='flag-5'>一</b>款自己的智能<b class='flag-5'>問答</b><b class='flag-5'>機(jī)器人</b>
    主站蜘蛛池模板: 国产视频精品免费| 国产精品成人无码免费视频| 午夜理论片YY4399影院| 日美欧韩一区二去三区| 男人插女人动态| 免费亚洲视频| 美女诱点第6季| 免费a毛片| 免费人成视频19674不收费| 看全色黄大色大片免费久黄久| 久久九九精品国产自在现线拍| 久久久午夜精品福利内容| 久拍国产在线观看| 葵司中文第一次大战黑人| 麻豆精品一区二正一三区 | 九色PORNY丨视频入口| 饥渴的新婚女教师| 精品亚洲麻豆1区2区3区| 久久re这里精品在线视频7| 精品熟女少妇AV久久免费A片| 交video| 精品久久久久中文字幕日本| 精品久久久无码21P发布| 久久婷婷五月综合色丁香花| 伦理片92伦理午夜| 欧美videos人牛交| 日韩欧无码一区二区三区免费不卡| 日韩插啊免费视频在线观看| 窝窝午夜色视频国产精品东北| 性VIDEOSTV另类极品| 亚洲日本欧美日韩高观看| 孕妇高潮抽搐喷水30分钟| 97影院理论午夜伦不卡偷| 成电影人免费网站| 国产精品一区二区人妻无码| 韩剧甜性涩爱| 乱淫67194| 日韩在线av免费视久久| 亚洲AV久久久噜噜噜噜| 在线不卡日本v二区| sm主人调教揉花蒂H|