色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

搭載英偉達GPU,全球領先的向量數據庫公司Zilliz發布Milvus2.4向量數據庫

焦點訊 ? 來源:焦點訊 ? 作者:焦點訊 ? 2024-04-01 14:33 ? 次閱讀

在美國硅谷圣何塞召開的 NVIDIA GTC 大會上,全球領先的向量數據庫公司 Zilliz 發布了 Milvus 2.4 版本。這是一款革命性的向量數據庫系統,在業界首屈一指,它首次采用了英偉達 GPU 的高效并行處理能力和 RAPIDS cuVS 庫中新推出的 CAGRA( CUDA-Accelerated Graph Index for Vector Retrieval )技術,提供基于GPU的向量索引和搜索加速能力,性能可提升 50 倍。

Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆。基準測試顯示,與目前市面上最先進的基于 CPU 處理器的索引技術相比,新版 GPU 加速 Milvus 能提供高達 50 倍的向量搜索性能提升。目前,Milvus 2.4的開源版本已經對外發布。

對于希望使用全托管云數據庫服務的企業用戶來說,還有一個好消息,那就是 Zilliz 提供的 Milvus 商業版全托管云服務 Zilliz Cloud 計劃將在今年晚些時候升級推出 GPU 加速功能。

wKgaomYGuDyAIuO1AAF6TrvbEGY398.png

▲Zilliz Cloud

截至當前,Zilliz Cloud 已經實現包括阿里云、騰訊云、AWS、谷歌云和微軟云在內的全球 5 大云 13 個節點的全覆蓋,除了分布在杭州、北京、深圳的 5 個國內服務區,其他 8 個節點分布在海外,包括美國的弗吉尼亞州、俄勒岡州、德國的法蘭克福、新加坡等城市和地區。Zilliz 已成為首家同時提供海內外多云服務的向量數據庫企業。

Milvus是什么?

Milvus 是一款為大規模向量相似度搜索和 AI 應用開發設計的開源向量數據庫系統。它最初由 Zilliz 公司發起開發,并在 2019 年開源。2020年,該項目加入 Linux 基金會并成功畢業。

自推出以來,Milvus 在 AI 開發者社區中大受歡迎并被廣泛采用。在GitHub上,Milvus 擁有超過26,000個星標和 260 多位貢獻者,全球下載和安裝量超過 2000 萬次,已經成為全球使用最廣泛的向量數據庫之一。Milvus 已經被 5,000 多家企業所采用,服務于AIGC、電子商務、媒體、金融、電信和醫療等多個行業。

wKgZomYGuD2Ac2qPAACyssI4syQ440.png

▲部分 Milvus 企業用戶列表 來源:Milvus官網

為什么需要GPU加速?

在數據驅動的時代背景下,快速準確地檢索大量非結構化數據對于支持前沿AI應用至關重要。無論是生成式AI、相似性搜索,還是推薦引擎、虛擬藥物發現,向量數據庫都已成為這些高級應用的核心技術。然而,對于實時索引和高吞吐量的需求不斷挑戰著基于CPU的傳統解決方案。

實時索引

向量數據庫通常需要持續且高速地攝取和索引新的向量數據。實時索引的能力對于保持數據庫與最新數據的同步至關重要,避免產生瓶頸或積壓。

高吞吐量

許多使用向量數據庫的應用程序,例如推薦系統、語義搜索引擎和異常檢測等,都需要實時或近實時的查詢處理。高吞吐量確保向量數據庫能夠同時處理大量涌入的查詢,為最終用戶提供高性能的服務。

向量數據庫的核心運算包括相似度計算和矩陣運算,這些運算具有并行性高和計算密集等特點。GPU 憑借其成千上萬的運算核心和強大的并行處理能力,成為了加速這些運算的理想選擇。

Milvus 2.4技術架構

為了應對這些挑戰,英偉達開發了CAGRA。這是一個利用GPU的高性能能力為向量數據庫工作負載提供高吞吐量的GPU加速框架。接下來,我們來看看 CAGRA 是如何與 Milvus 系統整合的。

Milvus 專為云原生環境設計,采用模塊化設計理念,將系統分為多個組件,分別處理客戶端請求、數據處理以及向量數據的存儲和檢索。得益于這種模塊化設計,Milvus 可以輕松地更新或升級特定模塊,而無需改變模塊間的接口,使得在 Milvus 中集成 GPU 加速變得簡單可行。

wKgaomYGuD6AN-CYAAFtGlvoB40580.png

▲Milvus 2.4 架構圖

Milvus 2.4 的架構包括協調器、訪問層、消息隊列、工作節點和存儲層等組件。工作節點進一步細分為數據節點、查詢節點和索引節點。其中,索引節點負責構建索引,查詢節點負責執行查詢。

為了充分利用GPU的加速能力,CAGRA 被集成到了 Milvus 的索引節點和查詢節點中。這種集成使得計算密集型任務,如索引構建和查詢處理,能夠被轉移到 GPU 上執行,從而利用其并行處理能力。

在 Milvus 的索引節點中,CAGRA 被集成到了索引構建算法中,利用 GPU 硬件來高效地構建和管理高維向量索引,顯著減少了索引大規模向量數據集所需的時間和資源。

同樣,在 Milvus 的查詢節點中,CAGRA 被用于加速執行復雜的向量相似度查詢。借助GPU的處理能力,Milvus 能夠以前所未有的速度執行高維距離計算和相似性搜索,從而加快查詢響應時間并提升整體吞吐量。

性能評測結果

在性能評估過程中,我們使用了 AWS 上的三種公開實例類型:

m6id.2xlarge:搭載Intel Xeon 8375C 處理器的 CPU 實例

g4dn.2xlarge:配備NVIDIA T4 處理的GPU加速實例

g5.2xlarge:配備NVIDIA A10G 處理器的GPU加速實例

我們通過這些不同的實例類型來評估 Milvus 2.4 在不同硬件配置下的性能和效率,其中m6id.2xlarge 作為基于 CPU 處理器的性能基準,而 g4dn.2xlarge 和 g5.2xlarge 則用來評估GPU 加速的優勢。

wKgZomYGuD-AXnt9AADpc0UQJjs605.png

▲基于 AWS 的評測環境

在評測中,我們選用了 VectorDBBench([4]) 的兩個公開向量數據集,評估 Milvus 在不同數據量和向量維度下的性能和可擴展性:

OpenAI-500K-1536-dim:包含50萬個1,536維的向量,由 OpenAI 語言模型生成

Cohere-1M-768-dim:包含100萬個768維的向量,由Cohere語言模型生成

索引構建時間

在索引構建時間的評測中,我們發現對于 Cohere-1M-768-dim 數據集,使用 CPU( HNSW )的索引構建時間為 454 秒,而使用 T4 GPU( CAGRA )僅為66秒,A10G GPU( CAGRA )更是縮短到了 42 秒。對于 OpenAI-500K-1536-dim 數據集,CPU( HNSW )的索引構建時間為359秒,T4 GPU( CAGRA )為45秒,A10G GPU(CAGRA)則為22 秒。

wKgaomYGuD-ABT8iAADSdIM5WdI081.png

▲評測索引構建時間

這些結果清楚地表明,GPU 加速框架 CAGRA 在索引構建方面明顯優于基于 CPU 的 HNSW,其中 A10G GPU 在兩個數據集上都是最快的。與 CPU 實現相比,CAGRA 提供的 GPU 加速將索引構建時間縮短了一個數量級,展示了利用 GPU 并行性進行計算密集型向量運算的優勢。

吞吐量

在吞吐量方面,我們比較了集成 CAGRA GPU 加速的 Milvus 與使用 CPU 上 HNSW 索引的標準 Milvus 實現。評估指標是每秒查詢數( QPS ),用于衡量查詢執行的吞吐量。在向量數據庫的不同應用場景中,查詢的批量大小( 單條查詢處理的查詢數量 )往往不同。在測試過程中,我們采用了1、10 和 100 這三種不同的批量大小,獲取真實而全面的評測結果數據。

wKgZomYGuECACkk7AADWOv0-quY312.png

▲評測吞吐量

從評估結果來看,對于批量大小為 1 的情況,T4 GPU 比 CPU 快 6.4 到 6.7 倍,A10G GPU 則快 8.3 到 9 倍。當批量大小增加到 10 時,性能提升更加顯著:T4 GPU 快 16.8 到18.7倍,A10G GPU 快25.8 到 29.9 倍。當批量大小為 100 時,性能提升持續增長:T4 GPU 快 21.9 到 23.3 倍,A10G GPU 快 48.9 到 49.2 倍。

這些結果表明,利用 GPU 加速向量數據庫查詢可以獲得巨大的性能提升,尤其是對于更大的批量大小和更高維度的數據。集成 CAGRA 的 Milvus 釋放了 GPU 的并行處理能力,實現了顯著的吞吐量改進,非常適合要求極致性能的關鍵場景下的向量數據庫工作負載。

開啟新紀元

將英偉達 CAGRA GPU 加速框架集成到 Milvus 2.4 中,標志著向量數據庫領域的一項重大突破。通過利用 GPU 的大規模并行計算能力,Milvus 在向量索引和搜索操作方面實現了前所未有的性能水平,開啟了實時、高吞吐量向量數據處理的新時代。

5年前, Zilliz 的工程師們在上海漕河涇的廠房里敲下了向量數據庫歷史上的全球第一行代碼,開啟了研發面向非結構化數據管理的新一代數據庫的探險。

今天,Zilliz 和英偉達合作推出 Milvus 2.4,展現了開放創新和社區驅動發展的力量,為向量數據庫帶來了 GPU 加速的新紀元。這一里程碑事件預示著又一個技術變革的來臨,向量數據庫有望經歷類似于英偉達在過去 8 年中將 GPU 算力提高 1000 倍的指數級性能飛躍。

在未來十年,我們將見證向量數據庫性能的 1000 倍飛躍。這將引發一場數據處理方式的范式轉變,重新定義我們處理和利用非結構化數據的能力。

Zilliz最新動態

除了發布業界超前的 Milvus 2.4,Zilliz 近期還有不少新動作:

Zilliz 正式開啟 AI 初創計劃!Zilliz AI 初創計劃是面向 AI 初創企業推出的一項扶持計劃,預計提供總計 1000 萬元的 Zilliz Cloud 抵扣金,致力于幫助 AI 開發者構建高效的非結構化數據管理系統,助力打造高質量 AI 服務與運用,加速產業落地。Zilliz 將為全球的 AI 初創團隊提供資源、技術、市場推廣、銷售等全方位的支持,符合要求的團隊可獲得獨家資源與支持。歡迎各位開發者登陸 Zilliz 中文官網首頁了解 Zilliz AI 初創計劃,與 Zilliz 一起共建 AI 生態!

Zilliz Cloud 正式登錄騰訊云,覆蓋北京、上海兩區,進一步為海內外用戶提供更豐富的多云支持的向量數據庫服務。截至目前,Zilliz Cloud 已實現全球 5 大云 13 個節點的全覆蓋,除了在中國的杭州、北京、深圳五大服務區,其他 8 個節點分布在海外,包括美國的弗吉尼亞州、俄勒岡州、德國的法蘭克福、新加坡等城市和地區。至此,Zilliz 已成為全球首個提供海內外多云服務的向量數據庫企業。

Zilliz 發布 「Milvus 北極星計劃」,旨在匯集和團結 Milvus 社區的熱心用戶及開發者,組成社區大使團隊。根據不同角色擅長的能力(Coding、寫作、溝通、布道、活動組織等),在社區中分配職責,共同建設運營 Milvus 社區,為社區發展壯大探索方向、添磚加瓦。最終將 Milvus 社區打造為一個充滿活力、創新開放、團結互助的全球化社區。關注 Zilliz 微信公眾號,回復“北極星”可了解詳情。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4753

    瀏覽量

    129067
  • 向量
    +關注

    關注

    0

    文章

    55

    瀏覽量

    11679
  • 英偉達
    +關注

    關注

    22

    文章

    3798

    瀏覽量

    91336
收藏 人收藏

    評論

    相關推薦

    關系型數據庫和非關系型區別

    關系型數據庫和非關系型數據庫在多個方面存在顯著差異,主機推薦小編為您整理發布關系型數據庫和非關系型區別,以下是它們的主要區別。
    的頭像 發表于 01-10 09:58 ?52次閱讀

    數據庫是哪種數據庫類型?

    數據庫是一種部署在虛擬計算環境中的數據庫,它融合了云計算的彈性和可擴展性,為用戶提供高效、靈活的數據庫服務。云數據庫主要分為兩大類:關系型數據庫
    的頭像 發表于 01-07 10:22 ?82次閱讀

    數據庫數據恢復—Mysql數據庫表記錄丟失的數據恢復流程

    Mysql數據庫故障: Mysql數據庫表記錄丟失。 Mysql數據庫故障表現: 1、Mysql數據庫表中無任何數據或只有部分
    的頭像 發表于 12-16 11:05 ?179次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—Mysql<b class='flag-5'>數據庫</b>表記錄丟失的<b class='flag-5'>數據</b>恢復流程

    數據庫數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例

    mysql數據庫故障: mysql數據庫文件ibdata1、MYI、MYD損壞。 故障表現:1、數據庫無法進行查詢等操作;2、使用mysqlcheck和myisamchk無法修復數據庫
    的頭像 發表于 12-09 11:05 ?180次閱讀

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    一個運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一個NDF文件,每個NDF幾百GB大小。數據庫包含兩個LDF文件。 存儲損壞,數據庫
    的頭像 發表于 10-31 13:21 ?267次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    科技云報到:大模型時代下,向量數據庫的野望

    科技云報到:大模型時代下,向量數據庫的野望
    的頭像 發表于 10-14 17:18 ?268次閱讀

    Oracle數據恢復—異常斷電后Oracle數據庫報錯的數據恢復案例

    Oracle數據庫故障: 機房異常斷電后,Oracle數據庫報錯:“system01.dbf需要更多的恢復來保持一致性,數據庫無法打開”。數據
    的頭像 發表于 09-30 13:31 ?322次閱讀
    Oracle<b class='flag-5'>數據</b>恢復—異常斷電后Oracle<b class='flag-5'>數據庫</b>啟<b class='flag-5'>庫</b>報錯的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

    SQL Server數據庫故障: SQL Server附加數據庫出現錯誤823,附加數據庫失敗。數據庫沒有備份,無法通過備份恢復數據庫
    的頭像 發表于 09-20 11:46 ?373次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>出現823錯誤的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫所在分區空間不足報錯的數據恢復案例

    SQL Server數據庫數據恢復環境: 某品牌服務器存儲中有兩組raid5磁盤陣列。操作系統層面跑著SQL Server數據庫,SQL Server數據庫存放在D盤分區中。
    的頭像 發表于 07-10 13:54 ?523次閱讀

    大模型卷價格,向量數據庫“卷”什么?

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 05-23 09:24 ?1802次閱讀
    大模型卷價格,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”什么?

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server數據庫,存儲空間在操作系統層面劃分了三個邏輯分區
    的頭像 發表于 05-08 11:43 ?528次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    Zilliz攜手大模型生態企業玩轉GDC 2024,向量數據庫和RAG成行業焦點

    3 月 23 日-24 日,聚焦全球開發者精英,由上海市人工智能行業協會(SAIA)主辦的 2024 全球開發者先鋒大會(2024 GDC)在上海舉辦。Zilliz 作為向量
    的頭像 發表于 03-26 11:14 ?374次閱讀
    <b class='flag-5'>Zilliz</b>攜手大模型生態企業玩轉GDC 2024,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>和RAG成行業焦點

    與NVIDIA深度參與GTC,向量數據庫大廠Zilliz全球頂尖開發者共迎AI變革時刻

    近日,備受關注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發者齊聚美國加州圣何塞會議中心,共同探索行業未來,全球領先向量數據庫
    的頭像 發表于 03-26 11:01 ?425次閱讀

    數據庫數據恢復】Oracle數據庫ASM實例無法掛載的數據恢復案例

    oracle數據庫ASM磁盤組掉線,ASM實例不能掛載。數據庫管理員嘗試修復數據庫,但是沒有成功。
    的頭像 發表于 02-01 17:39 ?537次閱讀
    【<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復】Oracle<b class='flag-5'>數據庫</b>ASM實例無法掛載的<b class='flag-5'>數據</b>恢復案例

    騰訊云把向量數據庫“卷”到哪一步了?

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 01-15 09:49 ?1597次閱讀
    騰訊云把<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”到哪一步了?
    主站蜘蛛池模板: 啊…嗯啊好深男男高h文| 日本69xx 老师| 中文免费视频| 色欲久久精品AV无码| 精品亚洲午夜久久久久| 帝王被大臣们调教高肉| 中国老太60old mantv| 午夜伦理yy44008影院| 妺妺窝人体色777777野大粗| 国产亚洲精品视频在线网| 哺乳期妇女挤奶水36d| 2020国产成人精品视频人| 免费果冻传媒2021视频| 校园高h肉耽文| 久久久97人妻无码精品蜜桃| 国产AV一区二区三区日韩| 伊人久久丁香色婷婷啪啪| 开心片色99xxxx| 国产午夜亚洲精品一区| 久久久久久久久免费视频 | 欧美eee114| 久久久久久久尹人综合网亚洲| 国产精品人妻无码久久久蜜桃| 菠萝菠萝蜜免费播放高清| 2021精品乱码多人收藏| 伊人久久五月丁婷婷| 亚洲人人为我我为人人| 小xav导航| 天天久久影视色香综合网| 秋霞电影在线观看午夜伦| 男人插女人逼逼| 美女露出逼| 毛片TV网站无套内射TV网站| 久久这里只有精品国产99| 精品国产mmd在线观看| 国精产品一区二区三区有限公司| 国产不卡在线观看视频| 成3d漫二区三区四区| 苍井空a 集在线观看网站| 爱爱好爽好大好紧视频| 99热6精品视频6|