色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

攜程攜手英特爾優化AI推理性能,提升性能的同時降低TCO

英特爾中國 ? 來源:未知 ? 2023-06-09 20:30 ? 次閱讀

據文化和旅游部數據中心測算,2023年“五一”假期全國國內旅游出游合計2.74億人次,同比增長70.83%,按可比口徑恢復至2019年同期的119.09%1。后疫情時代,旅游人數的激增與旅游場景的多元化,給人工智能AI)技術在旅游行業的應用帶來更多機遇和挑戰。例如自然語言處理(NLP)、機器翻譯、計算機視覺、搜索排序等 AI 技術的快速發展和日臻成熟,可以為游客提供更便捷的服務和更精準的內容。

作為一站式旅行平臺,攜程旅行已經將諸多AI 技術應用于酒店、機票、自由行、跟團游、簽證、玩樂、租車等旅游度假的多個業務線,為全球用戶提供一套完整的旅行產品、服務及差異化的旅行內容等。為了在滿足業務需求的同時降低成本壓力,攜程構建了基于英特爾至強 可擴展處理器的 AI 推理算力平臺,并通過高性能算子庫、計算圖優化、模型壓縮等方式提升 AI 推理性能。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

采用英特爾 至強解決方案

實現性能與經濟性的更佳平衡

隨著 AI 應用的不斷擴展和深入,大型旅行服務平臺面臨的算力挑戰主要存在于兩個方面:

一方面,AI 技術正在日趨多樣化與復雜化,為了適應不同的業務場景需求,企業常常需要融合使用傳統機器學習、卷積神經網絡、Transformer 等深度學習模型結構,以及知識圖譜、圖神經網絡等技術。同時,AI模型的深度、寬度以及結構復雜度也在不斷提升,增加了企業的開發門檻,也使得 AI算力調度、AI 性能優化更具挑戰。

另一方面,智能化應用正在迅速擴張,需要由 AI 模型處理的數據也在不斷增長。例如內容與廣告個性化推薦、實時風控、機器翻譯、智能客服、圖像處理等領域正在越來越多地使用 AI 技術,以從海量的數據中生成高價值的商業洞察,從而帶來了較高的算力基礎設施建設成本。與此同時,上層應用對于 AI 模型推理也有著特定的服務級別協議 (SLA) 要求。企業需要在滿足 SLA 要求的前提下,通過模型優化等方式,更好地發揮硬件的性能潛力,降低算力基礎設施的總體擁有成本(TCO)。

面對上述挑戰,企業首先要面臨硬件平臺的選擇問題:雖然基于獨立 GPU 的推理方案能夠提供強大的算力,但未必是一個經濟的選擇。這是因為獨立 GPU 不僅采購或租用成本相對較高,而且通常是以專用服務器的模式進行部署和運維,帶來了較高的綜合成本。考慮到旅行服務中大量的 AI 推理場景所需要的性能經過優化能夠得到滿足,采用 CPU 的方案將更具成本效益。因此,攜程采用基于英特爾至強 可擴展處理器的 AI 推理算力平臺,旨在為算法模型提供更全面易用、穩定性更好、使用和維護成本更低的優化解決方案。 英特爾至強 可擴展處理器內置人工智能加速功能,已針對工作負載進行優化,能夠為各種AI 應用以及高密度基礎設施帶來一流的性能和內存帶寬。同時,采用矢量神經網絡指令(VNNI) 的英特爾 深度學習加速(英特爾DL Boost),能夠有效提高 AI 推理的表現,使其成為深度學習應用的卓越基礎設施。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

構建并優化AI推理算力平臺

Bert-base推理時間由15毫秒降至6毫秒

在基于英特爾 至強 可擴展處理器的硬件平臺層基礎上,攜程構建了 AI 推理算力平臺,該平臺還包括引擎框架層、推理優化層、算法模型、應用場景。同時,為了盡可能地提升 AI 推理性能,釋放硬件潛力,攜程進行了推理優化。主要的優化思路為兩點:一是通過調整/簡化模型結構,或改進算法以降低算法復雜度;二是優化軟件執行效率,使用硬件優勢特征,提升硬件執行效率。 2d17463e-06be-11ee-962d-dac502259ad0.png

攜程基于英特爾 至強 可擴展處理器的硬件平臺層基礎上

構建 AI 推理算力平臺

攜程以機器翻譯應用的 Transformer模型來測試其性能表現。在該測試中,攜程除了使用上述的優化方法,還分割模型并使用 jit 跟蹤方法來提高性能。同時,在batchsize 超過 16 個的情況下,使用 mm op 進行優化。攜程使用固定算例的平均響應時延作為測試數據,tokens 為 10,batchsize=1,Bert-base模型推理時間由優化前的15.05毫秒降至優化后的6.44毫秒2 2d238bec-06be-11ee-962d-dac502259ad0.png

Bert-base 模型優化前后的性能對比2

基于英特爾 至強 可擴展平臺的基礎算力和深度的 AI 模型推理性能優化,用戶將獲得的收益包括:在特定的 SLA 要求下,降低 AI 推理應用的 TCO

在通過本輪優化之后,攜程的 CPU 服務器 AI 推理性能得到提升,能夠滿足大量 AI 推理場景對于時延等 SLA 指標的要求,避免了在昂貴的專用 AI 加速器方面的支出。

提升基礎設施的敏捷性與靈活性

通過本輪優化,攜程能夠高效利用現有的 CPU 服務器,根據實際負載需求進行靈活調度,而無需為 AI 推理新增需求部署專用服務器。

為 AI 推理性能優化提供了標準的參考流程

本方案提供了一套標準、可自動完成的參考模型優化流程,能夠賦能更多的 AI 應用。

攜程與英特爾的合作,驗證了 AI 模型推理方案在英特爾 至強 可擴展處理器上的應用潛力,在成本、性能方面實現了平衡。同時,隨著推理性能優化技術的逐步提高,將極大地降低人工智能應用的部署成本,加快AI應用的落地速度并擴充應用場景,推動人工智能行業的整體發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10007

    瀏覽量

    172312
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10901

    瀏覽量

    212961

原文標題:攜程攜手英特爾優化AI推理性能,提升性能的同時降低TCO

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動力大會上,英特爾與火山引擎聯合發布基于英特爾 至強 6 性能核處理器的第四代服務器實例,以打造彈性算力底座的產品化實踐。同時
    的頭像 發表于 12-23 14:05 ?383次閱讀

    英特爾與火山引擎飛連攜手升級AI時代企業IT管理體驗

    AI 技術的推動下,企業 IT 管理正經歷一場革命。日前,火山引擎飛連新品發布會成功舉辦。英特爾受邀參與此次活動,并在會上展示了新一代英特爾凌動 x7000 系列處理器等產品,與火山引擎飛連
    的頭像 發表于 11-14 17:17 ?581次閱讀

    Inflection AI攜手英特爾推出企業級AI系統

    近日,AI初創企業Inflection AI英特爾聯合宣布了一項重大合作——推出基于英特爾Gaudi 3 AI加速器和Tiber
    的頭像 發表于 10-09 16:40 ?485次閱讀

    英特爾發布至強6性能核處理器,攜手生態加速數據中心算力升級

    9月26日,英特爾正式發布英特爾? 至強? 6性能核處理器(代號Granite Rapids),為AI、數據分析、科學計算等計算密集型業務提供卓越
    的頭像 發表于 09-27 10:54 ?4419次閱讀
    <b class='flag-5'>英特爾</b>發布至強6<b class='flag-5'>性能</b>核處理器,<b class='flag-5'>攜手</b>生態加速數據中心算力升級

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    。 中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》(征求意見稿)相關要求,使用AISBench?2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI大模型
    的頭像 發表于 09-06 15:33 ?420次閱讀
    開箱即用,AISBench測試展示<b class='flag-5'>英特爾</b>至強處理器的卓越<b class='flag-5'>推理性能</b>

    英特爾新一代AI PC酷睿Ultra處理器強勢來襲

    近日,在臺北國際電腦展上,英特爾展示了大力加速AI生態的前沿技術和架構,遍及數據中心、云與網絡邊緣和PC。得益于更高計算處理性能、出色的能效表現、和更低的總體擁有成本(TCO),用戶能
    的頭像 發表于 06-15 11:39 ?917次閱讀

    英特爾發布AI創作應用AI Playground,將于今夏正式上線!

    AI PC入門應用程序AI Playground,讓廣大用戶在本地即可快速實現AI個性化創作。 英特爾Xe2 GPU架構,帶來50%的性能
    的頭像 發表于 06-14 09:44 ?532次閱讀
    <b class='flag-5'>英特爾</b>發布<b class='flag-5'>AI</b>創作應用<b class='flag-5'>AI</b> Playground,將于今夏正式上線!

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?587次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構建數智化供應鏈

    寧暢B5000 G5多節點服務器采用第五代英特爾至強可擴展處理器

    “基于第五代英特爾 至強 可擴展處理器的寧暢B5000 G5多節點服務器,可以在滿足大量AI推理場景在吞吐量、時延、容量、并發能力等方面的需求,而且與專用的GPU服務器相比,在靈活性方面更具優勢。我們希望能夠與
    的頭像 發表于 05-27 11:46 ?896次閱讀
    寧暢B5000 G5多節點服務器采用第五代<b class='flag-5'>英特爾</b>至強可擴展處理器

    英特爾重磅發布全新AI戰略,攜手生態共同釋放企業AAI潛力

    在近期舉行的Intel Vision 2024大會上,英特爾重磅發布其開放的、可擴展的全新AI戰略,同時公布了英特爾?至強?6處理器的品牌煥新,滿足客戶對于處理器能效和
    的頭像 發表于 04-28 11:11 ?617次閱讀
    <b class='flag-5'>英特爾</b>重磅發布全新<b class='flag-5'>AI</b>戰略,<b class='flag-5'>攜手</b>生態共同釋放企業AAI潛力

    英特爾特供芯片性能暴降92%!

    英特爾針對中國市場推出的特供版Gaudi 3芯片在性能上確實存在大幅下降的情況,這主要是由于美國對于AI芯片的出口管制規則限制所導致的。
    的頭像 發表于 04-17 16:57 ?867次閱讀

    自然語言處理應用LLM推理優化綜述

    當前,業界在將傳統優化技術引入 LLM 推理同時同時也在探索從大模型自回歸解碼特點出發,通過調整推理過程和引入新的模型結構來進一步
    發表于 04-10 11:48 ?679次閱讀
    自然語言處理應用LLM<b class='flag-5'>推理</b><b class='flag-5'>優化</b>綜述

    借助英特爾? QAT從而顯著提升網絡和存儲應用的性能

    全新第四代和第五代英特爾? 至強? 可擴展處理器內置英特爾? 數據保護與壓縮加速技術(英特爾? QAT),可通過卸載計算密集型工作負載來降低 CPU 占用率,從而顯著
    的頭像 發表于 03-18 16:25 ?1156次閱讀
    借助<b class='flag-5'>英特爾</b>? QAT從而顯著<b class='flag-5'>提升</b>網絡和存儲應用的<b class='flag-5'>性能</b>

    借助英特爾DLB技術優化網絡性能

    英特爾? DLB技術的出現,無疑為數據處理和網絡傳輸領域帶來了一場革命性的變革。通過其獨特的負載均衡、數據包調度優先排序以及降低網絡流量時延的能力,英特爾? DLB顯著提升了高數據包速
    的頭像 發表于 03-11 09:52 ?719次閱讀

    英特爾至強處理器優化升級,助力打造未來高能效數據中心

    %。與此同時英特爾還對該處理器進行了大量優化,以滿足日益增長的AI算力需求。 該適用于企業級服務器的英特爾高端CPU受到了眾多行業專家們的
    的頭像 發表于 02-26 17:39 ?807次閱讀
    主站蜘蛛池模板: 高h肉辣文黄蓉 | 男男gaygay拳头| 亚洲AV无码乱码国产精品品麻豆 | 嗯好舒服嗯好大好猛好爽 | 成人免费视频在线 | 伦 乱真实故事 | 伊人久久综在合线影院 | 成人午夜精品无码区久久漫画日本 | 女厕所边摸边吃奶边做爽视频 | 甜性涩爱下载 | 直插下身完整的欧美版 | 青青热久久综合网伊人 | 亚洲中文字幕乱码熟女在线 | 性xxxx直播放免费 | 久久国产高清视频 | 免费女人光着全身网站 | 午夜伦理在线观看 | 麻豆精品一区二正一三区 | 亚洲视频第二页 | 全黄h全肉细节文在线观看 全黄H全肉细节文短篇 | 亚洲人成无码久久久AAA片 | 国产精品久久久久永久免费看 | 特级做A爰片毛片免费看108 | 免费小视频在线观看 | 久久www免费人成_看片高清 | 亚洲色图在线播放 | 色橹橹欧美在线观看视频高 | 国产AV精品白浆一区二 | 在线亚洲色拍偷拍在线视频 | 国产亚洲精品视频亚洲香蕉视 | 一个人的HD高清在线观看 | 精品AV亚洲乱码一区二区 | 国色天香社区视频免费高清3 | 黄色a一级视频 | 亚洲欧美一区二区三区九九九 | 天天影视网网色色欲 | 四虎影视国产精品亚洲精品 | 儿子你得太大了慢点插 | 国内精品乱码卡一卡2卡三卡新区 | 97人妻碰视频在线观看 | 国产GV天堂亚洲国产GV刚刚碰 |