色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產大模型第一梯隊玩家,為什么pick了CPU?

愛云資訊 ? 2024-07-10 20:13 ? 次閱讀

AI一天,人間一年。

現在不論是大模型本身,亦或是AI應用的更新速度簡直令人直呼跟不上——

Sora、Suno、Udio、Luma……重磅應用一個接一個問世。

也正如來自InfoQ的調查數據顯示的那般,雖然AIGC目前還處于起步階段,但市場規模已初具雛形:

wKgaomaOetyAeV8HAAAoBgr9XkQ206.png

行業整體迅速發展固然是好事,但具體到每個的應用或者大模型的落地來說,面臨的競爭也越發激烈了

例如前不久各個大模型廠商之間展開的非常激烈的“價格戰”,主打一個比誰更便宜,甚至直接把大模型價格推向“厘時代”

加上最近OpenAI的“斷供”事件,更是讓國內廠商們在打出“輕松搬家”計劃的同時,再加碼Tokens送送送的力度。

究其原因,也是與當下應用為王,尤其是以盡量低的成本把業務快速落地的這一大趨勢緊密相關。

那么問題來了,大模型玩家們何以在又快又好又省之間做到平衡?

這就回到了那個避不開,同時又是成本里占絕對大頭的因素——算力。

現在提及大模型的訓練和推理,很多人的第一反應或許就是想到了GPU

誠然GPU在高性能上占據著一定的優勢,但它所存在“硬傷”也是比較明顯,那便是供應不足價格昂貴

何以破局?國產大模型第一梯隊玩家百度智能云千帆大模型平臺,就給出了自己的一個更具“效價比”的解法:

wKgaomaOetyAeVxqAAA8o1p1P2A252.png

具體到算力的部署上,百度智能云AI與大模型平臺總經理忻舟認為:

wKgZomaOetyAPoYgAABkHtq09dU344.png

一言蔽之,在大模型時代,CPU甚至比以往更加重要了,而且是能讓大模型和應用做到“快好省”落地的關鍵因素之一。

那么具體“上崗”效果又是如何,我們繼續往下看。

國產頭部大模型玩家,pick了CPU

國內AIGC應用爆發,這其中,百度智能云千帆大模型平臺功不可沒。

作為企業使用大模型的”一站式”服務平臺,千帆大模型平臺自去年3月發布以來已有超12萬客戶使用,累計調優模型2萬個,孵化應用4.2萬個。

這些應用覆蓋教育、金融、辦公、醫療等眾多場景,為行業數字化轉型提供了有力支撐。

教育領域,千帆大模型平臺賦能了試題生成、在線批改、題目解析等應用,大大提升了教學和備考效率。

例如用戶可以提供參考材料,設定題型和難度,平臺就能自動生成高質量的試題。而交互式的題目解析,則可以針對每位學生的薄弱環節,提供個性化的學習指導。

辦公場景,千帆大模型平臺與業內頭部企業合作,共同打造了智能寫作助手等創新應用,能夠根據用戶輸入的關鍵詞,快速生成招聘文案、營銷方案、數據報告等專業文檔。

還可以專注于各類寫作場景,可以智能生成論文大綱、項目匯報、品牌宣傳稿等,大大提升了行政和營銷人員的工作效率。

醫療健康是千帆大模型平臺的另一大應用賽道。基于醫療知識庫訓練的模型,可以自動生成體檢報告解讀,用通俗易懂的語言向用戶解釋各項指標,并給出個性化的健康指導。

這讓普通大眾也能更好地了解自己的身體狀況,實現”健康自主管理”。

可以看到,千帆大模型平臺在多個領域實現了AI模型的”最后一公里”落地。

那么千帆大模型平臺是怎么支撐如此多AI應用的呢?

答案是:讓CPU成為客戶的選擇之一,讓“效價比”的紅利普惠千行百業

wKgZomaOetyAKr_mAAL_mTnK4f0136.png

之所以如此,百度智能云所給出的解釋是:

wKgZomaOetyAYFp9AACKmCKKcxQ895.pngwKgaomaOet2AHDKAAARNlio5lno465.png

至于效果,以Llama-2-7B為例,在第四代英特爾? 至強? 可擴展處理器上輸出 Token 吞吐可達 100 TPS 以上,相比第三代提升了60%。

wKgZomaOet2ANHptAACDwqnjnlU607.png

Llama-2-7b模型輸出Token吞吐

在低延遲的場景,同等并發下,第四代至強? 可擴展處理器的首Token時延比第三代至強? 可降低50%以上。

在將處理器升級為第五代至強? 可擴展處理器之后,較上代的吞吐可提升45%左右,首 Token 時延下降50%左右。

wKgaomaOet2AStaMAACIYlSalt0058.png

Llama-2-7b模型首Token時延

并且千帆大模型平臺團隊根據實踐經驗還表示:

wKgaomaOet2ACnd_AAAmm9ePFBs706.png

不僅如此,利用充足的CPU資源,降低對于AI加速卡的需求,從而降低 LLM 推理服務的總體擁有成本 (TCO),特別是在離線的 LLM 推理場景中表現出色。

而且在千帆大模型平臺上,可不止是有自家的ERNIE,還有很多主流的大模型都集成于此。

這也在一定程度上從側面印證了第五代英特爾? 至強? 可擴展處理器在性能上的過關。

wKgZomaOet2AUsiIAACusZarcTE137.png

英特爾第五代至強,如何讓性能和效率變得Pro Max?

百度智能云千帆大模型平臺,不止需要大模型推理一種工作負載,它其實是一個覆蓋大模型全生命周期的平臺。

具體來說,千帆大模型平臺提供數據標注,模型訓練與評估,推理服務與應用集成的全面功能服務,以及快速應用編排與插件集成,助力大模型多場景落地應用。這樣一來,比起專為大模型推理部署專用加速器,充分利用平臺已廣泛部署的CPU資源,就是更劃算的選擇了。

對于千帆大模型平臺上存在的大量離線大模型應用需求來說,如生成文章總結、摘要、評估多個模型的效果等,這類需求對推理的時延要求其實不高,但內存容易成為瓶頸。

采用CPU來做,擴展內存更方便,還可以利用起平臺閑時的算力資源,進一步提高資源利用率,起到降低總擁有成本的作用。

在這個大背景下,第五代英特爾? 至強? 可擴展處理器中的性能密集型通用計算應用負載(類似P Core性能核)的設計就尤為關鍵了。

與E Core(能效核)相比,P Core采用了追求性能最大化的設計,能承載非常重的負載,同時還兼顧了AI推理加速。

采用此設計的第五代至強? 可擴展處理器,在兼顧AI推理加速這一點上可不是說說而已,而是軟硬件協同優化,各方面都考慮到位了。

硬件方面,英特爾? AMX(高級矩陣擴展)技術,正是為大模型推理重深度學習中大量的矩陣乘法運算專門優化的,可以理解成”CPU 里的 Tensor Core”。

有了英特爾? AMX,處理器每個時鐘周期可完成高達2048個INT8運算,比上一代AVX512_VNNI指令提升8倍之多。

更重要的是,英特爾? AMX加速器是內置在CPU核心里的,讓矩陣存儲和運算更近,這一特性應用在大模型推理上,能夠降低處理下一個Token的時延,讓終端用戶的體驗更好。

wKgaomaOet2AetpmAAJlylTyJ58844.png

英特爾? AMX 可以更高效的實現 AI 加速

軟件方面,百度智能云千帆大模型平臺已經引入了針對英特爾? 至強? 可擴展平臺深度優化的大模型推理軟件解決方案xFasterTransformer (xFT),并將其作為后端推理引擎。主要優化策略如下:

  • 充分利用 AMX/AVX512 等指令集,高效實現核心算子如 Flash Attention 等
  • 采用低精度量化,降低數據訪存量,發揮 INT8/BF16 運算的優勢
  • 支持超大規模模型的多機多卡并行推理
wKgZomaOet2ABPkEAAHM8sJbXQU525.png

英特爾? 至強? 可擴展處理器 LLM 推理軟件解決方案

最后還要補充的一點是,要知道選擇一種硬件平臺,不止關乎于設備本身的采購價格,還會影響到后續的維護成本,甚至人才儲備成本。

所以正如百度智能云所言,高性價比的算力基礎設施,與先進的大模型算法和平臺軟件相輔相成,讓上層的開發者們能夠更加平滑地應用,構建他們的業務,才能最大化云計算平臺的商業價值。

大模型時代,CPU大有可為

縱觀當下,大模型正從實驗室走向產業,從少數人的“玩具”變為大眾可用的“工具”。

這意味著,大模型服務不僅要有優秀的性能表現,還要做到價格親民、部署便捷。一言以蔽之,“快好省”成了大模型商業化的關鍵一環。

而要實現“快好省”,算力基礎設施的選擇至關重要

傳統觀點認為,專用加速器才是AI的“標配”。但在供應緊張、成本高企的背景下,專用加速器的優勢正在減弱。

相比之下,優化良好的高端 CPU 不僅能提供足夠應對大模型推理的算力,而且具有更廣泛的部署基礎和更成熟的軟件生態、以及更好的安全保障,開始受到越來越多業界玩家的青睞。

以英特爾? 至強? 系列為代表的x86架構CPU,擁有成熟完善的軟件生態和廣泛的應用基礎。數以百萬計的開發者可以利用現有工具和框架,快速構建和優化AI應用,而無需額外學習專門的加速器軟件棧,大大降低了開發難度和遷移成本。

同時,企業級用戶還可以利用CPU內置的多層次安全技術,實現從硬件到軟件的全棧保護,充分保障數據安全和隱私。這些優勢,是當前專用加速器難以比擬的。

由此可見,充分利用CPU進行推理,讓AI從“燒錢游戲”變為“普惠科技,正是AIGC產業應對算力門檻,推動規模化應用落地的關鍵一招。未來,隨著技術創新和生態完善,這一模式還將為更多企業創造價值,為產業發展注入新的動力。

除了直接加速推理任務外,CPU在完整的端到端AI管線中還能高效完成數據預處理、特征工程等AI全流程中的關鍵步驟。而支持機器學習和圖分析的各類數據庫,也主要是構建在CPU之上的。以至強? 可擴展處理器為例,除了英特爾? AMX之外,還有諸如英特爾? 數據保護與壓縮加速技術(英特爾? QAT)、英特爾? 存內分析加速器(英特爾? IAA)等一系列數據分析引擎內置于處理器中,通過卸載特定任務使CPU得到更好的利用,從而提升工作負載整體性能,實現數據分析加速。

由此可見,構建“快、準、穩”的 AI 應用,既要靠專用加速器強大的算力,也離不開CPU超強的通用計算能力去釋放整個系統的潛力

為了科普CPU在AI推理新時代的玩法,量子位開設了《最“in”AI》專欄,將從技術科普、行業案例、實戰優化等多個角度全面解讀。

我們希望通過這個專欄,讓更多的人了解CPU在AI推理加速,甚至是整個AI平臺或全流程加速上的實踐成果,重點就是如何更好地利用CPU來提升大模型應用的性能和效率。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10854

    瀏覽量

    211590
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268892
  • 大模型
    +關注

    關注

    2

    文章

    2423

    瀏覽量

    2645
收藏 人收藏

    評論

    相關推薦

    東風日產與Momenta合作推出高階智駕方案

    日前,東風日產官宣攜手全球領先的自動駕駛公司Momenta,聯合打造基于端到端智駕大模型的行業領先高階智駕方案。東風日產與Momenta的合作,是東風日產智能化轉型的關鍵步,標志其正式步入智能駕駛第一梯隊,比肩各大新勢力品牌。
    的頭像 發表于 11-22 16:56 ?540次閱讀

    2024安防行業前三季度報出爐:誰在爭先,誰在嘆氣?

    2024安防行業前三季度整體增速收窄,部分企業營收利潤雙增,第一梯隊增收不增利,海外業務成亮點,特別是新興市場,安防企業持續尋找新增長點
    的頭像 發表于 11-13 10:39 ?356次閱讀

    商湯日日新·商量大模型位列國內大模型第一梯隊

    剛剛,中文大模型測評基準SuperCLUE發布《中文大模型基準測評2024年10月報告》。
    的頭像 發表于 11-08 15:38 ?294次閱讀

    RISC-V擁有巨大市場潛力的原因

    旬發布第三代“香山”開源高性能RISC-V處理器核,其性能水平已進入全球第一梯隊,可廣泛應用于服務器芯片、AI芯片、GPU、DPU等高端芯片領域。 2、技術進步:RISC-V架構正在不斷優化,還與
    發表于 09-30 14:20

    云知聲山海大模型位居全球大模型第一梯隊

    SuperCLUE發布《中文大模型基準測評2024上半年報告》,報告選取國內外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內外大模型發展現狀進行觀察與思考。
    的頭像 發表于 09-12 14:41 ?594次閱讀

    GenAI IaaS增速驚人,商湯科技躋身第一梯隊

    ,與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務廠商TOP 3,以顯著的市場份額優勢位居GenAI IaaS領域的第一梯隊
    的頭像 發表于 07-30 11:00 ?762次閱讀
    GenAI IaaS增速驚人,商湯科技躋身<b class='flag-5'>第一梯隊</b>

    曝華為Mate 70將迎重大突破,性能重回第一梯隊!

    會很明顯,將重回第一梯隊,而最快9月份發布。 此外,華為Mate 70系列的備貨量相比Mate 60系列將有顯著提升,預計增長幅度在40%至50%之間。 這意味著相較于Mate 60系列的供應緊張情況,Mate 70系列的市場供應壓力將大為緩解。 在這之前,就已經有消息稱,華為的新麒麟
    的頭像 發表于 05-17 09:22 ?369次閱讀

    第三代“香山”RISC-V 開源高性能處理器核性能進入全球第一梯隊

    中科院計算技術研究所、北京開源芯片研究院共同創新,成功推出第三代“香山”開源高性能RISC-V處理器核,這也是首個基于開源模式、采用敏捷開發方法、多方協作開發的處理器核,其性能表現躋身全球前列
    的頭像 發表于 04-25 15:37 ?1484次閱讀

    發布行業首款AI大模型三攝智能鎖,全系列產品AI加持,螢石2024春季新品發布會很AI

    過去年AI等技術爆火,特別是AI大模型的出現,刺激全屋智能全面邁入剛需時代。家居行業第一梯隊的公司紛紛不甘落后,用AI賦能智能家居升級實現真正的交互智能,以應對市場與用戶提出的更高需求。順應
    的頭像 發表于 04-01 16:31 ?672次閱讀
    發布行業首款AI大<b class='flag-5'>模型</b>三攝智能鎖,全系列產品AI加持,螢石2024春季新品發布會很AI

    無意發展至10nm以下,第二梯隊晶圓代工廠的成熟工藝現狀

    梯隊的廠商們還在成熟工藝上穩扎穩打。 ? 早在兩年前,我們還會將28nm視作成熟工藝以及先進工藝的分水嶺。但隨著3nm的推出,以及即將到來的2nm,成熟工藝的定義已經發生了變化,分水嶺已然換成了T2和T3晶圓廠不愿投入的7nm/8nm工藝
    的頭像 發表于 02-21 00:17 ?3520次閱讀
    無意發展至10nm以下,第二<b class='flag-5'>梯隊</b>晶圓代工廠的成熟工藝現狀

    工信部:2023年具有影響力工業互聯網平臺超340家,人工智能企業數量超4400家

    云計算、大數據等技術創新能力位于世界第一梯隊,工業機器人、工業軟件等數字產品和服務能力不斷提升,人工智能企業數量超過4400家,鋼鐵、石化、鋰電池等領域系統集成能力達到國際先進水平,底盤體化壓鑄、電芯精密制造、光伏組件柔性裝配解決方案取得突破,初步形成全鏈條數字技術和產
    的頭像 發表于 01-29 16:17 ?1145次閱讀

    工業無人機產業發展現狀

    、全球產業格局呈三級梯隊分布。第一梯隊為歐美國家經濟發達、技術先進,美國擁有無人機數量最多、研制技術水平最高,其研發的高端軍用無人機占全球70%的市場份額,法國、德國等歐盟國家也是世界無人機的主要制造商
    發表于 01-21 11:48 ?937次閱讀
    工業無人機產業發展現狀

    英發睿能N型TOPCon電池測試效率達26.61%,行業第一梯隊

    報告。此次報告結果顯示,英發睿能N型TOPCon雙面電池測試效率達到了26.61%,再次刷新歷史記錄,躋身行業效率第一階梯。 ? 01 乘風破浪 距上次英發睿能電池效率升級僅過了短短個月時間,N型TOPCon電池效率便再次突
    的頭像 發表于 01-18 15:13 ?718次閱讀
    英發睿能N型TOPCon電池測試效率達26.61%,行業<b class='flag-5'>第一梯隊</b>

    四維圖新出席大卓智能2024卓界大會

    1月16日,以“Z時代 創領未來”為主題的“大卓智能生態日暨2024卓界大會”在安徽蕪湖舉辦,大會匯聚了智能汽車生態圈企業,包括芯片、地圖定位和軟件生態等領域在內的國內外第一梯隊行業伙伴,共同探討
    的頭像 發表于 01-17 10:32 ?701次閱讀

    芯動聯科介紹陀螺儀發展之路,闡述MEMS陀螺儀優勢

    芯動聯科MEMS傳感器芯片已達到導航級精度,是目前國產最優性能的硅基MEMS慣性傳感器,主要技術指標與國際主流廠商處于同一梯隊,在高性能硅基MEMS慣性傳感器領域填補了國內空白。
    的頭像 發表于 01-16 16:00 ?1207次閱讀
    主站蜘蛛池模板: 国产成人无码精品久久久免费69| a级毛片高清免费视频| 日本久久中文字幕| 强开乳罩摸双乳吃奶视频| 我和妽妽在厨房里的激情区二区| 亚洲免费观看视频| 99精品免费久久久久久久久蜜桃| 调教椅上的调教SM总裁被调教 | 最近最新的日本字幕MV| 超碰免费视频caoporn| 国产麻豆剧果冻传媒免费网站| 成年人视频免费在线播放| 国产一区91| 欧美 亚洲 另类 综合网| 特级毛片全部免费播放免下载| 亚洲色婷婷久久精品AV蜜桃| jizz破处| 狠狠色狠狠色狠狠五月ady| 男女高潮又爽又黄又无遮挡| 午夜福利小视频400| 99精品视频| 男生插女生下体| 在线免费视频国产| 国产精品高潮呻吟AV久久96| 男人日女人的b| xxx日本hd| 久热这里在线精品| 小黄文纯肉污到你湿| MD传媒在线观看佳片| 快播av种子大全| 99久久精品国产一区二区三区| 奶头从情趣内衣下露了出来AV| GOGOGO高清免费播放| 色一伦一情一区二区三区| 99精品在线免费| 日韩精品无码免费专区| 97在线精品视频| 久久久国产精品免费A片3D| 无人区免费一二三四乱码| 好色的妹妹| 自拍区偷拍亚洲视频|