色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorFlow 2:專為性能和易用性而設計

Tensorflowers ? 來源:TensorFlow ? 2020-09-08 16:02 ? 次閱讀

衡量機器學習性能的業界標準 MLPerf(https://mlperf.org) 發布了 MLPerf Training v0.7 輪的最新基準測試結果。我們開心地與大家分享,Google 的提交結果展現出一流的性能(達到目標質量用時最短),能夠擴展至 4,000 多個加速器,并且在 Google Cloud 上為 TensorFlow 2 開發者提供了靈活的開發體驗。

在本文中,我們將探討 TensorFlow 2 MLPerf 提交結果,以及這些結果展示了企業如何在 Google Cloud 中尖端的 ML 加速器上運行 MLPerf 所代表的有價值的工作任務,如廣泛部署的幾代 GPU 和 Cloud TPU(

TensorFlow 2:專為性能和易用性而設計

在今年早些時候舉行的 TensorFlow 開發者峰會上,我們著重介紹了 TensorFlow 2 將注重易用性和實際性能。為爭取贏得基準測試,工程師們往往依賴于低階 API 調用和硬件專用的代碼,而這些在日常企業環境中可能很少見或不實用。借助 TensorFlow 2,我們的目標是通過更直接的代碼提供開箱即用的高性能,避免低級優化在代碼重用性、代碼運行狀況和工程效率方面帶來的重大問題。

MLPerf Training v0.7 中 Google 使用帶 8 個 NVIDIA V100 GPU 的 Google Cloud VM 的收斂時間(分鐘)。提交結果在“可用”類別中

TensorFlow 的 Keras API(請參閱相關的一系列指南)支持多種硬件架構,提供了易用性和可移植性。例如,模型開發者可以使用 Keras 混合精度 API 和 Distribution Strategy API 來使同一代碼庫盡可能在多個硬件平臺上流暢運行。Google 的“云端可用”類別中的 MLPerf 提交結果是由這些 API 實現的。這些提交結果證明了使用高階 Keras API 編寫的幾乎相同的 TensorFlow 代碼可以在業界兩個領先的廣泛可用的 ML 加速器平臺上提供高性能使用體驗:NVIDIA 的 V100 GPU 和 Google 的 Cloud TPU v3 Pod。

指南
https://tensorflow.google.cn/guide/keras/sequential_model

Keras混合精度 API
https://tensorflow.google.cn/guide/keras/mixed_precision

Distribution Strategy API
https://tensorflow.google.cn/guide/distributed_training

注:圖表中顯示的所有結果均于 2020 年 7 月 29 日從 www.mlperf.org 中獲取。MLPerf 名稱和徽標為商標。有關詳細信息,請訪問 www.mlperf.org。顯示的結果:0.7-1 和 0.7-2。

MLPerf Training v0.7 中使用含 16 個 TPU 芯片的 Google Cloud TPU v3 Pod 切片的收斂時間(分鐘)。提交結果在“可用”類別中

深入了解:借助 XLA 提升性能

Google 提交的在 GPU 和 Cloud TPU Pod 上的測試結果使用了 XLA 編譯器來優化 TensorFlow 性能。XLA 是 TPU 編譯器技術棧的核心部分,可以選擇性地為 GPU 啟用。XLA 是一個基于圖模型的即時編譯器,用于執行各種不同類型的全程序優化,包括 ML 運算的廣泛 融合 。

XLA 編譯器
https://tensorflow.google.cn/xla

算子融合降低了 ML 模型對存儲容量和帶寬的要求。此外,融合減少了運算的啟動開銷,尤其是在 GPU 上??傮w而言,XLA 優化具有通用性和可移植性,與 cuDNN 和 cuBLAS 庫的互操作性十分出色,并且通??梢宰鳛槭謩泳帉懙图墐群说挠辛μ娲桨浮?/p>

Google 的“云端可用”類別中的 TensorFlow 2 提交結果使用了 TensorFlow 2.0 中引入的 @tf.function API。@tf.function API 提供了一種簡單的方法來有選擇地啟用 XLA,從而可以精確控制將要編譯的函數。

啟用 XLA
https://www.tensorflow.org/xla/tutorials/compile

XLA 帶來的性能提升令人贊嘆:在連接 8 個 Volta V100 GPU(每個具有 16 GB GPU 內存)的 Google Cloud VM 上,XLA 將 BERT訓練吞吐量從每秒 23.1 個序列提高到每秒 168 個序列,提升了約 7 倍。XLA 還使每個 GPU 的可運行批次大小增加了 5 倍。XLA 減少了內存使用量,因此使得高級訓練技術(如梯度積累)的使用成為可能。

在 Google Cloud 上使用 8 個 V100 GPU 的 BERT 模型中啟用 XLA 的影響(分鐘)(Google 在 MLPerf Training 0.7 中提交的測試結果)與停用優化條件下同一系統中未經驗證的 MLPerf 結果

Google Cloud 上最先進的加速器

Google Cloud 是唯一支持訪問最新 GPU 和 Cloud TPU 的公共云平臺,使 AI 研究人員和數據科學家可以自由地為每個任務選擇合適的硬件。

GPU
https://cloud.google.com/blog/products/compute/announcing-google-cloud-a2-vm-family-based-on-nvidia-a100-gpu

Cloud TPU
https://cloud.google.com/tpu/

BERT 等前沿模型已在 Google 內廣泛使用,并在整個行業范圍內用于各種自然語言處理任務,現在可以使用訓練 Google 內部工作任務所用的基礎架構在 Google Cloud 上進行訓練。借助 Google Cloud,您可以在一個小時內在具有 16 個 TPU 芯片的 Cloud TPU v3 Pod 切片上將 BERT 訓練 300 萬個序列,總成本不到 32 美元。

BERT
https://github.com/tensorflow/models/blob/master/official/benchmark/bert_benchmark.py

結論

Google 的 MLPerf 0.7 訓練提交結果展示了 TensorFlow 2 在最新的 ML 加速器硬件上的性能、易用性和可移植性。立即開始,體驗 TensorFlow 2 在 Google Cloud GPU、Google Cloud TPU 和具有 Google Cloud Deep Learning VM 的 TensorFlow Enterprise 上的易用性和功能。

致謝

GPU 的 MLPerf 提交結果離不開與 NVIDIA 的密切協作。NVIDIA 的所有工程師都為提交測試結果提供了幫助,在此一并表示感謝。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133024
  • tensorflow
    +關注

    關注

    13

    文章

    329

    瀏覽量

    60615

原文標題:TensorFlow 2 MLPerf 提交結果在 Google Cloud 上展現出同類最佳性能

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    40mR/650V SiC 碳化硅MOSFET,替代30mR 超結MOSFET或者20-30mR的GaN!

    系列產品,B3M040065H,B3M040065L,B3M040065Z高性能,高可靠和易用性,高性價比,同時提供驅動電源和驅動IC解決方案! *附件
    發表于 01-22 10:43

    充分考慮設備的體驗易用性 藍鵬設計部將這一理念貫穿于整個研發過程

    關鍵字:藍鵬測控設計部,藍鵬測控測徑儀,藍鵬測控專利,測徑儀專利, 藍鵬設計部在研發過程中充分考慮設備的體驗和易用性,這一理念對于提升產品的市場競爭力具有重要意義。 藍鵬設計部在研發設備時,始終
    發表于 12-24 14:07

    11-06-CBM94AD67【中文排版】-202402221530

    CBM94AD67-250是一種16位單片中頻采樣模數轉換器(ADC)。它針對寬帶高性能和易用性進行了優化。該產品以250MSPS的轉換速率運行,專為需要高動態范圍的無線接收器、儀器和測試設備
    發表于 11-22 14:21 ?0次下載

    專為運行而設計:使用bq2018電源管理器IC的通用電池監控器

    電子發燒友網站提供《專為運行而設計:使用bq2018電源管理器IC的通用電池監控器.pdf》資料免費下載
    發表于 10-24 09:28 ?0次下載
    <b class='flag-5'>專為</b>運行<b class='flag-5'>而設</b>計:使用bq2018電源管理器IC的通用電池監控器

    Bourns 推出符合 AEC-Q200 標準高壓氣體放電管 (GDT) 專為滿足嚴苛的可靠、耐用和法規標準而設

    組件領導制造供貨商,推出 SA2-A 高壓氣體放電管 (GDT) 系列。這是 Bourns 符合 AEC-Q200 標準的廣泛產品組合中的最新系列,專為滿足特定惡劣環境以及需要卓越的可靠、耐用
    發表于 10-08 11:35 ?3998次閱讀
     Bourns 推出符合 AEC-Q200 標準高壓氣體放電管 (GDT) <b class='flag-5'>專為</b>滿足嚴苛的可靠<b class='flag-5'>性</b>、耐用<b class='flag-5'>性</b>和法規標準<b class='flag-5'>而設</b>計

    中科創達旗下創通聯達Qualcomm RB3 Gen 2 Lite開發套件上市銷售

    日前,中科創達旗下創通聯達(Thundercomm)宣布Qualcomm RB3 Gen 2 Lite 開發套件在其官網商城正式上市銷售。該開發套件是專為性能計算、高易用性
    的頭像 發表于 08-20 09:21 ?647次閱讀

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發的一個開源深度學習框架,它允許開發者方便地構建、訓練和部署各種復雜的機器學習模型。TensorFlow憑借其高效的計算性能、靈活的架構以及豐富的工具和庫,在學
    的頭像 發表于 07-12 16:38 ?801次閱讀

    tensorflow和pytorch哪個更簡單?

    TensorFlow和PyTorch都是用于深度學習和機器學習的開源框架。TensorFlow由Google Brain團隊開發,而PyTorch由Facebook的AI研究團隊開發。 易用性
    的頭像 發表于 07-05 09:45 ?966次閱讀

    tensorflow和pytorch哪個好

    。 生態系統 :擁有龐大的社區和豐富的資源,包括TensorFlow Hub、TensorBoard等工具。 易用性 :對于初學者來說,TensorFlow的學習曲線可能相對較陡
    的頭像 發表于 07-05 09:42 ?765次閱讀

    SOLIDWORKS教育版本的易用性

    在數字化和智能化的教育時代背景下,三維設計軟件在教學領域的應用越來越廣泛。SOLIDWORKS教育版本作為一款專門針對教育領域設計的三維建模軟件,以其優越的易用性贏得了廣泛的認可。
    的頭像 發表于 07-04 17:11 ?353次閱讀

    新品 | Prime Block 50mm——專為實現最高性能而設

    新品PrimeBlock50mm——專為實現最高性能而設計50mmPrimeBlock模塊優化了熱阻,在更高的溫度條件下,它們的性能超越了目前的極限。因此,在相同的尺寸下,功率密度最高
    的頭像 發表于 05-28 08:14 ?275次閱讀
    新品 | Prime Block 50mm——<b class='flag-5'>專為</b>實現最高<b class='flag-5'>性能</b><b class='flag-5'>而設</b>計

    論RISC-V的MCU中UART接口的重要

    有效地傳輸大量數據,從而改善外部設備的性能。這使得RISC-V的MCU在需要實時數據交互和處理的場景中表現出色,如遠程控制、遠程監控等應用。 低成本和易用性 : UART接口具有低成本的優勢,因為它可
    發表于 05-27 15:52

    基于 GaN 的 MOSFET 如何實現高性能電機逆變器

    ,設計人員可以使用氮化鎵(GaN)來實現這些目標,氮化鎵是一種寬帶隙(WBG)FET器件技術,在成本、性能、可靠和易用性方面都得到了改進和進步。GaN器件是主流,已
    的頭像 發表于 05-23 10:56 ?653次閱讀
    基于 GaN 的 MOSFET 如何實現高<b class='flag-5'>性能</b>電機逆變器

    溫度測試儀的穩定性和易用性

    溫度測試儀是一種廣泛應用于科研、工業生產和日常生活中的重要儀器,主要用于精確測量物體或環境的溫度。這種設備以其高度的準確、穩定性和易用性,為眾多領域提供了有力的技術支持。 溫度測試儀的工作原理主要
    的頭像 發表于 03-25 11:26 ?501次閱讀
    溫度測試儀的穩定性<b class='flag-5'>和易用性</b>

    工業級路由器如何助力你的企業安全高速上網?

    工業級路由器作為企業安全高速上網的重要工具,具有高性能、穩定性、安全保障和易用性等優勢。通過選擇合適的工業級路由器產品并優化網絡環境,企業可以獲得安全、高速的網絡環境,為業務發展提供強有力的支持。
    的頭像 發表于 03-08 14:33 ?341次閱讀
    主站蜘蛛池模板: 么么哒日本影院 | 真实的强视频免费网站 | 一个人视频日本在线观看 | 欧美5g影院天天爽天天看 | 出租屋自拍贵在真实15P | 综合色中色 | 国产精品18久久久久久欧美网址 | 亚洲精品资源网在线观看 | 99久久免费精品国产 | 亚洲字幕久久 | 欧美最猛12teevideos | 在线免费公开视频 | 丰满人妻妇伦又伦精品APP国产 | 亚洲综合小说久久另类区 | a视频免费看 | 精品无码久久久久久久动漫 | 久久最新地址获取 | 男人团apk | 99热这里只有精品9 99热这里只有精品88 | 中文字幕人成人乱码亚洲影视 | 久久精品成人免费网站 | 免费精品国产人妻国语 | 国产精品自产拍在线观看网站 | 日本无码色哟哟婷婷最新网站 | 午夜无码片在线观看影院 | 亚洲精品国产自在现线最新 | 内射一区二区精品视频在线观看 | 国产精品免费一区二区三区四区 | 116美女写真成人午夜视频 | 久草在在线免视频在线观看 | videosgrati欧美另类 | 2020国产成人精品免费视频 | 亚洲色欲色欲WWW在线丝 | asian极品呦女xx农村 | 老外的好大c的我好爽 | 女人高潮时一吸一夹 | 护士被老头边摸边吃奶的视频 | 91精品一区二区三区在线观看 | 美国VICTORY DAY在线 | 青青草原国产在线观看 | 一边亲着一面膜下的免费过程 |