半個多世紀前,浙江大學老校長竺可楨曾有兩個非常經典的教育問題:“諸位在校,有兩個問題應該自己問問,第一,到浙大來做什么?第二,將來畢業后做什么樣的人?”
半個多世紀后,以這位老校長名字命名的 “竺可楨學院” 求是科學班開啟了一位少年的求是之路。他就是本期采訪的主人公——彭靖田。
作為 5 月 25 日 - 5 月 27 日即將在杭州舉辦的 CTA 大會(官網:https://dwz.cn/iSZ7BQUR)機器學習論壇演講嘉賓,彭靖田以谷歌技術專家的身份接受了 AI 科技大本營的采訪。
彭靖田,Google Developers Expert
谷歌技術專家(Google Developers Expert,GDEs)是這么定義的:來自全球各地經驗豐富的產品策略師、設計師、開發人員和營銷專家,積極支持開發人員、初創企業和公司以通過 web 應用程序和移動應用程序來改變這個社區;面向 Android、Angular、Dart、Flutter、谷歌云平臺、IOT、機器學習、web 開發等多個技術方向。
這么說起來,彭靖田與谷歌、與機器學習的淵源由來已久。
編程始于興趣,終于成長
從中學時代的信息學奧林匹克競賽(OI)起,彭靖田就開始接觸編程和算法了。與絕大多數同齡人相比,這已經非常早了,他卻自嘲:“我們班很多人小學 3 年級就開始編程,如今也在很多世界名校繼續攻讀 PhD”。相比起來,彭靖田在求是班反倒是接觸最晚的了。
彭靖田借用了一句老話,“興趣是最好的老師”。“可能我還是覺得 CS 這個學科本身比較有意思吧。高中階段帶給我啟蒙的主要是靠《算法導論》、 USACO 題庫、《浪潮之巔》,它們分別讓我窺見了算法、編程和行業歷史。”
光榮與夢想,偉大不是終點
大學畢業后,彭靖田順利拿到 Special Offer 進入華為中央軟件研究院。期間,他主要參與了深度學習云服務的設計和實現,當時的主要需求是支撐分布式機器學習訓練和在線推理服務。
他想,如果抽象 TensorFlow 為一種容器作業,并基于 Kubernetes 在容器調度方面的優勢,或許是一種實現路徑吧?說干就干,很快,彭靖田與同事一起開發了 DLKS (Deep Learning Kubernetes Scheduler)項目。
一年后,彭靖田加入當時在容器技術領域頗有深耕的才云科技,主要負責 AI 云業務線。但如何將容器集群管理技術 Kubernetes 與深度學習框架 TensorFlow 結合也同樣存在不小的挑戰。2018 年初,彭靖田與 Google Cloud 一拍即合,決定參與到開源項目 Kubeflow 的推進中來。
要知道,盡管在當時 TensorFlow 已是主流深度學習框架之一,被廣泛應用于國內外科技企業,但它也存在某些缺陷。作為 Google 在 2017 年推出的開源項目 Kubeflow,旨在支持多種機器學習框架如 TensorFlow、PyTorch、Caffe 運行在 Kubernetes 之上。
“這個項目的使命更加遠大,一開始我們就希望它能夠充分利用 Kubernetes 的優勢,不僅支持 TensorFlow,還可以支持所有基于數據流圖(Dataflow)的機器學習框架。”
將機器學習革命推進到底
2017 年下半年,一次偶然的機會,彭靖田開始了解到 Machine Learning GDE 這個項目。“那會兒國內應該還沒有 ML GDE,才開始推廣。”
彼時,他正與林健、白小龍合作撰寫《深入理解 TensorFlow:架構設計與實現原理》這本書。抱著希望能夠跟 Google TensorFlow 和 Google Brain 團隊有更多交流和聯系的想法,彭靖田申請了這個項目。
談起這段經歷,他仍記憶猶新,“第一輪面試是法國的一位 ML GDE,第二輪是 Google Cloud 東京團隊的 Kaz Sato,過程很順利。”
“不要總看模型準確率有多高,分布式規模有多大,而是要先了解業務本身,再根據已有資源設計相應的解決方案。”如今,不少企業正嘗試搭建自己的機器學習云平臺,在此過程中,卻又因缺乏人才而不免踩坑。
實際上,Google 一直在追求人工智能教育的普及,包括開放了 TensorFlow 這樣的高級項目。而如何幫助企業基于 Google 生態真正實現智能轉型升級,是彭靖田這樣的機器學習專家們正積極推動的事情。
以下為此次訪談實錄:
AI 科技大本營:從華為深度學習團隊核心成員,到才云 Cloud AI 負責人,按照您核心技術路線的變遷角度來講,離不開基于 Kubernetes 作為機器學習部署平臺的思路。能否講講您是如何認識到 Kubernetes 與 AI 結合的優勢的?過去幾年,您認為該項技術在落地應用方面又發生了怎樣的顯著改變?
彭靖田:準確來說,Kubernetes 之于 AI 不僅是部署,還是基礎設施(Infrastructure)。KDD 2017 年 收錄的《TFX: A TensorFlow- Based Production -Scale Machine Learning Platform》這篇論文給了我們一個很好的洞見。對于 Google 這樣擁有海量數據的公司來說,從 Mining 到 Learning,最后商業落地是一個順其自然的過程。不過,要想充分利用數據和模型,我們需要一個能夠支撐它的端到端機器學習平臺。
例如,Google 內部多年以來使用 Borg(大型集群管理系統),基于 TensorFlow 打造這個平臺很穩健,也很高效,但對于 Google 的外部用戶來說,我們認為 Borg 可行的替代方案是 Kubernetes。事實證明,這條路還是可以走通的,雖然前路還有一些烏云。
跳出 AI 云或者機器學習平臺這個場景,云計算的技術變革趨勢已經非常明朗,而 Kubernetes 的技術先進性和生態使得我們現在可以更聚焦于應用本身,而不再是基礎設施、軟件構建和發布、網絡負載均衡等問題。現在已經有很多企業在生產環境使用 Kubernetes,國內規模最大的應該是京東。
AI 科技大本營:目前,越來越多的企業開始在分布式機器學習云平臺上進行相關部署,您認為企業在做這一類的落地時需要注意哪些問題?如企業如何選擇適合業務的平臺和模型。
彭靖田:據我理解,應該是越來越多企業在嘗試搭建自己的分布式機器學習云平臺,而不是部署。
談到落地,我覺得絕大部分的矛盾和分歧是 “需求沒有理清楚”。現在這個行業最缺的就是既懂 AI 技術,又清楚業務場景的人才。企業應該多跟客戶聊一聊需求,而不是一味講“模型準確率有多高,分布式規模有多大”。客戶更多關心的是技術是否解決問題。因此,正如你說的,先了解業務本身,再根據已有資源設計解決方案(包括算法、端到端模型、平臺等)。
AI 科技大本營:據您的觀察,目前什么類型的企業最先搭建了自己的機器學習平臺?在這個過程中,會遇到哪些挑戰?利用分布式機器學習平臺會成為未來企業進行技術部署的主流趨勢嗎?
彭靖田:擁有數據的大企業,更確切的講,是希望挖掘數據背后價值,洞察客戶真實需求的大企業,如 Google、Uber、華為、京東等最先搭建了自己的機器學習平臺。
挑戰是多方面的,搭建一個類似于 TFX 這樣的平臺,需要企業具備從硬到軟的技術實力。比如 Google 和華為都在研發自己的 AI 芯片、編譯器、框架和平臺,這其中的難度和挑戰不言而喻。
在我看來,IT 到 DT 一定是未來趨勢。互聯網浪潮下,我們能看到整個原子世界都在不斷被數字化。機器學習就是數據驅動的學科。未來所有的人和所有的行為都會被記錄下來,這背后的商業價值是巨大的。相信看過美國科幻電視劇《西部世界》的朋友會有這個洞察。
AI 科技大本營:您針對 TensorFlow 撰寫了相關著作,并開發了一個專門的視頻課程,您認為相比于現有的其他框架 (如 PyTorch 等),TensorFlow 的優勢在體現在哪里?深度學習框架之爭,最后會是什么結果?
彭靖田:TensorFlow 的優勢主要體現在高性能、靈活、對大規模分布式訓練的支持等。目前,TensorFlow 對于 Senior 用戶來說,足夠定制化,滿足了很多商業落地場景;但它也存在劣勢,學習曲線對 Junior 用戶不太友好,這也是 TensorFlow 2.0 要解決的重要問題。
現在談結果還為時尚早。AI 落地是未來三年里所有從業人努力的方向,而這也是真實需求定義框架的未來。互聯網(web 開發)和移動互聯網(Android)的爆發,我們看到 Java 找到了自己的路。
現在的爭斗都是暫時的,是學術圈和小部分產業界的存量博弈。在 AI 大規模落地前,我們不知道框架會走向何處。
AI 科技大本營:對于希望入門機器學習并使用 TensorFlow 的學習者,您有哪些入門和進階的建議?
彭靖田:可以看看我在知乎 “ 如何高效地學習 TensorFlow 代碼?” 問題的回答。(鏈接:
https://www.zhihu.com/question/41667903/answer/123150582)
簡單來講,還是搞清楚自身需求。你未來想成為做算法模型的、做平臺的、做落地應用的,還是什么?當這個問題明確,你就知道應該深入了解 TensorFlow 的哪一層了。
AI 科技大本營:不久前竺可楨學院圖靈班也開始公布招收首批人工智能本科班,如何評價浙江大學在人工智能教育以及科研方面的優勢地位?
彭靖田:據我了解竺院上一屆混合班 2/3 的學生選擇了 CS,浙大 CS 這一屆申請名校 PhD 的整體成績也不錯,看見母校越來越強很開心。談到優勢,我個人認為還是自由的學術氛圍和優秀的教學資源吧。浙江大學里有很多院士帶領學生做前沿課題,也有諸如像 MOOC 中國著名網紅老師翁愷這樣的優秀教學隊伍可以進行一線教學指導。本科教學也一直緊跟美國名校的教學模式,相信浙大的同學都有體會。
AI 科技大本營:那么,在本次機器學習專場中,您會針對哪方面的內容和大家進行分享?
彭靖田:來 CTA,與我們一起聊聊 AI 的技術與落地。本次演講,我將向大家介紹如何使用 TensorFlow 2.0 Alpha 快速開發和部署機器學習模型。同時,我將介紹如何實現 TensorFlow 1.x 和 2.0 模型之間的快速轉換。最后,我將介紹 TensorFlow 和 AI 為民服務的落地案例。
-
應用程序
+關注
關注
38文章
3305瀏覽量
58180 -
深度學習
+關注
關注
73文章
5527瀏覽量
121844 -
tensorflow
+關注
關注
13文章
329瀏覽量
60719
原文標題:TensorFlow 2.0來了,為什么他卻說“深度學習框架之爭,現在談結果為時尚早”?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Samtec 技術漫談 | PCIe? 7.0,為時尚早?還是仍不夠快?

NPU在深度學習中的應用
AI大模型與深度學習的關系
NVIDIA推出全新深度學習框架fVDB
PyTorch深度學習開發環境搭建指南
深度學習中的時間序列分類方法
深度學習與nlp的區別在哪
深度學習常用的Python庫
TensorFlow與PyTorch深度學習框架的比較與選擇
深度學習與傳統機器學習的對比
深度解析深度學習下的語義SLAM

評論