前有全球千百萬開發者的熱烈追捧,后有谷歌爸爸的鼎力支持,TensorFlow從一出生開始就注定不平凡。
而谷歌剛剛宣布將推出TensorBoard.dev預覽版,用于共享TensorBoard機器學習可視化效果,同時發布的還有TensorFlow Enterprise,通過TensorFlow與云團隊之間的協作來生成云服務。
根據谷歌副總裁Megan Kacholia所言,“現在可以托管和跟蹤ML實驗,并實現公開共享,無需設置,只需上傳日志及共享URL,其他人即可查看實驗及使用TensorBoard所做的一切”。TensorFlow Enterprise旨在為大型企業提供TensorFlow的優化版本,可提供多達3倍的數據讀取改進。
作為全球最熱的開源軟件平臺,TensorFlow的大名相信已經不需要過多介紹。早在2011年,谷歌大腦團隊作為內部機器學習工具而打造的DistBelief就凝聚了一大批谷歌杰出程序員的心血,其中不乏Jeff Dean這樣的天才人物。
2015年11月,以DistBelief為基礎,TensorFlow初版正式發布,立即引發強烈反響,當時就有報道將TensorFlow和2008年安卓手機操作系統的誕生相提并論,更有人稱TensorFlow的發布標志著“谷歌已經從一家搜索公司,變成了一家機器學習公司。在未來幾年內將在技術行業引發強烈震動。”
后來的事實證明,這個說法實際上并不準確,TensorFlow給技術行業帶來的不僅僅是震動,而是一場全方位的革命。正如MapReduce和Hadoop讓“大數據”變得家喻戶曉一樣,過去幾年來,伴隨著機器學習領域的飛躍式發展,在“機器學習”幾乎成為計算機科學的代名詞的過程中,TensorFlow更是居功至偉。
正值TensorFlow 2.0正式版發布不久之際,全球開發者和開源用戶又迎來了另一次歷史性的盛事:首屆TensorFlow World大會正于美國加州圣克拉拉舉辦。
短暫開場式后,Jeff Dean亮相做開場主題演講。
Jeff Dean:TensorFlow下載量已超4600萬
Jeff Dean表示,盡管芯片的摩爾定律可能面臨終結,但“AI論文數量”的摩爾定律可能才剛剛起步。現在,每天都有100篇機器學習領域的新論文誕生。
機器學習使得過去不可能的事情變得可能。語音識別、圖像識別翻譯和預測上的性能日新月異。2011年,機器學習圖像識別的錯誤率最低大概是26%,到了2016年,這個數字就迅速降至4%,錯誤率已經低于經過專業訓練的人類水平(5%)。
在語音識別和機器翻譯等其他基于機器學習的領域,也出現了同樣明顯的技術進步。
Jeff Dean在演講中列出了美國國家工程院于2008年發布的“21世紀14大工程學挑戰”。十年后的現在回過頭來看,有些問題已經解決,有些看到了解決的希望,有些仍未解決。值得注意的是,在已經解決的問題中,機器學習和AI發揮了不可或缺的作用。
重建和提升城市基礎設施
交通是城市生活的重要組成部分,在機器學習和計算機視覺技術的加持下,自動駕駛車輛的性能迅速提升,雷達、多角度攝像頭和傳感器讓車輛具備實時處理來自環境的原始數據的能力。換句話說,車輛能夠在行駛中實時快速理解周圍正在發生的事。
這些都不再是遙不可及的夢,谷歌旗下的自動駕駛車企業Waymo早已開始路測,從去年開始,Waymo的路測車輛中坐的是普通的乘客,而且拿掉了安全員。
重塑醫療信息學
Jeff Dean認為,在醫療領域,AI技術的最重要意義在于,將世界級的專業醫學服務,以極低的成本帶給了世界上更多的人。
以糖尿病視網膜病變為例,這是世界上導致可預防性致盲的疾病中增長最快的一種,全世界因該病而可能致盲的人群多達4億。通過每年定期檢查,可以有效防控這種疾病,降低致盲風險。但是做這種檢查需要專業的眼科醫生,一般醫生無法勝任,這導致印度有45%的患者因為眼科醫生數量短缺,沒能及時確診而致盲。
怎么辦?Jeff Dean表示,該病的診斷實際上可以通過計算機視覺來輔助進行,訓練深度神經網絡學習“看圖診斷”。診斷結果很有意思,AI醫生和人類眼科醫生平均有60%的幾率給出一致的診斷意見,看上去并不高是吧?如果讓人類醫生隔幾個小時看同一張片子,兩次給出相同診斷意見的概率也只有65%。
這個問題其實不難解決。只要增加人類醫生的數量,繼續用標記圖像數據訓練AI模型,最終模型的診斷水平甚至能夠相當于甚至超過美國眼科醫生的平均水平。
NLP終于迎來新范式
前面許多進步都依賴于能夠理解文本,而在理解語言方面,最近取得了很大的進步。
2017年谷歌研究員提出Transformer模型,這篇論文非常成功,在英語-德語和英語-法語的機器翻譯中達到了最高的準確率,同時計算成本降低了10~100倍。
到了2018年,谷歌研究員提出BERT模型,這是一個強大的預訓練模型,如今已經成為一種新的NLP范式。比如在“完形填空”這個任務中,它的原理是:
步驟1:使用大量的自我監督文本,為“完形填空”任務預訓練一個模型
步驟2:使用少量數據對單個語言任務的模型進行微調。
在GLUE基準測試中,BERT模型在一系列語言任務中都取得了最好的結果。
Jeff Dean接著介紹Google在開發用于科學發現的工具方面的進展,無論是無人駕駛還是太空探索,都需要有最好的工具,TensorFlow就是其一。
TensorFlow現在已經被下載46000000次,被用到各種各樣的任務當中,有些甚至超乎想象。
自動化機器學習AutoML
Jeff Dean 接下來介紹了 AutoML。
自動化機器學習的目標是為計算機開發能夠自動解決新的機器學習問題的技術,而不用每次遇到新問題都需要人類機器學習專家干預。如果我們想要真正的智能系統,這是所需要的最基本的能力。AutoML 是使用強化學習和進化算法設計神經網絡結構的新方法。
再如神經架構搜索(NAS),這也是當前研究的一個熱點,它的想法是通過強化學習訓練模型生成器,然后:
(1)生成10個模型
(2)訓練幾個小時
(3)用生成的模型的損失作為強化學習信號
從而提升模型的準確性,應用到自己的任務中。
通過不斷迭代來找到最優的模型,這樣的模型非常有效。
上面是一個圖像識別的模型。過去幾年深度學習在圖像識別方面取得了非常快速的進展,如下面的折線圖所示,縱軸表示圖像識別的準確性,橫軸表示浮點數量,藍色線條是AutoML的表現,可以看到,模型的準確性在不斷提高。
Jeff Dean預測,由于計算能力的提升,自動化機器學習的能力會不斷增長。
圖像識別之外,在物體檢測、機器翻譯等領域也有同樣的趨勢。
最后,Jeff Dean總結了TensorFlow的目標:
- 大模型,但稀疏激活
- 單個模型解決多個任務
- 通過大模型動態地學習和成長路徑
- 模型架構根據需要進行調整
- 利用現有的技能和表示添加新任務
為什么要選擇TensorFlow 2.0?
谷歌副總裁Megan Kacholia為我們介紹了最新的TensorFlow 2.0。
圖:谷歌副總裁Megan Kacholia
TensorFlow 是一個端到端開源機器學習平臺。它擁有一個包含各種工具、庫和社區資源的全面靈活生態系統,可以讓研究人員推動機器學習領域的先進技術的發展,并讓開發者輕松地構建和部署由機器學習提供支持的應用。
Megan把TensorFlow形容為“一個完整的生態系統”,可以幫助開發者使用機器學習解決棘手的現實問題。它具備3大特點:
1、輕松地構建模型
TensorFlow 提供多個抽象級別,因此開發者可以根據自己的需求選擇合適的級別。可以使用高階 Keras API 構建和訓練模型。如果對更高的靈活性又要求,則可以借助 Eager Execution 進行快速迭代和直觀的調試。對于大型機器學習訓練任務,可以使用 Distribution Strategy API 在不同的硬件配置上進行分布式訓練,而無需更改模型定義。
2、隨時隨地進行可靠的機器學習生產
TensorFlow 始終提供直接的生產途徑。不管是在服務器、邊緣設備還是網絡上,無論使用何種語言或平臺,TensorFlow 都可以讓開發者輕松地訓練和部署模型。如果需要完整的生產型機器學習流水線,可以使用 TensorFlow Extended (TFX);如果要在移動設備和邊緣設備上進行推斷,可以使用 TensorFlow Lite。如果想在 JavaScript 環境中訓練和部署模型,可以使用 TensorFlow.js 。
本文來自新智元,本文作為轉載分享。
-
谷歌
+關注
關注
27文章
6173瀏覽量
105634 -
機器學習
+關注
關注
66文章
8425瀏覽量
132773 -
自動駕駛
+關注
關注
784文章
13877瀏覽量
166611 -
tensorflow
+關注
關注
13文章
329瀏覽量
60542
發布評論請先 登錄
相關推薦
評論