導讀:去年,知乎上一篇討論騰訊技術的帖子異常火爆,討論的主題是當下(2018 年)騰訊的技術建設是否處于落后同體量公司的狀態,這篇帖子得到騰訊內部以及其他互聯網公司「碼農」的“激情”回復。
當然,也有人反駁,包括騰訊被 diss 的開源情況也有人出來“打抱不平”,表示騰訊已經變得越來越開放,開源已在路上,請給它一點時間。
問題是,這些吐槽現在還是真實情況嗎?為找到這個問題的答案,本文將從騰訊的技術建設、開源,以及 AI 實力這幾個方面進行分析,來一探究竟。
技術建設落后是真實的嗎?
總結下來,知乎上關于騰訊技術建設落后的吐槽,其中很重要的一點集中在「重復造輪子」相關的問題上,比如:
1、技術債務重,文檔查找和共享難,出了技術問題不知道問誰等問題;
2、技術氛圍差,各個團隊敝帚自珍,重復造輪子;
3、內部賽馬機制導致“沒有收益”的事情沒人愿意做;
當然,對于這些吐槽,知乎上也有不少用戶站出來反駁,比如有騰訊內部人員匿名表示,騰訊技術團隊的總體水平其實并不差,很多獨立的模塊設計和抽象都比較出色,技術含量也不低,只是總體上感覺還有很大優化空間。而且,騰訊在不斷發生變化和改進,這從微信和 QQ 產品的體驗中可以感受得到。
注:上述為知乎部分用戶看法,僅做參考,不一定代表真實情況。
全面擁抱開源
在騰訊被吐槽的眾多技術問題中,「重復造輪子」、分享難等狀況是廣受詬病的問題。針對這些問題,騰訊通過開源將成果在內部分享來改善,并追趕 BAT 中其他兩家公司的步伐。那么,它做出了哪些努力呢?
▌發布開源路線圖
實際上,2010 年騰訊已經全面擁抱“開放”戰略,2012 年發布了第一個對外開源項目。從 2016 年開始,騰訊不斷將內部開源項目在 GitHub 上發布。
近日,騰訊在開源上有了一次大動作,首次全面公開了其整體的開源路線圖。據了解,基于代碼開放和社區運營,騰訊的開源路線是通過“三步走”的開源計劃,不斷深化騰訊已有的技術能力,推動從封閉孤立向協同開放向社區開放治理的縱深方向發展。
具體來說,第一步是內部開源協同。首先拉通內部項目和組織,通過部門小團隊作戰或跨部門大團隊作戰的方式協同推進,以優化資源配置的方式集中優勢尋求技術突破。隨后,騰訊建立起篩選機制將代碼開放出來。
第二步是外部代碼開放。優化設計與代碼結構,不斷拓展落地場景,有效利用外部貢獻者資源實現資源整合,構建技術影響力。
第三步是社區開放治理,在這一階段,注重大規模技術推廣與應用、開發者生態體系構建、社區領袖與領導力培養、全社會研發資源的優化配置四個方面。
據騰訊開源聯盟主席、騰訊開源管理辦公室委員、Apache Member 堵俊平透露,騰訊開源將重點關注 IaaS、容器與云原生、數據庫、大數據與 AI、中間件、IoT/邊緣計算、小程序生態等。
▌成立騰訊開源管理辦公室
此外,為更好地服務開源,騰訊特別對內成立了開源管理辦公室,下設項目管理委員會、騰訊開源聯盟和開源合規組三大組織,自上而下地傳遞騰訊開源策略,自下而上地落地開源技術生態。同時,通過開放的開源評審平臺,孵化和培育優秀的自主開源項目。
▌內部機制
同時,騰訊內部其實有一套自己的開源機制,經騰訊技術管理委員會授權,由騰訊研發管理職責部門牽頭騰訊法務、合規、專利、安全等相關部門,整合為騰訊開源合規小組,在開源流程、安全、風險、建議方面對騰訊業務提供專業服務。合規小組會幫助開源項目整理第三方組件的引用,通過第三方掃描工具(如 blackduck、fossid等)識別和確認第三方代碼有效性,同時會進行人工篩查,確保第三方使用騰訊代碼時安全可控。
在協議選取上,合規小組會對項目的開源許可證進行合規化的建議,并向業務推薦開放性的許可協議。
在文化方面,由研發管理部 CODE 平臺中心負責組織建設騰訊代碼文化和內部開源,鼓勵騰訊項目首先在騰訊內部流動,并對有價值的項目引導和幫助對外開源。
同時,在騰訊技術管理委員會的授權下牽頭設立了“騰訊開源聯盟”,由不同業務的技術專家、負責人、技術領袖組成開源聯盟組委會和專家團,在開源文化、開源經驗、開源活動等方面對開源項目施以指導和幫助。
在這套機制下,截至 2019 年 6 月,騰訊已在 Github 上發布 75 個開源項目,包含微信、騰訊云、騰訊游戲、騰訊 AI、騰訊安全等相關領域,累計在 Github 獲得了 22W+ Star 數。
目前,騰訊自主開源的項目包括:
WeUI:輕量而優雅的微信 UI 樣式庫
Wepy:小程序組件化開發框架
Tars:整套微服務治理和開發運營一體化解決方案
官網及項目詳情地址:
https://opensource.tencent.com/
官方 GitHub 詳情地址:
https://github.com/Tencent/
關注騰訊的人應該了解,騰訊還參與貢獻了 Openstack、 KVM、docker、NVDIMM、ceph、HBase、Hadoop、linux、Spark、kubernetes、torrent、dht、goprocinfo、flannel、netlink 等開源社區和項目,主導發布了 Hadoop 2.8.4、2.8.5 和 Spark 2.3.2,并將開源項目 Tars、TSeer 和 Angel 分別捐贈 Linux基金會和Linux 深度學習基金會,并將長期于基金會運作。同時,騰訊還是 Linux 基金會、Apache 基金會、Openstack 基金會、MariaDB 基金會及 LF 深度學習基金會的白金會員。
堵俊平表示,騰訊之所以重視開源,原因在于:從外部環境來看,隨著主流的開發平臺Linux、Android 等逐漸開源化,IT 產業想要取得更大的市場份額,擁抱開源是當務之急;從騰F訊內部的技術積累來看,騰訊內部已經累積了超過 8000 個經過用戶驗證的開源項目,可以向開源社區輸出優質開源項目;從生態機遇來看,開源能夠很好地服務于騰訊重點戰略方向,例如作為騰訊云的 Paas、Saas 服務封裝,推動機器學習和人工智能的廣泛應用。
AI 實力哪家強?
如今,AI 已經成為一家公司綜合實力不可忽略的一部分,尤其是對于 BAT 來說,AI 在戰略層面的定位很大程度上決定了公司的發展方向。
在 AI 方面,數據顯示,騰訊與百度與阿里相比似乎并不占優勢,但仍在有重點地奮力追趕,在一些領域已占有優勢。
2018年,CB Insights 的報告挖掘了 BAT 在AI 方面的相關專利記錄、投資和收益等,全方位描繪了 BAT 的 AI 策略。報告顯示,百度在 AI 領域處于領先地位。BAT 分別著重自動駕駛、智慧城市和醫療 AI,在政府的大力支持下,BAT 正在向全世界擴張。
首先,在戰略上,百度就早于阿里和騰訊意識到 AI 的重要性,在 2010 年就已經在電話會議上討論 AI,時間甚至早于谷歌,而阿里和騰訊都是在近年才提出 AI 戰略。
百度財報顯示,自 2011 年以來,百度就大規模投入人工智能技術的研發,最近幾年研發投入占總收入保持在 15% 左右。
相比之下,騰訊財報顯示,騰訊 2019 年第一季度營收 854.7 億元,同比增長 16%,但收入構成中未包含 AI 帶來收入的信息,主要收入來源是增值服務和金融科技及企業服務,占比分別為 57% 和 25%,網絡廣告占比 16 %,其他收入占比 2%。
但在學術研究上,騰訊正在成長為一支“生力軍”,在國際頂級會議上的表現可圈可點,如在今年的 CVPR 會議上,今年騰訊公司共有 58 篇論文入選,其中騰訊 AI Lab 33 篇(含 8 篇oral),騰訊優圖實驗室 25 篇,騰訊 AI Lab 入選論文涉及視頻理解、人臉識別、對抗攻擊、視覺-語言描述、模型壓縮和多任務學習等幾大重點研究方向。2018 年,騰訊 AI Lab 在 NIPS(現已更名NeurIPS) 上共有 20 篇論文入選,其中 2 篇被選為亮點論文(Spotlight),其他成績還包括計算機視覺領域頂會 CVPR (21篇)和 ECCV(19篇)、機器學習領域頂會 ICML(16篇)、NLP 領域頂會 EMNLP(16篇),以及語音領域頂會 Interspeech(8篇)等。可見,騰訊的 AI 學術研究能力并不落后。
在應用層面,騰訊的成果也很矚目,如發布了基于多模態研究的首個“電競虛擬人”,策略協作型 AI“絕悟”首次亮相KPL決賽,與人類戰隊(超過99%玩家)進行 5V5 水平測試并取得勝利。
在 AI 投資上,BAT 三家都向全球擴擴張,約 44% 的資金流向美國的初創公司,其中騰訊在美國的投資交易最多,參與了 12 項交易。
(來源:CB Insights )
CB Insights 數據顯示,在 AI 專利上,百度和阿里在語音領域領先,而騰訊專利則更多與計算機視覺研究相關。9月6日,騰訊宣布優圖實驗室升級為騰訊計算機視覺研發中心,將加大研發投入,且不設 KPI,可見其對 CV 開發的重視程度。幾日后,騰訊 AI Lab 開源了“Tencent ML-Images”數據集,作為騰訊開源第58個項目(https://github.com/Tencent),這是騰訊在計算機視覺領域所累積的基礎能力的一次釋放。
當然,三家公司在 AI 應用方面的重心不一,百度在自動駕駛領域領先,如在最近的百度 AI 開發者大會上公布了開放平臺 Apollo 迭代到 5.0 最新版本,并宣布與吉利在智能網聯、智能駕駛、智能家居、電子商務等領域達成戰略合作,以及多項落地項目,如在百度大廈和百度科技園試運營的自主泊車,與紅旗攜手打造的中國首條 L4 乘用車前裝產線在長春投產下線,無人駕駛出租車(Robotaxi)項目“Apollo Go”亮相等。這些都是實實在在的進步。
而阿里巴巴的一大優勢在于其人工智能云平臺“ET 城市大腦”。據官網介紹,“ET 城市大腦”背后的團隊為阿里達摩院城市大腦實驗室,華先勝為負責人,張磊為高級研究員,研究方向包括多模態數據感知、城市交通預測與干預、城市大規模并行異構計算、城市復雜環境感知與理解、城市視覺搜索引擎和城市市政規劃和公共資源分析。阿里使用城市大腦來處理來自相機、傳感器、社交媒體和政府數據等方面的數據,并使用人工智能算法來預測醫療保健、城市規劃、交通管理等方面的結果,科研實力不容小覷。
相比之下,騰訊則將重點放在 AI 醫療保健領域。除了大力投資 AI 醫療企業,騰訊還重點研發醫療智能平臺,2017 年 8 月,騰訊發布了其首個 AI+醫療影像產品:“騰訊覓影”,可輔助醫生對肺結節、乳腺癌、糖尿病視網膜病變、早期食管癌等疾病進行篩查。截至 2018 年 7 月,騰訊覓影已累計輔助醫生閱讀醫學影像超 1 億張,服務超百萬患者,提示高風險病變 15 萬例。同年 11 月,“騰訊覓影”進入了首批國家新一代人工智能開放創新平臺名單,負責建設醫療影像國家新一代人工智能開放創新平臺。隨后,騰訊又相繼發布了首款醫療AI引擎“騰訊瑞智”和“騰訊超級大腦”,后者將人工智能技術融入到醫藥研發、基因組數據分析、導診、疾病篩查、輔助診療、醫療管理等環節。
另一方面,在 AI 開源上,騰訊也在加緊步伐:
(紅框部分為騰訊 AI 相關開源項目,不完全統計)
圍棋 AI 技術PhoenixGo,這是騰訊微信翻譯團隊開發的人工智能圍棋程序,曾在 2018 年以 BensonDarr(昵稱“金毛”)的名義在騰訊野狐圍棋平臺上和全球頂尖職業棋手、圍棋愛好者及各路圍棋AI 對弈,在 4 月底取得了 200 多連勝,并在福州 2018 人工智能圍棋大賽上奪冠,引起了行業內廣泛關注。
Tencent ML-Images:2018 年 9 月 底騰訊 AI Lab 開源,由多標簽圖像數據集 ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網絡 ResNet-101 構成。
Angel:基于參數服務器理念開發的高性能分布式機器學習平臺。
behaviac:游戲 AI 的開發框架組建,也是游戲源性的快速設計工具。
FeatherCNN:高性能神經網絡前向計算庫等。
NeuralClassifier:NeuralNLP的一個子項目,是一款基于PyTorch開發的深度學習文本分類工具。
看到這里,我們會發現僅從上述資料中無法找出文章開始提出問題的答案,但還是可以從中得出一些較為客觀的結果:
市面上存在著對騰訊技術建設的質疑,但從用戶體驗來講,騰訊的主流產品和技術研發并沒有讓用戶失望;
騰訊的開源狀況不如 BAT 其他兩家,因為騰訊在開源上起步晚,但這家公司已經在保持開放的態度,且在奮力追趕之下已經有不少項目對業界產生不小的影響;
騰訊的AI 實力究竟如何也需要從多角度考量,雖然整體上百度的 AI 實力最強,但騰訊在 AI 研發上是認真的,比如在醫療影像 AI 領域,騰訊的技術積累已經助力不少優質項目落地,且背靠充足資金的支持,這是其他 AI 創業公司無法企及的優勢。
-
互聯網
+關注
關注
54文章
11184瀏覽量
103680 -
AI
+關注
關注
87文章
31490瀏覽量
269915 -
騰訊
+關注
關注
7文章
1666瀏覽量
49548
原文標題:騰訊擁抱開源:首次公布開源路線圖,技術研發向共享、復用和開源邁進
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論