騰訊大數據團隊詳細披露了騰訊大數據十年發展歷程,并全面展示了騰訊第三代全棧機器學習平臺Angel在大模型數據訓練、深度學習、圖計算等方面的技術能力。
據騰訊大數據負責人劉煜宏介紹,騰訊大數據從2009年開始, 經歷離線計算、實時計算與機器學習三個階段,2009年之前,騰訊主要使用傳統的關系型數據庫。2009年開始,傳統的單機數據庫所提供的服務,在系統可擴展性、性價比方面已不再適用騰訊業務爆發式的增長。面對這種變化,騰訊大數據轉向分布式,基于開源的Hadoop體系,構建了騰訊第一代大數據平臺,并建設離線計算平臺,主要發力規模化。騰訊大數據由此進入第一階段。三年里,騰訊實現了從關系型數據庫到自建大數據平臺的全面遷移,到2012年,騰訊大數據的單集群規模突破了4400臺。
2012年,移動互聯網爆發,應對業務數據統計及時性、快速性的需求,騰訊大數據從Hadoop轉向Spark和Storm體系,在吸收開源技術的基礎上,結合騰訊自身的需求進行重寫,探索流式計算、秒級采集系統的建設,構建企業級的實時數據分析體系,騰訊大數據發展進入第二階段。
2015年至今,騰訊大數據邁入了第三階段。隨著數據挖掘、數據應用的深入,騰訊大數據再次自我迭代,于2016年推出了自研機器學習平臺Angel,專攻復雜計算場景,可進行大規模的數據訓練,支撐內容推薦、廣告推薦等AI應用場景。它由騰訊與北京大學聯合研發,兼顧了工業界的高可用性和學術界的創新性。
據騰訊Angel開發負責人肖品介紹,騰訊Angel從騰訊海量業務場景中而來,是超大樣本和超高維度的機器學習平臺。如今,Angel已在QQ、微信支付、騰訊廣告、騰訊視頻等騰訊旗下產品中廣泛應用,并向微眾銀行等行業合作伙伴全面開放,普遍適用于智能推薦、金融風險評估等圖計算業務場景。
2017年,騰訊Angel就正式開源。2018年8月,騰訊將Angel捐贈給Linux旗下專注人工智能的LF AI基金會,結合基金會成熟的運營,全面升級的 Angel與國際開源社區深入互動,致力于讓機器學習技術更易于上手研究及應用。
-
移動互聯網
+關注
關注
5文章
599瀏覽量
34108 -
機器學習
+關注
關注
66文章
8438瀏覽量
132907
發布評論請先 登錄
相關推薦
評論