數據科學團隊中的每個角色都很重要。你需要了解這些角色以及正確發揮他們的作用,以從對數據科學家的巨額投資中獲得價值,而不是為表現不佳的團隊支付過多費用。
Deloitte AI Institute執行董事Beena Ammanath說:“我們不應該說‘讓我們來聘請數據科學家,以及讓我們來建立數據團隊’,而是應該關聯業務挑戰,例如流程優化、成本節省、新產品線或競爭對手的業務。”
誰在數據科學團隊中?
顯然,數據科學家是數據科學團隊的重要組成部分。很多數據科學家通常具有數據或統計學方面的高學位,并具有R或Python的編碼技能,但他們還必須了解企業想要實現的目標。他們的工作往往具有探索性和迭代性。
俄羅斯數據科學咨詢公司BroutonLab的首席技術官兼創始人Michael Yurushkin表示,企業想要實現的目標將確定其聘用的數據科學家的類型。
Yurushkin說:“如果你的目標是改善內容發現、廣告定位、收入優化和搜索結果,則應雇用機器學習專家。如果你的目標是測試你的產品設計–使用帶有最小偏差的受控實驗,那么你需要專門從事實驗設計和因果推斷的統計人員小組。”
廣告植入和許可公司Branded Entertainment Network的AI主管Tyler Folkman說,他是全棧數據科學的忠實擁護者,其中數據科學家收集自己的數據、對其進行清理、對其進行處理、建立模型、將這些模型投入生產,并確保它們為最終用戶提供價值。
但是,數據科學家需要可靠的數據。這正是數據工程師的用武之地。他們建立數據管道并管理數據。
Folkman說:“數據工程師構建工具,使數據科學家能夠輕松有效地全棧工作。我還沒有找到開箱立即提供所需一切功能的供應商,因此讓數據工程師構建自己的平臺非常有價值,這個平臺應整合內部工具、開源工具甚至企業工具。”
大多數專家表示,數據分析師通常是在數據分析師團隊或業務部門工作,而不是數據科學團隊。不管他們屬于哪個部門,他們的技術水平都不及數據科學家和數據工程師,而且他們專注于數據科學的后期階段,即分析和共享見解。
Folkman認為數據分析師和研究科學家應作為數據科學團隊結構的一部分。分析師擁有數據,有助于確保數據健康,并為整個公司提供見解。研究科學家們不斷提高技術水平,并投資基礎研究。
BroutonLab的Yurushkin還認為需要數據戰略家,他作為業務與數據科學團隊之間的橋梁。他還認為那些計劃建立大型數據科學團隊的企業要有數據架構師。
大數據研究所董事總經理Jesse Anderson推薦三種數據團隊:數據科學、數據工程和運營。他也是即將出版的《Data Teams: A Unified Management Model for Successful Data-Focused Teams》的作者。
Anderson說:“運營工程師具有專門的能力來監視和管理這些大數據系統。”
但是,當沒有數據工程團隊時,沒有人會注意架構或代碼質量問題,這會造成多年的技術負擔。Anderson說,而當缺少運營團隊時,企業可能會采用在生產中無法正常運行的模型和代碼。
公民數據科學家的作用以及他們使用的工具
公民數據科學家是業務領域的超級用戶。與真正的數據科學家不同,他們往往缺乏深厚的統計知識,不會使用R或Python進行編程,也不了解機器學習的工作原理。
增強型分析工具供應商表示,他們正在使數據科學民主化,這意味著他們將提供簡單、功能強大的工具,讓公民數據科學家可以用來解決相對簡單的問題,例如了解為什么某個地區或某個季度銷售額下降。增強分析工具使用AI和機器學習來簡化數據準備和分析等任務。相比之下,數據科學家使用專家級工具來幫助解決復雜問題。
Anderson說:“公民數據科學將能夠訪問企業用于決策的相同數據,而無需等待支持。”
目前有兩種方法可以應對公民數據科學。首先是讓數據科學團隊為大家建立或提供自助服務工具。另一種方法是讓業務部門獲取自己的工具。前一種方法可最大程度地減少工具蔓延。還可以最大程度降低風險–通過確保對數據和數據使用進行管理和保護。
Ammanath說:“如果你在此過程中處于非常領先的地位,那么在整個企業中擁有公民數據科學是至關重要的,因為你希望他們能夠進行自己的數據探索。但是,如果你還處于早期階段,那么讓每個人都可使用數據可能是沒有意義,因為你需要了解數據的質量和背景信息。”
數據科學家向誰報告?
數據科學團隊可以向首席執行官、首席運營官、首席財務官、首席信息官、首席技術官,首席行政官、首席數據官或其他高級管理人員或副總裁報告。該團隊向誰報告將影響該團隊所做的工作。根據Anderson的說法,首席營銷官可能過于關注產品,首席財務官可能專注于規避風險,而首席技術官或工程副總裁可能不了解數據科學與軟件工程的區別。
Ammanath說,數據科學團隊應該向CAO或CDO報告,因為擁有集中的數據科學職能非常重要。否則,該舉措會變得狹窄而迷失。
該團隊向誰報告通常取決于其組織方式。有些企業創建集中的數據科學團隊。在其他公司中,業務部門雇用自己的數據科學家。對于更成熟的組織,第三個選擇是將這兩種結構組合成中心輻射型模型,該模型具有卓越中心,由具有特定業務領域專業知識的數據科學家或數據科學團隊支持。
你需要CAO還是CDO?
CAO和CDO的角色經常被混淆。企業可能會混淆使用這兩個職位頭銜,而沒有考慮它們之間的差異。大公司可能同時兼有這兩個職位。
Anderson說:“首席分析官通常具有很高的分析背景,而首席數據官則可能具有數據工程背景,也許是數據倉庫甚至是DBA(數據庫管理員)背景。”
你是否應該雇用CAO還是CDO?答案是肯定的,如果你的企業足夠成熟,你可以適當地支持這些職位,而且你會意識到需要這種級別的責任。大公司往往會創建該職位,他們會發現對該職位的需求很明顯。
責編AJX
-
數據采集
+關注
關注
39文章
6245瀏覽量
113923 -
大數據
+關注
關注
64文章
8908瀏覽量
137660 -
數據科學
+關注
關注
0文章
166瀏覽量
10082
發布評論請先 登錄
相關推薦
評論