2017-01-11

優質工作1 : 21世紀最性感職業 洞見未來的資料科學家

DSP智庫驅動 吳柏翰
在巨量資料浪潮來襲,資料價值日益高漲的時代,資料科學家怎樣站上浪尖,打造藍海的傳奇?早在6年前便投入巨量分析領域的DSP智庫驅動技術長吳柏翰認為,資料科學家最重要的價值,在於從資料中發掘Insight(洞見),提出更好的策略,協助企業改善營運狀況並提升營運的品質,創造企業的競爭力。

從錯中找出對的,提煉資料的價值

所謂「資料科學家」,是取其像科學家一樣對事物具有強烈的好奇心和研究、探索、找答案的精神,資料科學家也是透過觀察數據,提出假設,然後再去驗證結果。尤其在工業4.0時代,隨著雲端運算技術成熟,物聯網興起,每一個人的消費模式、生活行為,都可被數據解構,而資料科學也成為市場的新顯學。以往企業大多是靠資料分析師、資料庫管理員等,從大量數據中歸納分析出有用資訊,「但資料本身它是死的」,吳柏翰指出想要創造資料的價值,最重要的是要在這堆資料、數字中,找到關鍵的洞見(Insight)。這也是資料科學家與分析師的不同之處。

「資料分析師其實在做的是商業分析,比較Detail,透過縱觀的分析找出對公司有幫助的地方,再進一步做研究」,但資料科學家是橫向的、跨領域的分析,在一堆資料、研究報告中,找出可以解決企業問題的方法,幫企業擬訂策略,或是編寫程式建立模型,幫問題找到解決之道。他以LUXGEN汽車導航的智慧搜尋為例,一般車主導航時者常會講錯話或是輸錯字,他和工作團隊從累積的錯字去做分析,了解這些錯字比較常出現在哪些對的地址上面,並建構一個Model(模型),讓車主即使輸/說錯地址,也能導出正確方位,把資料轉換成商機,創造最大的價值。

跨領域整合能力,讓資料分析更有創意

想要幫客戶解決問題,量身打造一個全方位的策略,必須能夠深入洞察外在環境與公司內部,所以資料科學家面臨的挑戰,不只是技術面的運算方法,還包括了解產業、發掘問題以及解決能力。吳柏翰認為不管你在什麼產業,都要先掌握那個產業的Domain Knowledge(領域知識),「資料通常是跨領域的,每個行業都有資料,這是橫向的」跨領域的整合能力,才能讓資料科學家的視野不受侷限;尤其要提出一個好的解決方案,有時還必須橫跨製造部、研發部、行銷部、業務部等,唯有全方位整合,才能幫企業開拓新藍海。

跨領域的整合能力,也反映在DSP團隊的履歷上。除資訊相關科系外,還網羅不同領域的人才,有念土木、海洋、電機及統計,「重點是你必須喜歡『玩資料』,對資料研究有興趣!」吳柏翰以自己為例,大學讀電機工程,碩博士念資訊管理,除熟悉軟體外,還選修統計學,不斷涉獵不同領域知識,因資料科學家並非從資料中萃取已知的結論,而是在巨量資料中去蕪存菁,創造出具有競爭力的營運決策,而來自不同領域成員,往往可激盪出不同的策略思維,讓解決方案更具創意。

系統整合+資料分析,創造競爭優勢

專業技能包括資料探勘、機器學習、人工智慧或是統計學、最佳化理論這些跟數據分析相關的理論課程,以及Python、Java程式設計,SQL、R、SAS、Excel、Hadoop等軟體,都是入門的「基本功」,「不僅工具用的廣,理論也要理解的深,才有辦法綜觀的去做數據的分析、評估」;專長軟體工程、資料探勘的他在程式語言上也不斷自我要求,更創下2015年GitHub國際開發貢獻排行榜上,R語言為世界排名前5%,Python語言為世界排名前1%等紀錄,因為他認為一個優秀的資料科學家要懂怎麼去寫程式,才有辦法跟工程師溝通,了解如何把演算法放到系統上面,完整呈現資料科學的成果,不能資料歸資料,系統歸系統,唯有系統整合跟資料分析同時都懂,才能前後端連貫,提供客戶一個全面的解決方案,創造價值。

理論實務+團隊跨域合作,發展潛力無限

資料科學需要『理論實務+團隊跨域合作』,資料分析更要朝對企業有幫助,對營收有幫助的方向去發揮,成果才會有真正恰當的價值。目前台灣專業的資料科學家粗估近1,000位,每年需求成長1.5倍,大多具有碩、博士學歷;一般學士則多從資料工程師開始累積實力,薪資更是令人艷羨。每個產業都需要資料科學家,吳柏翰建議想投入資料科學領域的人,除了要具備好奇心,喜歡玩資料,以及跨領域整合能力外,心態也很重要。資料科學著重Team Work,不能只埋頭在電腦前,跟人的溝通也很重要,而尊重更是與人溝通的基本態度!放下身段和不同領域的人虛心學習、溝通,才能汲取不同養分,累積實力。

資料來源: 經濟部產業專業人才發展推動計畫(經濟部工業局廣告)

延伸閱讀: 2016工作優升學-跨產業共通PDF ,跨產業共通優質工作共七項。
http://hrd.college.itri.org.tw/TDI/GoodJob/GoodJob.aspx

沒有留言:

張貼留言