2015-12-10

應用大數據掌握未來產業人才需求與前瞻技術

產業人才的充足與否為產業發展的關鍵要素之一。對國家總體而言,具有發展前景或影響國家經濟甚鉅之重點策略產業,不僅會投入大量的國家資源,且其成敗將影響未來數年的經濟成長,而投入資源推動產業人才發展,將是產業成長的重要關鍵。因此,掌握國內產業人才需求作為產業人才發展的規劃基礎,有效推測現有人才能否支撐產業成長,始終為各國重點工作之一。

產業人才需求架構,可分為量化需求推估與質性需求調查兩個部分。在量化需求推估部分,目前各國預測人力需求的方法,主要是依據產值、營業額、服務案件總量等等預測指標,透過經濟計量模型(例如: 地中海模型、線性或非線性模型等)推估人才所需數量。在質性需求調查部分,對未來工作及其技能內容的研究,多半採大規模調查方式進行。以歐洲職業訓練發展中心(European Centre for the Development of Vocational Training, Cedefop)對綠色經濟下的綠色工作為技能為例,即是先定義工作或技能的類型後,依據各職業進行調查與專家意見的校正。

普遍而言,質性需求調查的過程大多維持問卷調查或廠商深訪的方式,過程不僅耗費人力、時間,分析結果也容易受資料來源及取樣數不足等因素影響。然而,隨知識類網路資訊的快速成長,如專業科技媒體的即時科技趨勢報導、以及各專業領域的專利資料庫,形成活躍的專業知識探索與科技趨勢資訊來源,因此有學者開始嘗試透過自動化技術,針對非結構資料(如:文字、圖片或影音等資料)進行資料探勘,例如Santo, Coelho, Santos, & Filho(2006)針對國際級科技論文、專利文獻進行文字探勘分析,萃取出奈米重點科技關鍵字並做統計分析,並進行國際奈米科技發展趨勢與重點議題之比較。此外,Litecky, Aken, Ahmad, and Nelson(2010)以網頁內容探勘的方式,運用各式工作搜尋引擎(Monster.com, HotJobs.com與SimplyHired.com),從2007年7月到2008年4月近25萬筆不相同的IT相關工作描述,找出電腦工作領域中20個工作類別與其相關的技能。又如Smith and Ali(2014)亦以網頁內容探勘的方式分析電腦程式設計的工作,指出HTML5、JQuery、PHP等網頁開發新技術的未來趨勢。而近年又隨著巨量資料的技術日漸成熟,巨量資料分析技術挾帶著3V的優勢:大量資料(Volume)、即時性(Velocity)與多樣性(Variety),不僅突破了傳統資料處理與分析的觀點,更間接強化了資料探勘的效能。換言之,若能運用平行計算直接針對學術及產業在技術發展過程中產生的大型且多元的資料進行即時探勘,將有助於提升我國產業人才需求與前瞻技術預測的效率與廣度。

以國內軟體工程師的人才需求探勘為例,透過國內廠商職缺需求的長期觀察(如圖一所示),除了能以產業別進行分析了解哪一種產業的職缺需求最高之外,也能從時間軸度上洞悉國內軟體資訊相關職缺需求的趨勢變化,作為未來相關培訓與教育相關政策措施的重要參考。再者,依據職缺需求的地理分布,則可迅速掌握我國產業群聚的主要特徵,在經過交叉分析與視覺化效果的處理,當前國內哪個地區的何種產業對於軟體工程師的需求最大?約有多少職缺便能一目了然。 這對於政府用來掌握動態的即時人力需求並提供適當的政策資源,實具有應用上的優勢。

圖一、我國軟體工程師職缺需求資訊平台
然而,欲探索未來軟體人才需求與前瞻技術,僅具備現有廠商職缺資料庫是不足的,所需新增探索資料本質可能需更具備前瞻特性,且可能散佈在不同管道以多元的形式存在著。換句話說,資料擷取與探勘的相關技術必須導入大數據分析中進行應用。以輿情資料為例(如圖二),相關議題的貼文數與分享等聲量變化,往往隱含著背後的意義,貼文數(Post count)一般意謂著議題的熱度,而網友的偏好度(Like)為正反向情緒的表徵,至於分享度(Share)則是一種輿情效應的擴散指標,因此透過分析網路行為資料,探詢使用者的意圖與動機,亦為探索潛在軟體人才需求與新興技術的一種新方式。

圖二、國內軟體工程師相關職缺之輿情分析
而關於大量解析非結構化資料,包括運用文字探勘技術分析多重來源之資料庫,則為巨量資料分析的主要技術核心。一般而言,探勘的程序為將非結構化資料來源,轉換萃取成為可以重組、重複運用之結構化資料,進而利用語意分析,擷取整併具有議題意涵之技術議題關鍵詞,再搭配時間、頻率等因素分析,以推測產業中重要議題之消長樣態。以軟體工程師未來前瞻技術的探勘而言,對產品技術資料進行探勘(例如:維基百科、Google與線上圖書等產品技術資料庫)進行技術關鍵詞的頻次分析及技術消長趨勢分析,便可初步觀測軟體技術未來的趨勢變化,如圖三所示。

圖三、軟體技術趨勢變化圖
從長遠的觀點來看,應用大數據方法來掌握人才議題或進行探究,所主張的是透過既有資料庫以及網路資源的再利用。儘管這樣的資料在結構性上不如以往問卷設計型態嚴謹,但主要在於提倡當今資訊爆炸時代下的「資料回收利用」理念,嘗試提升人才需求分析工作的效益,在資料來源取得的階段不僅更能大量(Volume)、且也更為「環保」。此外,針對非結構資料,運用巨量資料分析方法不僅可迅速提升處理異質資料的效能,對於未來人才需求質性分析的資料廣度掌握上亦能更為包容,讓人才需求分析更為「即時」且內容更具「廣度」,有效掌握產業人才需求樣貌,以協助政府人才相關政策擬定。

作者:歐宗霖/工業技術研究院產業學院副研究員

沒有留言:

張貼留言