當數年前雲端及大數據概念開始興起的時候,企業數碼化已經是不可逆轉的趨勢。現在中小企已能透過數碼應用(如電子商貿、網站、雲端應用等)及公開渠道累積大量數據,加上分析軟件的價格因技術成熟及競爭激烈而有所下調,令數據分析已不再是大企業專屬技能。數碼化的時代下,企業現時追求的正是透過數據分析,為顧客提供更精準、更貼心的服務及產品,增加顧客體驗的同時,減少無謂的推廣開支。當中隨之伴生的,正是市場對商業智能分析師(Business Intelligence Analyst)及數據科學家(Data Scientist)的龐大需求。
這兩者有甚麼分別呢?商業智能(BI)主要透過整合歷史數據進行數據分析,並以圖像化表達方法去找出數據當中的商業價值。當中牽涉數據的質素一般較高及真確,以產生詳細報告及KPIs(關鍵績效指標),能夠看到過往趨勢,但對未來的展望較為缺乏。而數據科學(Data Science)則不斷從不同渠道發掘及更新相關數據,並利用統計學模型及機器學習技術去預測關鍵商業問題。
如果你也有興趣成為當中一分子,不妨朝以下方向學習增值:
商業智能分析師
.資料庫處理—包括數據探勘及資料庫設計 / 發展 / 建置 / 整合等技巧,當然不少得SQL等資料庫程式語言。
.商業領域知識—須要深入了解相關行業的商業運作及發展方向,以建議分析及計算方法。
.溝通技巧—須要經常與一般使用者及公司高階主管互動,並回應來自各方面對於提供戰略性決策輔助資訊的要求。
數據科學家
.程式編寫技術—包括統計程式語言如R、Python,以及資料庫程式語言如SQL。
.統計學知識—作為數據科學家,你須要了解統計學相關知識,如統計檢定、分類、最大概似估計量等等,以決定手上數據應該採用甚麼統計模型作有效分析及預測。
.機器學習技術—掌握應用機器學習技術甚至如何從頭開始構建,如回歸、樸素貝葉斯(Naive Bayes)、支持向量機 SVM(Support Vector Machine)、神經網絡等。
文:黃家偉
香港電腦學會(HKCS)專業及事業發展小組總監,現於香港生產力促進局任職資訊科技部總經理。