你聽過「資料科學家data scientists」嗎?這個名詞,在2005年就已經誕生,但直到2011年海量資訊興起後,才廣為人知;如今,資料科學家是職場中最炙手可熱的明星職位,《哈佛商業評論》甚至稱它為「二十一世紀最性感的工作」!

科技新顯學,取得百萬年薪的門票!

資料科學家有多「性感」?讓我們很現實地從薪資說起。根據美國商業智慧軟體公司SiSense調查研究指出,資訊分析相關人才起薪約為年薪5.5萬美元,換句話說,相較美國大學畢業生平均年薪為4.76萬美元,高出7400美元,而最高薪的資料科學家,平均年薪為13.2萬美元,打敗一票如蘋果、高通等大型科技公司的高階工程師。

這三年來,海量資料成為科技顯學,資料科學家趁勢崛起,薪資因此不斷成長。美國北卡州立大學於2007年特別成立分析科學碩士班,根據他們對畢業生進行的調查,2010年時沒有任何經驗的碩士畢業生,平均起薪為年薪6.85萬美元;但2012年,薪資已經提高至7.71萬美元,短短三年間,升幅達12.5%!

美國資料科學家的行情如此,台灣資料科學家同樣早就擺脫22K的緊箍咒。據了解,台灣如金融、電信等各企業,因資料是其重要命脈,為不假手其他外部資料探勘公司,正在著手建立自己的「資料部隊」,所以人才需求殷切,可是,台灣的資料科學家卻嚴重不足,求過於供之下,他們的薪資跟著水漲船高。

根據一位資料軟體相關業者指出,具備資料蒐集與分析的碩士畢業生,「起薪起碼44K起跳!」他指出,如果有一年至兩年經驗的資料探勘人才,平均月薪甚至領到七萬元,都不是問題,換句話說,當上資料科學家,等於擁有一張年薪百萬元的入場券。

資料科學家能坐領高薪,證明他們並非尋常的資訊工程師。《哈佛商業評論》給資料科學家下了一個定義:「資料科學家是懂得從今日如海嘯般非結構化資訊中,撈出重要商業問題解答的一群人。」事實上,資料科學家不只是要像哥倫布般,在茫茫大海中打開探照燈,找出有用的資料,還要如偵探小說家愛倫坡一樣,審視手上的資料,推理出問題的答案。

那麼,資料科學家到底該如何養成?在資料分析領域浸淫十多年、今年37歲尹相志稱得上國內首屈一指的「資料科學家」。他創辦的亞洲資料採礦公司,已經成立11年,旗下有20多位資料科學家,客戶遍及國內三大電信巨頭以及眾多保險、金控公司,在外商環伺的資料分析業中,是少數成功崛起的本土專業公司。

回想起自己2000年踏入資料探勘領域時,台灣幾乎沒有專家能夠教他,於是他主動寫信給國外鑽研這方面領域的學者,參加相關課程,擁有台大化學系、新聞研究所學歷,背景橫跨理工與文法的他,由於數學底子深厚,迅速從一個門外漢,變成出版十多本相關著作、到各企業演講、赴美國接受微軟創辦人比爾.蓋茲頒獎的專家人士。

他指出,資料分析有三大步驟:第一步是整理、撈取資料,資料科學家不一定要會寫程式,最重要的是懂得運用分析工具與軟體。第二步是建立模型(建模),從資料中推導出合理而正確的結果,並清楚簡單地呈現給客戶。第三步,也是最困難的一步,就是具備幫客戶解決問題的能力,甚至早客戶一步,發掘和預測新的趨勢。

舉例來說,當電信公司拋出「合約到期時,手機用戶會不會續約?」的問題,資料科學家不但要回答「手機用戶續約的機率」、「哪些族群傾向不續約」,還得告訴電信公司,手機用戶是「因為什麼理由不續約」、「他們接下來會去哪一家電信、申辦什麼方案、買哪一款手機」,對每一項深入追問,資料科學家都必須要找出資料,並運用資料來回答問題。

「所以,資料科學家起碼要懂三種基本知識:統計方法、建資料庫和domain know-how(領域訣竅)」,尹相志表示,尤其對個別領域的專業知識,格外重要,關係到能不能在浩瀚資料海中「問對問題」。「我們能在市場存活這麼久,最主要原因就是我們十多年前就在這領域打滾,已經累積出對某些產業的知識,不容易被取代。」

本土資料科學家崛起,掌握民情法規,才能因地制宜

「除個別領域的訣竅外,資料分析還是一門本土化程度很高的技術!」全球最大的商業分析軟體公司賽仕(SAS)台灣分公司副總經理蔡宜真強調,充分掌握對本土市場的民情、法規等變化,才能因地制宜,降低偏誤。以SAS台灣分公司而言,約有三十位資料分析師,清一色都是本土人才。

資料科學家若對本土市場,或領域訣竅不夠熟悉,就會鬧出笑話。尹相志指出,曾有一家電信業者聘用外商建立「手機用戶流失模型」,但這家外商不知道台灣手機合約通常綁約兩年,外商把資料分析完後,他們告訴這家電信業者:「用戶約滿二十四個月時,就會開始大幅流失!」可是,對電信業者來說,這根本不算「流失」,而是常識。

同時兼具本土與領域訣竅的人才,並非一定要拿到資料處理學歷,才能當上資料科學家,在國外,往往是物理、化學、數學背景人才最被青睞。尹相志指出,資料探勘不是新學問,大都是概念從其他學科借用過來。他表示,例如資料的分類整理方式,就是沿用物理熱力學亂度的概念,而建立客戶評分卡,則是運用動物學的聚落思維。所以,許多資料探勘技巧,透過其他科系的嚴謹邏輯訓練,都能觸類旁通。

「其實資料探勘的技術,已經愈來愈不稀奇了,」尹相志表示,現在資料蒐集和分析技術都已不是障礙,資料科學家最重要的價值是,能夠透過分析各式各樣的資料,回答客戶千奇百怪的提問。曾經,他也曾疑惑,「資料科學家會不會只是看圖說故事、只會說空話的行業?」但他現在看到數據分析的結果,一一落實成各企業的策略,真正能替企業提升效率或節省成本,他開始相信,這是一份有意義,又有價值的工作。

轉自財訊雜誌

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Win Driver Blog 的頭像
    Win Driver Blog

    Win Driver Blog

    Win Driver Blog 發表在 痞客邦 留言(0) 人氣()