【拓墣專欄】AI 時代的創造力,微軟、Google 都搶著要的人才要素是什麼?
「AI 可能是有 3 個大腦(指決策、預測、分類):可深度學習,憑深度學習就能讓 5 成的人失業。」創新工場董事長李開復在近期的演講直指 AI 對於就業市場的影響。
AI 技術與日俱進,導入領域也不斷擴大,當然也為各產業帶來不同程度的衝擊與影響,若從拓墣統計的數字來看:AI 機器學習應用最大宗就是金融與資訊安全,占比 20%,其次是數位廣告科技的 18%,前兩大產業都與大量的數據息息相關,也成為 AI 最快、最容易切入的領域。
而如此龐大的產值佔比是否意味著對原本的工作機會造成影響?無論是從應用別分布數據、或是近一年來媒體揭露的金融業裁員消息來看,AI 時代來臨,首當其衝的不外乎是已經發展成熟的金融產業,海量的數據判讀、預測、分析已經逐步能由 AI 取代,而受到最明顯的衝擊。
這是否也意味著 AI 時代的來臨,我們都有可能被機器人所取代?
或許也不用這麼悲觀。
儘管許多工作機會因為 AI 技術的成熟而逐漸消失,新興工作機會卻同時正快速地增加,其中就以能掌握數據、分析數據,並且能從數據中找到商業價值的「資料科學家」、「資料分析師」一舉成為職場的明日之星。
「資料科學家」、「資料分析師」的人力缺口究竟有多大?實際從 Linkedin 搜尋這兩項職缺,全球就有近兩萬筆相關職缺訊息跳出。而根據微軟的說法,台灣就有超過 10 萬名的資料科學家職缺,然而目前卻只有 1,800 多位的資料科學家,看到了這個缺口,而讓微軟開始進行資料科學家的認證培育計畫。
那麼,到底資料科學家、資料分析師需要具備什麼樣的條件?想要在一個 AI 盛行的新時代,三項基礎能力是我們必須具備的:「程式語言能力」、「統計學知識」、「跨領域知識」(Domain Knowledge)。
程式語言能力
對於將資料導入實務應用的工作者來說,如何讓 AI 按照需求行動將會是一門重要的功課,AI 的開發除了硬體能例外,背後也有著無數的演算法與軟體應用相搭配,才能讓 AI 正確收集、理解、應用大量資料。
現在各家國際軟體平台大廠所提供的開源框架(Open Source Framework),都是針對降低 AI 系統開發難度所推出,目的是要吸引更多應用開發夥伴一同加入,越大的開發者社群,就能將語言框架的結構設計更為完備、同時降低新人加入的門檻。
目前這些開源框架都是建立在既有高階程式語言的基礎上,以 Python 和 C++ 為主流。我們也可以從這些國際廠商的發展動向推估,AI 的時代來臨將會推升學習 Python 和 C++ 等程式語言的重要性。
統計學知識的重要性
有了程式語言能力作為基礎,處理數據及數據可視化的能力也是不可或缺的。
而上述的數據處理能力正是建構於統計學的知識,將大量資料變成更有價值的資訊。
統計學概念在機器學習上也扮演相當重要的角色,因為現在的AI系統其實都是透過模擬人腦的架構進行學習,利用輸入大量 Data 的方式,從中統整出一套規則,因此專門應用於大量數據處理與迴歸分析的統計學自然不可或缺,透過機器學習讓 AI 得以提升模預測精準度,並不斷藉由不同算法自我提昇。
關鍵的 Domain Knowledge(跨領域專業知識)
具備了工具使用的能力後,累積跨領域的專業知識,將是 AI 時代中,能否成為搶手的資料科學家關鍵環節,畢竟只懂數字、但對需求產業不理解,也無法在該領域中發生作用,如同一個文字運用能力頂尖的工作者,如果對於時尚產業完全不理解,也難以寫出關於時尚產業的優秀文章。
因此,除了分析數據的統計學知識,並利用程式語言作為輔助工具外,了解個別產業的專業知識,進而能以切中要害的命題、資料分類,靈活地解析數據或判讀資訊,才能從中找到真正的商業價值。
最終,創造力也是不可或缺的一環
工具、知識皆能掌握後,創造力也會是資料科學家不可或缺的要素,資料的累積與分析經驗,固然將成為判讀數據資訊的重要依據,但從不同的面相出發並透析出更為難解的資訊,也是資料科學家或分析師得以出類拔萃的重要指標。
包括產生全新的特殊命題與分類、從新穎的角度切入與解讀數據,進而產生全新的商業價值,並讓 AI 能借此跨入全新的領域,也將是資料科學相關工作的重要特點。