Big Data發展創意前瞻運用 提升研究中心跨領域合作

為強化校內各學術部門互動以及跨領域合作,4月21日特舉辦研究中心跨領域合作提升研討會議,陳良基副校長主持,Intel-臺大創新研究中心承辦,以「巨量資料分析(Big Data)」為題,邀請校級各研究中心主管、相關產官學界人士分享Big Data的概念與應用實例,並分為人類行為資料(Data of the people)、人類產製資料(Data by the people)、人類運用資料(Data for the people)三個子題進行分組討論。

楊泮池校長在開幕致詞時表示,Big Data在人文社會、理、工、醫、農等科學皆有運用的潛力,臺大在各個學術領域都具備優勢,但各領域交流的機會並不多,若能透過此次會議,增進跨領域的合作,強化學際互動,相信很快能為Big Data發展出有創意且具前瞻性的運用。

Big Data的特徵:巨量(Volume)、多元(Variety)與速度(Velocity)

會議的上半場,在Intel-臺大創新研究中心暨資訊工程系許永真主任的引言之後,旋即由Intel-臺大創新研究中心「資料分析」計畫主持人暨臺大計算機及資訊網路中心程式設計組組長林守德教授解釋Big Data的概念。相較於過去的資料庫分析,Big Data所處理的資料量極大,不再只使用單一的存取與分析工具,並且須同時考慮不同的資訊型態,處理過程更強調時效性,「拿到數據的當下若不立刻處理,可能一陣子就沒用了。」隨著物聯網(Internet of Things, IOT)的興起,Big Data開始被廣泛運用於健康醫療、零售製造及災難預警等產業,而愈來愈多的產品裝有可蒐集使用者資訊的感測器(sensor)。如何處理來自不同產品的感測器所蒐集的資訊,並進行有效的分析及運用,是未來Big Data所面臨的挑戰,其中「資訊傳輸成本」便是一例。林守德表示,在物聯網時代,行動裝置雖可發揮蒐集使用者資訊的功能,但將資訊傳輸給資訊處理系統的過程中,仍需消耗大量的能量,未來應致力於提高資訊傳輸的效能,極小化傳輸成本。

資訊工程系林智仁教授進一步比較「Small Data」與Big Data的差異。他表示在過去Small Data的年代,只要一臺電腦,加上合適的資料分析軟體,就能滿足作業需求。而這些軟體經過長時間的改良設計,介面已經相當地人性化(easy to use)且容易上手,因此分析資料時並不會遇到太多的難題。「然而,目前並沒有For Big Data的軟體。」林智仁表示,Small Data與Big Data概念上的不同,在於Small Data是將所有資訊集中在一臺機器上,使用同一套軟體進行分析;而Big Data的資訊並非僅存在一臺機器上,每個機器的資訊量都非常龐大,光是要存取這些資訊就是很大的困難;此外,傳統分析軟體的設計邏輯是先有模型(Model),再根據模型導入數據進行資料分析,Big Data的邏輯是從大量資料中萃取、歸納出可能的模式再進行分析,這是完全不同的架構。林智仁認為要儘快設計出適用於Big Data的資料分析軟體,才有助推廣Big Data的運用,但他也說:「有時候用簡單的方法,或許就能達到效果。」強調Big Data並非是用來取代傳統Small Data,而是能提供解決方案(solution)的另一種分析途徑。

Intel-臺大創新研究中心計畫主持人、國立臺灣科技大學的李育杰教授認為,過去10年由於資通訊技術的高度發展,資訊的產製過程,以及資訊蒐集的方式,都已經發生極大變化,因此Big Data的發展勢不可擋。然而要進行大規模的資訊處理,必須建置系統化的資料庫,此時資料庫的安全與監測,便成為非常重要的課題;而大量資料分析的過程中,如何檢測出離群值(outlier)減少誤差,提高統計分析上的信心水準,都須仰賴監測系統,因此他與鮑興國教授正在發展一套監測機制,期能減少在Big Data的分析過程中因outlier所帶來的外部成本,並強化分析的效果。

資訊視覺化(Data Visualization):讓資訊自己說故事

土木工程系康仕仲教授致力於Big Data的視覺化工程。他表示,透過資訊視覺化,可以比單純的數字更易於觀察出趨勢的變化,而資訊圖像也能幫助社會大眾解讀複雜的資訊。這是一個進入門檻高、必須仰賴專業人士及工程視覺化技術人員通力合作的領域,但他相當看好未來的發展;資訊工程系校友、現任聯合通商電子商務股份公司薛文蔚副董事長則認為,比起硬體的進步,軟體科技方面的進展是比較落後的,在Big Data的潮流下,研究者應從運用層面思考,尋求資訊科技軟硬體共同升級的可能性。這也呼應前述的資訊視覺化工程,成為未來有潛力的主流發展方向。

臺大計算機及資訊網路中心顏嗣鈞主任也分享了Big Data概念的實際運用,2013年啟用的「臺大觔斗雲服務(NTU cloud service)」,結合了雲端運算與Big data,提供全校師生全方位的E化服務,未來規劃將此一服務推廣至社會,並提供技術給有需求的企業,希望透過產學合作計畫,加速Big Data相關技術的普及與產業的升級。

跨領域Big Data運用與發展現況交流分享

會議的下半場,由系統生物學研究中心郭明良主任、神經生物與認知科學研究中心黃從仁教授與分子生醫影像研究中心曾文毅副主任分享Big Data在人類行為學與醫學上的運用。他們認為從微觀的DNA到巨觀的社會群體決策行為層次,Big Data都有可發揮的空間,尤其是資訊視覺化,可運用於腦神經網絡的照影以及磁振造影(MRI)等技術;而在進行遺傳行為學研究時,為了解不同個體間的差異,需要分析大量樣本,無法透過單一的電腦與硬碟處理,未來只會更加仰賴Big Data。而以人類行為學來說,不同地區、種族的人會因基因與文化的差異,而有不同的行為模式,累積的資料量也是相當可觀。為了深化本土化研究,目前各研究中心仍在積極研發適用於臺灣的Big Data的分析軟體,希望能協助本土醫學研究的發展,並為改進臺灣公衛醫療政策提供指引。

而資訊工程系徐宏民教授、人文社會高等研究院林建甫副院長以及數位人文研究中心項潔主任分別就人類所產製的各種資料,如照片、文字、影像、金流與歷史文物數位典藏內容等,探討Big Data的應用可能性及實際運作成效;徐宏民表示,隨著具備攝影功能的行動裝置逐漸普及,「影像」的產製與分享,成為Big Data中最具潛力的應用形式;而過去經常用於安全、醫學、定位系統等專業領域的影像分析資料系統,如今也跨足文化、商業以及消費性應用,例如服飾業者將服裝數位圖像化後,透過電腦模擬技術,消費者便可以在網路上「試穿」最新款式的衣服,此即為Big Data在商業層面的應用實例。林建甫以「第三方支付」為例,分享Big Data趨勢帶來的商機與挑戰,他認為行動支付會是未來主流,電信公司、銀行、第三支付單位,以及行動裝置軟硬體廠商皆有從中獲利的機會,然而消費者個資以及消費資料的安全性,則是第三方支付架構中必須考量的重點。項潔以臺灣歷史數位圖書館(Taiwan History Digital Library, THDL)為例,表示單一歷史事件對歷史研究沒有太大的意義,唯有透過數位典藏方式,系統化蒐集大量史料,才有助於研究臺灣過去的社會及經濟發展。

最後由氣候變遷與永續發展中心郭鴻基主任、生醫暨科技倫理、法律與社會中心蔡甫昌主任,以及中國信託慈善基金會兒少暨家庭研究中心薛承泰主任分享Big Data在自然科學、法律及倫理的跨界運用。郭鴻基主任致力將Big Data與物理學、自然科學結合。他以過去曾侵襲臺灣的颱風路徑統計模型為例,表示透過大量資料的計算與驗證,可以歸納並預測出不同路徑的颱風對臺灣造成災害的嚴重性,有助於建立災害預警機制及降低損失。蔡甫昌主任則從醫療、倫理與法律等社會問題的角度切入。他表示Big Data涉及大量個人化的資訊交換,過程中個人隱私能否受到保障,而相關法規是否已經有完整配套等,都是發展Big Data時不可忽視的重要課題。為了降低Big Data對人類社會文化的衝擊,必須發展完善的風險評估與溝通機制,才能化解安全疑慮,減少公眾的不信任感。薛承泰主任也認為Big Data有助於政府推動社會政策,且能提升施政效能,但在設計資料庫系統時必須考量資訊安全性,承辦官員執行政策時,也應恪遵倫理與法律,才能確保人民權益不受侵害。

在會後的分組座談中,與會人員表示對於Big Data的概念與應用有更進一步的理解;而透過不同領域的溝通對話,與會人員皆認為可藉此激盪出不一樣的火花,對此次承辦單位-Intel-臺大創新研究中心給予極高的評價與肯定,並且期待未來跨領域的合作能發揮更高的成效。(文:邱柏勝)