臺大特色課程系列報導— 社會科學院經濟系「資料科學與社會分析」學士班跨域專長

隨著科技發展與社會需求的變動,傳統的領域學門間的界線,越來越模糊,而當代社會面臨的問題,也常需要透過跨領域的新思維、新方法、新工具來解決。「資料科學與社會分析」學士班跨域專長旨在培養具備社會科學領域知識、與資料及量化分析能力之跨域人才。課程設計以本院各系專業課程為基礎,訓練學生對當代經濟、政治、社會等議題的分析與洞察力,再結合本院及跨院有關資料科學的核心課程,建立學生對計算機與程式應用的專長。通過此課程的訓練,學生將同時具備觀察問題、蒐集資料、分析資料、及解讀分析結果的能力,從而在數位資料日益豐富、演算工具日新月異的趨勢下,得以掌握先機,回應新時代的社會需求,解決新時代的社會問題。

基此,本跨域專長針對社會科學院現有的課程進行跨系所整合,並將課程架構共分三個層級。(如圖)

第一層級(Level 1)基礎共同課程:學生於大一時修習。目的在於培養未來學習所需的基礎學習能力,以及探索主修興趣。主要課程包含:

共同必修。

通識課程:寫作語文、溝通協調、媒體資訊素養、設計思考、美學與倫理等相關課程。

社科院學生另需修習社科院大一必修,含系所導論課程,如政治學、經濟學原理與實習、社會學甲、社會工作概論課程。

資料科學與社會研究導論課程:本跨域專長的必修課程。乃由本課程規劃、開設,目的在於介紹資料科學在社會科學各領域應用的最新發展、分析工具的介紹、以及各社會領域所關切的與資料科學相關的問題。

第二層級(Level 2)核心專業課程:以本院各系專業課程為主,培養學生專精的領域知識。學生至少修滿本院各系大二以上必修科目9學分課程,培養單一領域的核心知識。

第三層級(Level 3)跨域專長課程:加強社會科學院學生的資訊科學能力,強化各領域知識與資訊能力的結合應用,以提供學生把「領域知識」與「資訊能力」結合應用的機會與視野,培養未來的資料科學家。此層級課程可進一步分為如下三個群組:

計算機相關課程:分為資料結構與演算法(資料)、程式設計(程式)、商管程式設計(商程)等三個模組,讓學生得以選擇不同的專長能力。

跨域應用課程:以社會科學院各系所課程中與資訊技術應用與量化分析相關的課程為主。利用既有課程,讓學生學習如何將各領域知識與資訊能力結合應用。

總整(capstone)課程:本跨域專長之重點課程之一,屬必修課程。是以實作方式,讓學生有機會應用此跨域專長所學,展現學習成效。

本跨域專長不僅整合所有各系所相關課程,經濟系林明仁主任與新聞所謝吉隆副教授亦跨系所合作,開設兩門課程:一為本跨域專長之必修課「資料科學與社會研究」;二為107-1首開課程「社會科學程式設計」。

「資料科學與社會研究」固定於上學期開設,107-1已是第二次授課,其中非經濟系同學占了三分之一左右。107-1首次開設之「社會科學程式設計」共有約七成非係屬經濟系學生。由此看出,本跨域專長雖開設僅一年多,卻已有足夠的吸引力,讓許多非經濟系,甚至非社科院同學修前來習第二專長。

「資料科學與社會研究」主要是為銜接社科院系所的統計能力,尤其是協助學生學習獲取資料的方法(開放資料、網路爬蟲、Web API)以及理解資料儲存的格式與取用方法。此外,本課程亦邀請多位校內外、產學界的資料分析專家學者,講述其如何分別應用資料科學方法在心理學、經濟學、社會學、政治學等各個不同的領域,乃至於公共事務關懷等。

相較於「資料科學與社會研究」重視產業案例,「社會科學程式設計」則著重Python程式語言教學,著重資料獲取、文本探勘和建模,延請專家均為程式設計教學的能手,包含來自台大資工自然語言實驗室博士後研究員、QSearch臉書社群輿論服務公司、龍捲風社群輿論監控公司、GliaCloud人工智慧媒體整合團隊等的領域專家實際進行程式教學。除此之外,一改過去資訊科系程式語言訓練著重在程式語言的全面理解,此課程以人文社會科學著重在問題解決之面向出發,課程第一堂課便從「計數」開始,以解決問題的實用導向爲教學方式,透過實作學習程式語言。

這兩門全課程有以下特色:

採用授課教師與外聘講師自編教材與實際案例教學

為提高學生學習興趣並同時了解社會問題,故自主開發教材,各週分別以台北市竊盜案、空污、Youbike開放資料應用、租屋可疑案件偵測、同婚/社運/政治人物/選舉輿情評估、tweet單人雙重帳號偵測、社群意識形態極化偵測等實例進行授課。

現場撰寫程式碼讓學生理解撰寫過程可能遇到的問題

大部分的程式教學多為教師講解原理,但學生卻經常受困在自行撰寫過程,主因是在於直接講解原理經常容易疏忽「怎麼想到要怎樣寫」還有「產生錯誤要怎麼辦」。因此本課程在前四週課程均採現場從頭撰寫程式碼的方式進行授課,讓學生隨著教師學習如何查找問題解決的方法。

以作業設計、錄影、簡報檔等多種模式引導學生複習

本課程除上課有簡報檔供學生複習外,每一個資料分析案例均有從頭開始寫起的撰寫過程錄影供學生複習。並嘗試調整課程作業形式,降低課程作業之挑戰性、以套用當週所學解決問題為主,以避免學生因過長的作業撰寫時間,而降低平日練習次數。九成以上學生均能在課後五天內成功繳交作業。

以線上資源進行課程互補並提供自我進階學習字

本課程授課內容著重問題解決,極力避免基礎的程式語言定義講授。這部分便以作業的方式,要求學生上線上平台DataCamp完成單元的方式來達成。學生在操作過程,會受平台課程互動的要求,需要逐步看懂程式語言邏輯的定義來完成任務。除此之外,對於部分同學理解能力較佳,本課程申請有DataCamp的教育帳號,讓學生免費學習線上128個課程單元(DataCamp每個月的訂閱費為756元)。