臺大資工團隊榮獲ACM KDD Cup預測廣告點擊率項目世界冠軍
由本校資訊工程學系林守德教授以及林軒田教授共同帶領之研究團隊(成員包含吳冠緯、馮俊菘、何家華、梁安群、黃俊衡、沈暐原、姜俊宇、楊明皓、林廷韋、李靜沛、龔鵬驊、王頃恩、顧廷緯、何君彥、戴翊書、陳奕魁、黃煒倫、周哲平、林則如、楊涵傑、王彥凱、李政德)參加全球最頂尖的資料探勘比賽ACM KDD Cup,在預測廣告點擊率的項目獲得世界冠軍。
這也是臺大團隊連續五年在這個重要研究型比賽獲獎(其中2008,2010,2011, 2012三年皆為世界冠軍),創下該比賽的前所未見的歷史紀錄。今年八月團隊成員在ACM SIGKDD會議上發表演說以及海報展示,並在上千位學者參與的頒獎晚會上獲頒獎牌以及五千美金的獎金。
ACM KDD Cup 從1997年開始舉辦,由世界計算機組織Association for Computing Machinery (ACM) 轄下的資料探勘組(Special Interest Group on Knowledge Discovery and Data Mining)每年配合全球頂尖之資料探勘國際會議ACM Conference on Knowledge Discovery and Data Mining 舉辦,為資料探勘領域一年一度最重要的比賽。每年競賽的主題都是現今最熱門的議題,不只有極高的學術挑戰性,更擁有龐大的商業應用價值。各方參賽者須結合理論開發與實際程式撰寫,在三、四個月的比賽時間內開發智慧型探勘技術與系統,對於主辦單位所提供的大型資料進行預測。該比賽每年吸引學界(如史丹佛大學)及業界(如IBM Research)數百支菁英團隊參加,競爭非常激烈。
臺大資工系團隊從2008年開始參與這項競賽,連續五年都居於領先地位:在2008年,林守德教授帶領其團隊成功設計智慧型的乳癌判定系統,與IBM Research 並列當年度冠軍;在2009年,林智仁、林守德、以及林軒田教授所共同指導的團隊,分析了手機銷售的商業數據,用以準確預測消費者的行為模式,獲得當年度長期分析組的第三名;2010年,三位教授再度共同指導的團隊,以「特徵構造工程及統合分類」(Feature Engineering and Classifier Ensemble)為主軸,有效地分析了主辦單位所提供的學習系統資料,而能精準地預測學生學習的成效並獲得一般組及學生組的雙料冠軍;2011 年,三位教授共同指導的團隊,在音樂推薦系統中「預測使用者對音樂的評分」與「自動分辨使用者喜歡的音樂和未曾欣賞過的音樂」兩項主題中,打數了全球上千名隊伍,獲得雙料世界冠軍。
今年的KDD Cup由中國的騰訊(Tencent)公司提供比賽的題目,第一項子競賽的題目為「社群服務中的推薦喜好預測」,第二項子競賽的題目為「搜尋引擎中的廣告點擊預測」。其中第二項子競賽,號稱有史以來KDD Cup資料量最多的一個題目,總共有超過1.5億筆的資料量。目的是希望能由大量的歷史資料中,歸納出準確的預測系統,來判斷使用者是否會點擊搜尋引擎所顯示的某篇廣告。「廣告點擊預測」因為背後龐大的商機,在資料檢索及資料探勘一直十分熱門。承襲過去成功的經驗,今年林守德以及林軒田教授在電機資訊學院、資訊工程系及資訊網路與多媒體研究所的支持之下,開設「機器學習理論與實務」課程,給予學生相關的訓練並組隊參與KDD Cup競賽。課程中同學被分為不同的小組,各組的同學各自揮灑創意,用多元的方向來分析資料並建立模型。藉由每週一次的上臺報告,交流想法與實驗結果,以激盪出新穎的想法,並使現有的方法更加完善。比賽的後段,團隊再將各組所建立的各種模型加以整合,使預測的結果達到更好的水準。比賽的競爭非常激烈,直到比賽的最後一天,臺大團隊仍僅維持小幅的領先,而在成員們不眠不休的努力下,最終方能穩住勝果,獲得了該子競賽的世界冠軍。臺大團隊連續五年的獲獎,也創下難以超越的紀錄。