臺大與AI Labs共建老藥新用模擬資料庫 利用AI技術為COVID-19找解方

臺灣大學、陽明大學及中研院等國內學研單位與台灣人工智慧實驗室 (Taiwan AI Labs) 的COVID-19合作平台,在科技部的經費支持下,決定從「老藥新用」角度著手。此方法是從已知臨床安全性的藥物出發,以生物資訊技術,進行作用目標蛋白及藥物化合物親和力模擬預測。團隊將COVID-19病毒與藥物接合模擬預測結果建立成「DockCoV2」資料庫,公開給全球的醫學研究團隊做為未來實驗設計參考資訊。藉由這些資訊,研究人員將精力投入在較可能有效用的化合物上,加速研究進度。DockCoV2目前已累積兩萬多筆模擬結果,並於2020年10月刊登於Google Scholar生物化學研究領域排名第一的期刊Nucleic Acids Research《核酸研究》。

根據世界衛生組織 (WHO) 公佈數據,截至本月19日止,全球COVID-19感染人數逼近4,000萬,死亡人數超過100萬人,阻止疫情蔓延成為各國當務之急。此資料庫的建立有效解決過往藥物研發從化合物選定到安全性、效用性的評估,大約需歷時10至12年不等,面對迅速擴張的流行疾病時,往往緩不濟急的問題;且秉持開放科學精神供世人使用,聯手合作對抗疫情。

以電腦模擬藥物作用情形 降低實驗室試錯成本

上述研究計畫由臺灣大學生命科學系暨生醫電子與資訊研究所阮雪芬特聘教授與生物機電工程學系陳倩瑜教授共同指導,Taiwan AI Labs的生物資訊演算法團隊早在美國提出老藥新用的想法前,便於2020年2月,以短短兩周的時間將「化合物與標靶蛋白結合性預測」的分析服務建立於TAIGenomics基因分析平台上。不僅是提供自動化、快速的模擬預測工具之外,也在研究團隊的協助下挑選了3000多筆於FDA及台灣健保資料庫中登記核准的藥物進行模擬運算,搭配五種COVID-19病毒蛋白:棘突蛋白 (Spike Protein)、3CL蛋白 (3CL-Protease)、RdRp蛋白、PL蛋白 (Papain-like Protease) 和N蛋白 (Nucleocapsid Protein),和兩種與病毒棘蛋白有交互作用的人類蛋白 (TMPRSS2蛋白和ACE2蛋白),進行結合性預測並開放給世界專家學者使用。

資料庫內的預測結果包含每種藥物與不同標靶蛋白的結合分數,將模擬結果可視化方式呈現於蛋白質結構上,並連結該藥物結構及實驗數據資料庫,提供研究評估之用。藉由這些整合資訊,可在酵素活性研究與臨床實驗前有效加速候選藥物選擇所需時間。臺大、清大和中研院團隊已針對候選名單中的藥物進行後續藥物標靶活性測試,其中有多種藥物具有潛力,抗病毒細胞實驗正在進行中。

秉持開放科學精神 共同打造台灣競爭力

Taiwan AI Labs從創立之初就秉持開放原則,希望藉由台灣的軟體實力推動不同應用領域的技術團隊打國際戰,而這次COVID-19的危機就是一個很好的戰場。AI Labs杜奕瑾創辦人表示,從2020年初Taiwan AI Labs團隊就開始思考不同防疫工具的應用情境,從病歷溯源、影像輔助診斷到治療方法研發,團隊利用AI的力量協助防疫國家隊的前行,也協助台灣的軟實力在國際上被看見。過去在做病毒抑制劑分析時,多從生物實驗著手,不僅成本高,等待的時間也長。為了加速藥物開發,現在常透過生物資訊和電腦模擬,把預測結果給實驗室進行篩選,這樣就可以降低試錯成本,縮短臨床測試驗證前的時間。團隊十分認同這次中研院的開放科學精神,唯有這種跨領域的協作才能讓系統不停優化,並將這些成果結合生物學研究或醫療臨床應用情境,才能讓系統的價值顯現出來,帶動台灣在生技醫療產業的競爭力。

臺大阮雪芬特聘教授表示,今年初SARS-CoV-2來襲,因為曾在2003年參與過抗SARS團隊,並共同發表文章於美國國家科學院院刊 (PNAS)。在陳倩瑜教授的引薦下,AI Labs找阮特聘教授合作指導團隊進行與這篇文章相關的研究工作。COVID-19成為國際健康的大問題。為了對抗這個疾病,最好的方式就是阻礙病毒的複製。阮特聘教授表示,研究團隊建立一個資料庫DockCoV2,著重在計算FDA和健保藥物與蛋白質之間的親合力,提供最先進的預測結果。使用者可以直接下載有興趣的藥物和蛋白接合資料,並檢查一些藥物相關的資訊。非常歡迎對於任何藥物或是蛋白質有興趣的研究團隊利用這些資料進行後續研究,目前所有的程式碼皆公開在GitHub,也歡迎做生物資訊的夥伴可以做其他的應用。

利用AI技術 推動精準健康

AI可應用的領域十分多元,但其發展必須架構在完整的資料收集上。台灣在過往多年的健保資料庫、台灣精準健康計畫和亞太生醫矽谷精準醫療旗艦計畫等等計畫的鋪墊下,已建立許多大型的數據資料庫,因此在精準醫療、精準健康的AI發展上有其相對的優勢。從這次COVID-19的戰役中,Taiwan AI Labs已展現多類型生物資訊搭配臨床數據的分析成果,並將其推向研發、臨床場域進行概念驗證;未來將持續推動群體的精準健康,以數位孿生 (Digital Twin) 為核心,整合多元生理資料,並應用AI及5G技術,讓台灣在後疫情時代成為精準健康與精準醫療的指標國家。

論文全文