智通財經APP獲悉,東陽光藥(01558)AI研發團隊推出了多個自研創新模型應用於藥物分子ADME/T屬性優化,已涵蓋PK曲線預測和CYPs相互作用預測。近日,團隊發佈了基於多任務學習策略的藥物透膜/轉運預測模型,內部數據測試的受試者工作曲線下面積(AUROC)達到0.90,顯著優於公共開源模型。
藥物透膜/轉運預測:高成本稀缺數據與小樣本學習的典型應用場景
圖 1. HEC-Transporters的模型結構。
生物膜和轉運體對小分子藥物的口服吸收產生重要影響。具有合適生物膜滲透性的藥物可被腸道充分吸收從而表現出良好的口服生物利用度;藥物與轉運體的相互作用影響其藥理活性,若藥物作爲底物被轉運體外排將導致活性減弱而作爲轉運體抑制劑則導致活性提升。Caco2細胞系培養是開展藥物腸道吸收與轉運體相互作用體外實驗的關鍵技術,然而其培養週期長、實驗條件敏感且污染風險高,因此測試成本高昂。使用機器學習方法對專有數據建模可快速且低成本地預測藥物與生物膜及轉運體的相互作用,從而在早期開展藥代動屬性優化。研發團隊對內部Caco2細胞滲透性測試實驗記錄進行了數據抽提及標準化,共獲得包含膜滲透、轉運體底物、轉運體抑制三個任務在內的有效數據,爲創新模型構建提供了高質量的專有訓練、驗證數據集。
多任務學習策略:挖掘通用任務特徵,實現小樣本泛化建模
HEC-Transporters整體架構如圖1所示,該模型創新性在於使用多任務學習策略進行數據及模型層面的透膜與轉運任務聯合建模。首先,數據被劃分爲共享型與特異型,前者樣本分子約佔總樣本的80%,在三個任務中均出現,因而用於訓練一個通用的消息傳遞網絡以捕捉分子與生物膜作用的共同結構特徵;後者則在各自任務中特異出現,因此分別用於訓練獨立的前饋神經網絡以提升模型在專有任務上的表現。研發團隊將HEC-Transporters與當前先進的自動機器學習建模方法進行了比較研究,內部數據集基準測試結果如圖2所示:多任務學習模型平均AUC高達0.90,較單任務模型提升0.33,較基線模型提升0.19;準確率結果顯示,多任務策略在膜滲透性任務上準確率最高,達到93%,而對轉運體底物預測提升效果最佳,較單任務模型提升18.0%,較自動化機器學習模型提升12.2%。
圖 2.HEC-Transporters的模型性能。(A)曲線下面積;(B)準確率。
技術創新與應用價值
HEC-Transporters是國際上首款使用多任務學習策略建模藥物透膜/轉運的預測系統,其不僅使用參數共享的消息傳遞網絡捕捉通用任務特徵以提升性能,而且緩解了專有任務數據量較小的建模侷限,相較於自動機器學習和單任務網絡在內部數據上表現出較高的泛化性能。該模型目前已集成於團隊自研ADME/T預測工作流之中,爲東陽光藥早期藥物研發提供全流程的藥代動力學性質優化。
研發範式革新:自2023年實施AI+戰略以來,東陽光藥已構建覆蓋靶點預測、苗頭化合物篩選、先導化合物優化、PK建模的全流程AI研發體系。通過AI賦能研發,既降低了新藥開發成本,又以技術協同推動行業整體效能提升,助力中國醫藥產業在全球競爭中搶佔創新制高點。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。