智通财经APP获悉,东阳光药(01558)AI研发团队推出了多个自研创新模型应用于药物分子ADME/T属性优化,已涵盖PK曲线预测和CYPs相互作用预测。近日,团队发布了基于多任务学习策略的药物透膜/转运预测模型,内部数据测试的受试者工作曲线下面积(AUROC)达到0.90,显著优于公共开源模型。
药物透膜/转运预测:高成本稀缺数据与小样本学习的典型应用场景
图 1. HEC-Transporters的模型结构。
生物膜和转运体对小分子药物的口服吸收产生重要影响。具有合适生物膜渗透性的药物可被肠道充分吸收从而表现出良好的口服生物利用度;药物与转运体的相互作用影响其药理活性,若药物作为底物被转运体外排将导致活性减弱而作为转运体抑制剂则导致活性提升。Caco2细胞系培养是开展药物肠道吸收与转运体相互作用体外实验的关键技术,然而其培养周期长、实验条件敏感且污染风险高,因此测试成本高昂。使用机器学习方法对专有数据建模可快速且低成本地预测药物与生物膜及转运体的相互作用,从而在早期开展药代动属性优化。研发团队对内部Caco2细胞渗透性测试实验记录进行了数据抽提及标准化,共获得包含膜渗透、转运体底物、转运体抑制三个任务在内的有效数据,为创新模型构建提供了高质量的专有训练、验证数据集。
多任务学习策略:挖掘通用任务特征,实现小样本泛化建模
HEC-Transporters整体架构如图1所示,该模型创新性在于使用多任务学习策略进行数据及模型层面的透膜与转运任务联合建模。首先,数据被划分为共享型与特异型,前者样本分子约占总样本的80%,在三个任务中均出现,因而用于训练一个通用的消息传递网络以捕捉分子与生物膜作用的共同结构特征;后者则在各自任务中特异出现,因此分别用于训练独立的前馈神经网络以提升模型在专有任务上的表现。研发团队将HEC-Transporters与当前先进的自动机器学习建模方法进行了比较研究,内部数据集基准测试结果如图2所示:多任务学习模型平均AUC高达0.90,较单任务模型提升0.33,较基线模型提升0.19;准确率结果显示,多任务策略在膜渗透性任务上准确率最高,达到93%,而对转运体底物预测提升效果最佳,较单任务模型提升18.0%,较自动化机器学习模型提升12.2%。
图 2.HEC-Transporters的模型性能。(A)曲线下面积;(B)准确率。
技术创新与应用价值
HEC-Transporters是国际上首款使用多任务学习策略建模药物透膜/转运的预测系统,其不仅使用参数共享的消息传递网络捕捉通用任务特征以提升性能,而且缓解了专有任务数据量较小的建模局限,相较于自动机器学习和单任务网络在内部数据上表现出较高的泛化性能。该模型目前已集成于团队自研ADME/T预测工作流之中,为东阳光药早期药物研发提供全流程的药代动力学性质优化。
研发范式革新:自2023年实施AI+战略以来,东阳光药已构建覆盖靶点预测、苗头化合物筛选、先导化合物优化、PK建模的全流程AI研发体系。通过AI赋能研发,既降低了新药开发成本,又以技术协同推动行业整体效能提升,助力中国医药产业在全球竞争中抢占创新制高点。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.