如何加速新药研发?腾讯表示,为解决困难,开始做些尝试———发布首个AI驱动的药物发现平台“云深智药(iDrug)”。它致力于帮助用户大幅度减少寻找潜在活性药物的时间和成本。“云深”源自唐诗《寻隐者不遇》的“只在此山中,云深不知处”,新药的发现过程正是如此。
基于腾讯AI Lab自主研发的深度学习算法,提供数据库和云计算支持,能覆盖临床前新药研发全部流程的五大模块。
目前平台上已经运行十个左右研发项目———包括对抗新冠病毒药物的虚拟筛选和性质预测,目前筛选得到的化合物在实验验证中。
平台如何为药物研发加速助力?
疾病的形成由很多物质组成,最终形成疾病的关键蛋白,我们把它设为靶点。
解决靶点,就有可能解决疾病。
而解决靶点,就需要知道它的蛋白结构,再去找到对应的药物破解它。
了解关键蛋白的结构,设计药物分子来抑制它的功能,疾病就会解除。
过去通过实验寻找针对疾病靶点的有效药物,往往难度大、周期长、费用高。
从进入临床试验的行业案例来看,在新药研发中,AI技术最快可以将新药发现周期从3-6年缩短到6个月至1年;从技术层面看,云深智药平台同样具备相似的能力。它能最快的时间,模拟锁的结构。
结合AI深度学习模型预测的蛋白质结构以及蛋白质功能(蛋白质折叠),就可以有针对性地设计药物分子来抑制它的功能,将疾病通路阻断。
基于自监督学习的蛋白质折叠方法,不依赖同源序列,而是直接从序列数据库中通过自监督学习,学得共进化的模式,从而能够从无到有地产生出含有共进化信息的伪同源序列,并最终让这些蛋白能够有效折叠。
通过一种基于深度学习的可迭代方法,有效整合模板建模与自由建模,首次提出了动态的、可迭代的氨基酸对特异性的约束条件,显着提高了建模的精度,从而更好的折叠蛋白。
云深智药平台,不仅可以根据锁的类型和形状来设计或者选择合适的候选钥匙,还能吸收其他人开锁经验,能极大节省人力物力。
可通过AI“迁移”从其他靶点上面学习到的知识(如分子局部结构对靶点结合强度的影响),应用在目标靶点上来提高模型预测精度。
目前该算法在数千个实验数据集上预测精度(预测活性与实验测量活性的相关性)的中位数从目前最高记录0.36提升到0.42,且筛选可用模型的百分比从56%提升到60%。
IT之家获悉,平台还支持ADMET性质预测功能(药物的吸收、分配、代谢、排泄和毒性),目前已经开源。该平台药物小分子ADMET属性预测模块已在多个数据集上比学术界现有最好模型提高3%~11%;在合作伙伴的反馈中,平台的自研算法精度超过现有商业软件6%~37%不等。
当然,除了上述在算法领域不断创新,平台还提供算力和数据库的一体化服务支撑。
云深智药平台使用的分子大数据,基于现有公开数据集,进行了多个环节的精细清洗整理工作,得到可以用于直接构建深度学习模型的药物分子大数据集。
算力方面,腾讯云为云深智药平台提供数据库服务。
药企、科研机构登录平台即可开展研究,不需要再自行部署计算资源,从而能尽快将AI能力引入现有的研发流程中。