晶泰科技联合创始人赖力鹏:行则将至,AI+新药研发

时间:2019-09-05 10:45      

腾讯科技讯 AI到底能在新药研发中做什么?晶泰科技联合创始人赖力鹏认为,AI能帮助药物化学家突破已有经验认知局限。以深度学习为基础,根据具体的项目需要,灵活结合不同的方法,是在10的60次方个可能成药的化合物中有效探索、筛选药物分子的可行之道。

更重要的是,AI能同时对先导化合物进行整体综合优化。比如在晶泰科技进行的晶型预测,我们不止能计算出一个最稳定的晶体结构,还能算出所有可能的所有晶体结构,为药物后续开发提供选择空间。

技术无止境,不断推进技术边界的背后是强大的计算资源支持。

以下为晶泰科技联合创始人赖力鹏在第四届影响力投资峰会分论坛「生物科技 创新驱动变革」演讲实录,本次分享从晶泰科技出发,以技术的视角分享AI+新药研发中的实践经验。

新药研发漫长路:以计算为核心的解决方案

制药像投资,当你推进一件事情时,你需要先让自己相信这件事情能往前推。新药研发通常会提到三个“10”。一种药物从初期研发到最终的上市需要10年甚至更长时间,花费10亿以上美金,而成功率却不及10%。

过去20年间,药企R&D的投入大概翻了一番,而新批准的药物数量却没有相应变化。

科学家非常勇于进取,一直在探索加速药物研发的方法。其中包括DNA编码库、自动化实验、量子力学的计算、分子动力学模拟,以及近几年特别火的人工智能方法等等。而我们认为从计算角度切入是更具潜力的方法,当然绝不仅仅是靠这单一的方法,可能需要把不同的方法结合到一起。

在晶泰科技的实践当中,我们在最上层构建了两个计算方法:

第一,基于量子物理学、量子化学或力场的计算方法,包括DFT、第一性原理的计算等等。以及分子力学、分子动力学的模拟,我们相信深入到底层技术,会有很大改进空间。

第二,结合深度学习的方法。在实践过程中运用Deep Learning的方法模型,结果在部分系统中表现更好。

两种计算方法的背后都需要大量计算资源支撑。计算化学的方法,像DFT可以算得非常准,但是采用的壁垒在于它的计算资源消耗大且用时长。目前,依靠我们优秀的工程团队,我们将主要的计算资源放在云端。当需要大量计算资源时可以做到弹性扩展,保证所需计算资源的数量,不需要的时候可以关掉计算节点,节约企业的计算成本。

制药领域最终是以实验结果为导向。不管运用Deep Learning,还是其它机器学习方法,客户最终看重的是测试结果。2016年,晶泰科技的第一个非常重要的客户辉瑞对我们进行了严格的预测能力测试。测试结束后我们获得了与辉瑞的合作机会。同时,我们在药物晶体预测背后的技术(包括机器学习、计算化学模型开发)能力可以延展到药物发现中。我们现在也在积极探索底层计算方法在药物的早期发现上不同的应用。

AI能做什么?来自药物研究领域的答案

我们一直在思考AI到底能做什么。我们发现AI一个很大的价值是可以突破人类的思维框架局限。药物化学家在设计药物时,会基于自己的知识和过往经验。而经验肯定是有局限性的,AI在药物研究领域最大的价值就是帮助药物化学家突破局限,为药物化学家提供新的洞见。

2017年《Nature》的一篇文章提到了可能成药的化合物个数是10的60次方,这意味着,原则上我们可以用来做药的分子数量比太阳系里的原子数量还要高好几个数量级。

我们现在用于实体筛选的库,可能十万、百万,或者千万。现在DNA编码库可以到百亿,或者千亿量级,但是和10的60次方相比,微不足道。

如此巨大的潜在空间该如何探索?这需要非常重要的技术手段。在药物化学领域,我们认为深度学习、机器学习能够帮助我们看到更广阔的化学空间。

当然我们不是漫无目的地在10的60次方空间里探索。即使把地球上现有的所有计算资源加在一起,可能也没有办法处理这么大的信息。在算法的设计过程中,有很多技巧让我们有效地在这一空间中搜索。

特别设计的分子生成算法,既可以有效学习现有分子结构特点,随机产生大量新的分子结构,也可以按照药物化学家的需求,定向产生符合某种药物设计需求的新分子结构,从而大大扩展药物筛选过程中可用的高质量药物分子候选者。

探索药物候选者空间:整合构建新药研发平台ID4

现在我们构造了这样一个化学空间,我们相信好的药物候选者就在这一空间中,接下来的问题是当我们知道它们的存在后,用什么样的工具把它们选出来。

在实际项目中,晶泰科技先后积累了超过30个不同的模型,其中包括对药物的活性评价其ADMET属性的预测等等。

把这些方法,包括量化计算、分子动力学模拟的方法和我们自己开发的计算化学模块,还有人工智能的方法,以及背后的云计算技术等,整合在一起就构建了一个新药研发的平台——ID4。

平台的表现初步看来还是不错的,我们目前是把这个平台用在两个服务方向上:

第一,药物早期研究,包括靶点寻找、药物结合位点预测,得到蛋白靶点之后的小分子药物筛选,筛选后做先导化合物优化,同时用于晶型的预测和后期的实验研究。

,相较于传统的研发方式,该平台将大大节省研发人员的精力,让药物、化学等方面专业人才的工作集中在关键节点,从而发挥更大价值。

在我们的实际合作项目中,借助ID4平台,我们可以在筛选过程中同时对候选分子的多个属性进行考虑,包括活性、成药性、骨架的新颖性、可合成性等等。筛选的结果也已经初步获得了实验的肯定。

第二,平台的另一个重要应用是晶型预测。

大家通常吃的药会以药片或者胶囊的形式存在,剥开胶囊放大了看,每一个固体内部都具有晶体结构。不同的晶体结构是小分子不同的三维堆积方式,堆积方式会影响到晶体的物理属性。

所以,医药领域非常关注其晶体结构是否为最优结构。在特定的条件下是否会发生晶体的转变。

仅仅依靠实验的方法没有办法保证全面性,而计算的方法更容易做到这一点。

晶泰科技的ID4平台可以从分子的化学结构式出发,预测该分子所有可能的晶体结构,以及其稳定性的排列,我们不止能计算出一个最稳定的晶体结构,还能算出其它可能存在的晶体结构。

以上仅为简单的介绍,技术无止境,但我们在不断地推进技术和科学研究应用的边界。

免责声明

免责声明:此文章仅代表嘉宾立场,并不代表华兴资本集团(“华兴资本”)之意见。华兴资本不担保文章之准确性或完整性,仅供阁下作参考用途。任何人士如因使用此文章内之材料而承受直接、间接或相关之损失,华兴资本不会对此等损失负上任何责任。

杏彩网页版