文丨陈根
当前,新药研发正面临着成本高企、收益率下降的双重困境,而人工智能是否能解放新药研发的艰难景况,还是个谜题。
众所周知,一款新药的研发是一个风险大、周期长、成本高的艰难历程。国际上有一个传统的“双十”说法10年时间,10亿美金,才可能成功研发出一款新药。即使如此,大约只有10%新药能被批准进入临床期,最终只有更小比例的药物分子可以上市,甚至有人将这个过程形容为“死亡之谷”。
2017年德勤发布的报告指出,成功上市一个新药的成本从2010年的11.88亿美元已经增加到20亿美元。而2017年全球TOP12制药巨头在研发上的投资回报率低到3.2%,处于8年来的最低水平。面对投入越来越高的制药领域,人工智能作为一种新兴技术,被视为新药研发实现降本增效的重要方式之一。
然而,人们寄希望于人工智能,但至今,似乎未听到什么突破性的结果。早在1981年就被《Discovery》杂志看好的人工智能新药研发“化学家们再也不用整周、甚至是整月地呆在实验室,去测试那些计算机认为难以成功的分子”为什么在40年后依然步伐缓慢?传统制药与机器制药的明天又在哪里?
传统制药的穷途末路
尽管现代医学的高速发展拯救了越来越多的生命,但一个不可否认的事实是,当前,现代医学已研发出的药物,与现存的疾病数目相比,依然是九牛一毛。有许多疾病至今无药可治,而新的病毒又层出不穷。
制药业是危险与迷人并存的行业,昂贵且漫长。一款新型药物的推出,需要经过药物发现、临床前研究、临床研究和审批上市等多阶段,而这往往需要耗费十几年乃至数十年的时间,以及数十亿美元的成本。即便如此,其失败率依然高达90%以上。
通常,一款药物的研发可以分为药物发现和临床研究两个阶段。在药物发现阶段,需要科学家先建立疾病假说,发现靶点,设计化合物,再是展开临床前研究。其中,仅发现靶点、设计化合物环节,就障碍重重,包括苗头化合物筛癣先导化合物优化、候选化合物的确定、合成等,每一步都面临高淘汰率。
阿尔茨海默症(Alzheimer’s disease,AD),俗称老年痴呆,是一种神经系统退行性疾病,在1906年由一位德国医生首次发现并且报道。阿尔茨海默症临床表现为渐进性记忆障碍、认知功能障碍和语言障碍等,出现失语、失用、失认等病症表现,就像是记忆的橡皮擦,一点点擦去患者与其家人、朋友的记忆。
遗憾的是,到目前为止,仍没有明确的治疗阿尔茨海默症的方法。也就是说,我们等待了100年,还是没有找到更好的药。2019年,国际阿尔茨海默病协会估计全球有超过5000万人患有阿尔茨海默症,到2050年,这一数字将飙升至1.52亿。没有可以治疗阿尔茨海默症的药,就意味着2050年,这1.52亿人群仍要遭受阿尔茨海默症的困扰。
《Nature》在2017年发表了题为The drug-maker’s guide to the galaxy的文章,文章指出:经过化学家的分析,在整个化学空间里面,人们可以找到的药物分子的个数,可能性是10的60次方。
要知道,太阳系里面所有的原子加到一起,数量大概也只有10的54次方。更不用说在传统实验室里,通过传统的药物筛选办法能够接触到的分子数量,大概仅有10的11次方。11和60,这两个数字中间,就是横亘在一款新药走向临床道路的巨大天堑。
并且,一种药物,即便是经过成千上万种化合物的筛选,也仅有几种能顺利进入最后的研发环节,大约只有10%新药能被批准进入临床期,最终只有更小比例的药物分子可以上市。在这样的筛选比例下,无怪投资人将新药“从实验室进入临床试验阶段”描述为“死亡之谷”。
并且,随着现代医学的精进,其所研发新药的难度也日益提升。一方面,2017年全球TOP12制药巨头在研发上的投资回报率仅有3.2%,处于8年来的最低水平。过去公认的高投入和高回报,似乎落到了低谷。另一方面,全球新药管线中处于后期阶段的项目越来越少,2016年尚有189个III期项目,2017年则落到159个III期项目。传统的制药似乎已经走到穷途末路。
开启制药行业的新篇章
面对传统制药行业高成本、高投入、高风险的困境,人工智能作为一种新兴技术,被寄予希望成为拧动这一难题的好钥匙。
事实上,人工智能进发制药并不是近来才有的事情。1981年的《Discovery》杂志就已经清楚地解释了计算机对于制药业的重要性:“平均下来,医药公司每筛选出的8000个药用分子中,只有1款能最终问世。计算机有望能提高这个比例化学家们再也不用整周、甚至是整月地呆在实验室,去测试那些计算机认为难以成功的分子。”
几个月后,《财富》杂志的封面则对计算机辅助的药物发现进行了专题报道,并称这项技术为“下一次工业革命”。人工智能被制药业寄予颠覆性的期望并不是没有原因的,面对似乎已经走到穷途末路的传统制药,用人工智能制药无疑是实现制药业降本增效的重要方式之一。
一方面,人工智能可以帮助寻找疾并基因和药物之间的深层次联系,以降低高昂的研发费用和失败率。基于疾病代谢数据、大规模基因组识别、蛋白组学、代谢组学,人工智能可以对候选化合物进行虚拟高通量筛选,寻找药物与疾并疾病与基因的链接关系,提升药物开发效率,提高药物开发的成功率。
具体而言,科研人员可以使用人工智能的文本分析功能搜索并剖析海量文献、专利和临床结果,找出潜在的、被忽视的通路、蛋白、机制等与疾病的相关关系,进一步提出新的可供测试的假说,从而找到新机制和新靶点。
渐冻人症(ALS)就是由特定基因引起的一类罕见病,而IBMWatson使用人工智能技术来检测数万个基因与ALS的关联性,成功发现了5个与ALS相关的基因,推进了人类对渐冻人症的研究进展(此前医学已发现了3个与ALS相关基因)。
目前,人工智能算法模型被诸多学者提出,随着药物研发数据的高速累积和数字化转型,以及人工智能技术的加速发展,决策树(DT)、随机森林(RF)和支持向量机(SVM)等机器学习模型以及深度神经网络(DNN)、卷积神经网络(CNN)和循环神经网络(FNN)等深度学习算法逐渐被应用于药物发现领域。
另一方面,工智能可以虚拟筛选候选药物,帮助科研人员高效找到活性较高的化合物,提高潜在药物的筛选速度和成功率。人工智能可以通过模拟小分子化合物的药物特性,在较短时间内挑选出最佳模拟化合物进行合成试验,大幅提高化学合成路线设计速度,以降低操作成本。
比如,美国Atomwise公司使用深度卷积神经网络AtomNet来支持基于结构的药物设计辅助药品研发,通过人工智能分析药物数据库模拟研发过程,预测潜在的候选药物,评估新药研发风险,预测药物效果。
当前,人工智能已经实现在生物医药产业自上游到下游的投入使用,且虚拟筛癣靶点发现等部分应用场景Ҳ能够为企业带来实际收益。新型冠状病毒肺炎疫情发生后,越来越多的生物医药企业和研究机构通过将其业务与人工智能结合来完成创新突破,在新药开发、生产运营,甚至商业战略中都有所应用。
今年3月,总部位于中国香港的国际知名AI制药公司Insilico Medicine(英矽智能)就宣布,他们通过人工智能发现了治疗肺纤维化的新靶点,然后从无到有设计了一个新的药物分子来靶向这个靶点。这也是全球首次利用人工智能发现新机制特发性肺纤维化药物。
这一突破标志着业界首次对人工智能发现的药物进行科学验证,并将其用于新药研发,直至候选化合物的临床前研究。而且,整个研发过程只花了不到18个月的时间和大约200万美元,刷新了速度和最低成本记录,在大大加快和推进临床前开发的同时,节约了大量药物发现成本。
AI制药,步伐缓慢
当然,人们虽然寄希望于人工智能,但人工智能所获得的突破与人们对人工智能报以的高涨的热情似乎并不成正比。计算机设计新药的程序已经存在了好几十年,但在医药行业,研发产出率非但没有上升,反而还逐年下降。药物发现的时间没有缩短,成本也没有变得更低。
这并不是说这些程序阻碍了新药的研发,而是说它们尚未给行业带来大幅的可喜改观。四十年来,人工智能在制药行业前进的步伐依然缓慢。新药发现和研发所面临的挑战数不胜数,人工智能可以解决的部分实在有限。
这背后涉及到至少两方面的原因。一方面,当今的人工智能存在其固有局限。对于目前的人工智能来说,其主要还是通过在数据中寻找模式来学习的。通常,输入的数据越多,人工智能就越智能。这也意味着,这些数据也具有限制了人工智能制药的可能。
要实现超自然的性能,一般来说,必须输入模拟特定行为的高质量数据对系统进行训练。这在围棋等游戏中容易实现,每一步都有明确的参数,但在不太可预测的现实生活场景中则要困难得多。这也令人工智能在应用到现实场景的过程中,经常会遇到困难。
疫情期间,在法国、美国和英国等地,人工智能之所以也未能支持政府建立有效的接触者追踪系统的努力,很大一部分原因就是缺少必要的“原料”:在英国,由于缺乏系统的数据采集来追踪和溯源新冠病例,在短期内几乎不可能使用人工智能技术实施接触者追踪干预。
在我国,医药大数据也存在数据量少、数据体系不完整、数据标准不统一、数据共享机制不完善等问题。诸如病历、随访记录目前还很难标准化、数字化;国内创新药研发起步较晚,原始数据积累有限;国内药品数据存储分散,存储格式不一,完整药物数据获取比较困难;新药研发领域的核心数据来源于药企,考虑到商业机密的问题,企业不愿公开核心数据。医药数据的数量和质量成为人工智能在制药行业发展的主要障碍。
另一方面,我们不得不充满敬畏地说,生物是一个非常复杂的体系。理论上能起效的新分子,在人体中可能有毒性,可能有脱靶效应,可能有副作用,可能与其他分子发生复杂的反应。更何况,没有两名患者的身体特征完全一致,这进一步增加了药物研发的复杂程度。事实上,人工智能再具有潜力,也ֻ能是作为工具存在,我们不必神话它。
上个世纪的人类基因组计划是一个伟大的计划,是人类尝试在分子层面上去理解人类生命是如何自我表达、代际之间怎么去沟通,人体如何通过遗传物质,让一代人和下一代人进行对话。这才有了现代医学对于碱基可以形成DNA的序列,然后DNA通过生物学的过程去指导蛋白质的合成的了解。现在,人工智能要扮演的,就是这样的角色。
人类智慧所能做的,是尝试理解生物学语言,尝试理解化学语言,然后把这两个语言合到一起,从而能够找到和疾病相关的蛋白质最匹配的那个化学分子,最终治愈人体的疾玻而人工智能所要做的,就是和药物化学家一起合作,来让人类可以去发现更好的药物。
制药业就是这样一个一路荆棘一路玫瑰的行业,危险但迷人,昂贵且漫长。人工智能制药作为一个新生的跨学科的复杂行业,每一天都需要面对复杂的问题。在人工智能探究新药上,人们将会综合化学、生物、计算机、数学、统计等多个学科的经验。如何实现如此多学科的彼此对话和彼此理解,也是人工智能研发新药的未竟之路。
好在一切才刚开始。和任何一个新生的技术一样,人工智能制药也会经历一个成长爬坡期。未来,人工智能药物研发将不再是生物医药行业中一个概念性技术,而是成为行业中非常核心的存在。