|
原标题:不想做外包,当不了药神,AI公司如何能力走通制药这条路?
图片来源@视觉中国
文 | 脑极体
AI能制药,早已不是啥陈腐事了。
尤为是疫情之后,包罗辉瑞、罗氏、默克、阿斯利康、葛兰素史克、赛诺菲、强生等在内的顶级制药公司,纷纭减速拥抱人工智能,不是与AI公司协作,就是收购或自建AI部门。
从份子试验到制作供给链乃至市场营销,AI曾经在全部制药价值链上,展示出极大的后劲。
AI与制药的融会进程,以两种模式为主:
一种是VIC模式,即“VC(危险投资)+IP(常识产权)+CRO(研发外包)”,其中AI公司作为技术外包,为药厂提供降本增效的解决计划;
另外一种是AI-Driven模式,专门以AI技术来驱动剖析预测发现新的化合物、蛋白质,本人研发翻新药。
比拟“传统产业智能化”的外包办事商,AI企业“自立山头”制药,有着更大的商业想象空间,也的确在过来几年间,吸引了大范围的融资和巨头携资入场,仅2021年中国该畛域的投融资范围就超过了80亿。
其中最具代表性的,就是谷歌母公司Alphabet不久前成立的AI药物公司Isomorphic Labs,其开创人恰是研发了AlphaFold2算法的AI先锋DeepMind的CEO。显然,谷歌也十分看好以尖端AI技术在生物学畛域“大展拳脚”的前景。
那末问题来了,生物制药畛域是一个专业常识壁垒极高的畛域, AI参预制药曾经有15-20年的时间了,期间机器学习办法始终被用于药物发现和临床实验傍边。2000年,利用机器进行“高通量筛选”曾经被运用在化合物测试傍边。但目前为止,尚无一个验证AI能够“独立行走”翻新药的胜利案例。
制药这条路,狼子野心的AI公司该如何走上来?作为AI“优等生”和医药“落后生”,中国在AI制药上的赢面到底有多大呢?
不是药神,AI制药当初到底几分熟?
制药门坎如斯之高,AI公司凭甚么以为本人能够绕过物理学定律的限度“自立山头”呢?AI真的能取代传统试验伎俩,成为全村的但愿吗?
正如现在深度学习爆火之后公众对AI不切实际的想象和害怕同样,在制药这件事上,AI也并不是无所不克不及,咱们应该对AI设定一个公道预期:
以深度学习为主的AI技术有其合用规模,目前次要用在剖析处置医药数据、预测疾病靶点、设计和优化化合物、试验自动化等畛域傍边,解决制药场景的实际问题。
将来,跟着这些细分场景的不停胜利和数据积攒,不停反哺AI模型,可能3-5年才会有较大的冲破。詹姆斯·贝森(James Bessen)在《边做边学》(Learning By Doing)一书中也提出,最少5-10年的时间AI才会让制药行业真正转型。
所以,在寰球规模内,AI制药都处在较初期的阶段,AI公司造的药,目前可能才只要“一分熟”。指望忽然掉下一款由AI主导研发的默默无闻的翻新药,仍是很边远的。
既然隔行如隔山,由药厂引入AI不是强强联结、事倍功半吗,为何AI公司还要冒着失败的危险去“另立山头”,而资本市场也违心买账呢?
另立山头,谁给AI企业的自信?
缘故之一,是AI的角色变了。
目前,制药行业普遍采取的是基于指标靶点的钻研模式(Target-centric),即先要找到致使疾病的特定蛋白质(无效靶点),经过剖析化合物、基因、疾病和蛋白质之间的瓜葛,进行无效份子的筛选与设计。这个进程往往靠的是钻研人员本身的发明力和教训,离不开制药公司少量高品质数据的撑持。
在这个过程当中,AI的发扬空间就很大了。
1.更快。跟着基因组学的开展,寻觅和选择新药份子曾经成为一项数据密集型工作,利用AI来自动学习剖析处置数据,可以更快地推断出疾病机制,发现新靶点,从而减速研发进程。好比麻省理工学院团队推出的生物技术初创公司ReviveMed,就是基于MIT的代谢物数据库,剖析药物-蛋白质、蛋白质-蛋白质的互相作用,辨认特定的代谢物份子,找到一些有但愿的医治靶点,这些代谢物份子就有多是将来的药物。
2.更早。假如医疗试验数据是混乱而未标志的,那末后续的剖析处置预测都不易完成,所以在新药研发下面向AI的数据治理任务要发展得更早,现有的研发和业务流程必需从新设计,能力充沛发扬AI、大数据、高机能计算等的协同价值,这波及到大范围的组织转型,也使得数据工程师、算法工程师在制药畛域的参预更早、更深。
3.更广。“靶点-疾病”的研发范式,使得传统制药公司不会将精神集中在稀有疾病的医治上,由于ROI投资报答比过低,而AI技术能够经过表型数据(图象)进行药物的筛选和设计,反过去帮忙找到新的医治靶点,在计算机中分解和测试份子,这让稀有病有了医治乃至治愈的但愿,对全人类来讲都是坏事。
从试验室助手变为了新药研发的配角,AI“独立行走”的决心天然也就越发强烈了。
缘故之二,是重建一套新范式更便利。
虽然有一些制药公司思想开明、态度凋谢,但事实是,制药公司对其业务和钻研办法的激进是出了名的,不肯意承受改革的居多。一项钻研显示,2019年和2020年生命迷信畛域人工智能相干专利的请求中,只要不到2%是出名制药公司提交的。
一些制药公司乃至都没无数字化,得多数据都用纸质档案保留,采取AI还需求时间;有的大型制药公司仍是传统思惟占主导,偏向于研发传统药物制剂。还有的则偏向于保存数据和技术作为外部商业秘密,不肯意分享给AI技术公司……既然如斯,开拓一条全新的赛道本人制药,对AI公司来讲更为灵敏,研发速度也更快。
与此同时,AI技术的开展,也让AI主导的研发成为可能。
一方面,小样本学习、生成技术等的运用,能够增加研发过程当中的数据依赖。好比有公司就开发了一个名为Generative TensorialReinforcement Learning(GENTRL)的平台,让两种DL深度学习模型来互相作用,一个生成份子,一个辨别虚实,解决试验数据缺乏的问题。而一旦肯定了标靶,就能利用算法间接设计出所需求的份子构造了。
此外,虽然说隔行如隔山,但端到真个深度学习,不需求算法人员去定义一些特点和规定,好比蛋白质构造预测模型可以间接按照序列的特点输入三维构造,目前曾经达到试验的精度。所以只管目前人类迷信对得多疾病的了解都还处于高级阶段,算法人员也未必对生命迷信常识非常精晓,但应用AI工具来开发新药,彻底是可行的。
缘故之三,就是本人做原研药,这件事真实太香了。
目前,抗体药这种生物药曾经逐步超过了化学药的数量,成为增长最快的医治药物。寰球曾经有超过100款抗体药上市,好比新冠殊效药就是抗体药,找到可以中和病毒的活性抗体来发扬作用。
之前,抗体药需求从痊愈病人中去提取和筛选,这个进程费时费劲,还有很大的不肯定性。而经过AI间接对现有抗体进行设计和优化,完成高效的中和成果,一种新的抗体药物就降生了。
原研药市场宽广、利润丰厚,本人研发无疑驾驭了最具价值的一环。所以说,AI公司本人做药它不香吗?
中国制药,在AI画布上描画全新图景
想必得多读者经过旧事和行业报导都发现了,在AI制药这个畛域,美国在技术、资本、产业范围上都处于当先位置,AI开发的殊效药、疫苗、疗法、平台等不停涌现。
而中国在AI技术上其实不后进,这是不是象征着有但愿在制药畛域取得冲破呢?在AI这块技术画布上描画制药蓝图,关于中国象征着三重价值:
1.将生命福祉驾驭在本人手里。
在医药医疗畛域,数据都是十分敏感的,好比要针对个体的基因序列和新抗原设计出对应的药物,对患者来讲无疑是更无效、更精准、更普惠的。然而基因数据假如只能交给海内科技企业来剖析和出产,其中存在的危险不必多说。
前不久《天然》杂志上就公布了一篇论文,总部位于美国北卡罗来纳州的制药公司Collaborations Pharmaceuticals,就与伦敦、瑞士的钻研人员协作,训练出了一个药物开发工具MegaSyn,在短短六个小时内自动出产出40000种有毒的化学制剂。
利用AI结合群体基因特质,针对性地开发精准打击的生物武器,并不是不成能。所以中国必需将AI制药的尖端科技掌握在本人手中。
2.在原研药畛域取得较大冲破。
大家可能都看到了,最新引进的新冠殊效药价钱高达数千元,原研药的销量高、利润高,曾经是公众熟知的事实,而开发原研药始终是中国制药产业的老大难问题。必需意想到,在传统生命迷信畛域,中国的起步较晚、根底也相对于单薄,好比生物试验中需求的高精度显微镜、测试试剂等也是被国外“卡脖子”的,在这类状况下,AI提供了一种开发原研药的全新思绪。
(2017年诺贝尔化学奖授与三位冷冻电镜畛域的学者)
好比经过AI算法来替代冷冻电镜,也能够解开蛋白质构造。目前,AlphaFold预测出来的后果曾经能够和冷冻电镜的办法相媲美。跟着中国在相干算法上的冲破,将来可以升高对一些卡脖籽实验技术的依赖。
在翻新药研发上,从科研到产业化之间的间隔是十分近的,得多冲破性技术和新份子都是从钻研院所试验室中降生,再由药厂进行转化、评价、临床实验……而在AI钻研畛域,中国科研院所的才能曾经处于一流程度。
AI从新定义制药流程,有助于中国变为一个制药强国。
3.进一步发扬中国的AI产业劣势。
咱们都知道中国AI产业化的步调很快,次要集中在互联网、工业、矿山、城市办理等畛域,在生命迷信畛域里的AI运用,整体还处于高级阶段。
无论是AI公司驱动的翻新药,仍是传统药厂的AI化,都有很大的开展空间。目前,简直中国头部科技企业如BATH(百度、腾讯、阿里、华为)等都在AI药物研发上有所举措。
跟着AI制药的进一步开展,生命迷信畛域的数据、算力、算法都将进一步降级迭代,工具平台生态也将进一步搭建和丰硕起来,届时,中国在AI畛域的劣势也将进一步缩小。
都说“一张白纸上能够画出最新最美的丹青”,AI制药之于中国,就是在远远追逐的生命迷信试验路途以外,新建一条由数据铺成的高速公路,搭乘智能小车跑得更快、更早到达新药研发的目的地。
盛名之下:AI解锁制药的三把钥匙
AI开展最不成或缺的,是决心。历史上的两次AI寒冬,就与投资者和公众对AI报答预期的垮掉,有着间接瓜葛。AI制药的投融资浪潮,似乎在大鸣大放之后,不能不面对一个骨感的理想:一开始想得很美,但冲破来得很慢。
曾有一名AI制药公司的开创人对媒体透露,第一轮融资时投资人但愿可以做药,第二轮就开始倡议他们做办事(也就是药厂AI技术外包)了。
资本市场对AI制药的疑虑,是低潮之下的正常调剂,但要防止透支信赖、解锁光明的将来,AI制药企业恐怕还需求拿到三把钥匙:数据、算力、算法——没错,就是虽然浮夸、但相当首要的AI“三驾马车”。
实际上,大部份AI的问题都是由于数据不敷、算力不敷、算法不敷好。而解决办法也是从这三点动手。
先说数据。
后面提到,目前人类对生命迷信的了解还十分高级,端到端学习也能够增加对一部份数据的依赖,但根本的高品质数据仍是AI制药必不成少的根底。
受试验伎俩、医疗技术的限度,目前AI对蛋白质功用的剖析仍是对比高级的,对份子的功用构造、瓜葛序列等的形容不敷,这显然会给AI学习带来困扰,蛋白份子会不停地和别的份子进行交互,外形也会随之改动,用纯数据驱动的AI办法去生搬硬套,后果极可能是“有效设计”。
就如化学家Derek Lowe在《迷信》杂志上指出的,即便两种蛋白质拥有物理上结合在一同的构造,也很难说它们实际上会粘合得有多好。用在植物或人身上的时分也纷歧定老是无效。
更深化地舆解生物世界,离不开少量优质的数据,这些往往经过几十年的积攒和试验获取,掌握在药企本人手里,不会等闲分享。另外基因数据、医疗数据还波及到隐衷伦理问题,需求在严格的数据维护法律法规之下使用。
所以关于AI企业来讲,亟需求探究一种与药企协作、分利的模式,解开数据的枷锁。
再说算力。
以蛋白质构造预测为例,它往往需求超大范围的算力反对。由于生物零碎中份子之间的互相作用特别多,设计出来的模型可能参数不大,但对比繁杂,比计算机视觉、NLP等模型要大得多。
此前曾有中国AI公司训练出了中国版AlphaFold2,团队成员表现遇到最大的难题,就是GPU资源(算力)无限,难以同时进行屡次训练来对比成果,所以只好在模型设计上下工夫,尽可能增加试错次数。
另外一个迷信家也向脑极体透露,其开发的蛋白质构造预测平台,对一个模型的一个数据点(data point)进行计算就需求800G显存,象征着需求十几块顶级显卡,假如要做全范围训练那算力本钱几乎不成想象。
所以,一方面,需求增强AI算力根底设施建立,提供更多更普惠的算力资源,经过产业协作等形式来撑持生命迷信的AI运用开展。另外一方面,对生物AI模型的“瘦身”优化成为大势所趋,过大的模型即使在试验室里有充分的算力反对,在实际部署落地的时分也会对内存存储等提出应战。
这天然就要提到更好的算法。
新药研发是个十分繁杂、探究未知的进程,世界一流的算法和效果,离不开世界一流的科研。目前来看,中国在AI畛域“跟随”更多,面向底层、有影响力的冲破较少。
斯坦福大学公布的2022年人工智能指数讲演(2022 AI Index Report)中也显示,2021 年,中国在人工智能期刊、会议和常识库出版物的数量上持续当先世界,比美国高出 63.2%,但在援用数量上却低于美国、欧盟和英国。
在一个全新的畛域开收回新的算法,没有任何教训可循,中心仍是在人材。首先需求人材具备寻觅问题、提出问题的才能,以及耐烦放心解决底层技术问题的科研环境,另外还需求具备生物学、药剂学、化学等穿插常识,这些都给AI学科建立和人材造就提出了新的应战。
一名AI迷信家告知我,在她眼里,当初对AI人来讲既是最佳的时期,也是最坏的时期。一方面AI产业开展带来的新机遇十分多,另外一方面从业者也会感触到一种轻飘飘的责任感,技术迭代速度之快带来了高强度的钻研压力。
不难看出,AI驱动的钻研范式也带来了全新的应战,能否在产业从新分工中占领劣势,中国AI还有一些关卡要过,其中得多根底前提需求长时间的、体系化、迷信的投入。
无论如何,AI势必引领生物制药畛域将来十年乃至更远的翻新标的目的。从这个角度看,AI制药公司“自立山头”,迈出了症结的一步,这一选择是必需确定且反对的。接上去的重点在于,如安在效果数量与品质上赶超和引领世界一流程度。
就像迷信史家托马斯·库恩在《迷信反动的构造》中所写的那样,迷信就是经过不停地转换范式,打破旧有框架约束,才取患了提高。
人类的安康和但愿,就暗藏在这样的“不走寻常路”中。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App |
|