华人澳洲中文论坛

热图推荐

    中国迷信家发现少量全新RNA病毒,刷新全球认知(组图)

    [复制链接]

    2024-10-11 13:11:22 13 0

    据中山东大学学微信大众号,10月9日,中山东大学学医学院施莽传授团队与阿里云李兆融团队在《细胞》杂志(Cell)颁发论文讲演了180个超群、超过16万种寰球RNA病毒的发现,这是迄今为止范围最大的RNA病毒钻研,大幅扩展了寰球RNA病毒的多样性。该钻研将人工智能技术运用于病毒鉴定,发现了传统办法未能发现的病毒“暗物资”,探究了病毒学钻研的新门路。



    文章第一作者侯新(左三)和阿里云团队在中山东大学学医学院合影
    传统病毒发现办法遇瓶颈 人工智能冲破“已知”探“未知”
    病毒是地球生态零碎的首要组成部份,也与人类的安康亲密相干。然而,目前已知的病毒品种仍非常无限,用更高效、更精准的办法发现和鉴定新病毒,始终是病毒学钻研的根底任务。
    最先,人们经过别离造就病毒,在显微镜下视察确认病毒的存在。跟着生命组学的开展,迷信家们可以利用测序技术,对比未知病毒和已知病毒核酸序列的类似性,辨认和鉴定新病毒。这类办法非常依赖对病毒的既有认知。
    但是,RNA病毒是一种高度分化、品种单一且容易变异的病毒,尤为在面对不足同源性或同源性极低的“暗物资病毒”时,这类序列同源性比对的办法很容易失灵。

    使用人工智能对寰球病毒圈深度挖掘并分类
    人工智能技术的引入使冲破“已知”寻觅“未知”成为可能。钻研中,团队采取的中心算法LucaProt是一种可以深度学习的Transformer模型,在少量学习病毒和非病毒基因组序列后,能够自主造成一套对于病毒的判别规范,从而在少量的RNA测序数据集中挖掘出病毒序列。在测试中,LucaProt表示出极高的精确性和特同性,假阳性率为0.014%,假阴性率为1.72%。在与其余病毒挖掘工具的比较中,它也在处置较长序列的方面展示出劣势。
    “人工智能的算法模型可以挖掘出咱们以前疏忽或基本不知道的病毒,这类才能在疾病防控和新病原的疾速辨认中尤其首要。特别是在疫情暴发时,人工智能的速度和精度能够帮忙迷信家更快地锁定潜伏病原体。”施莽说。
    发现少量全新RNA病毒 刷新寰球病毒圈认知
    利用LucaProt,钻研团队对来自寰球生物环境样本的10,487份RNA测序数据进行病毒挖掘,发现了超过51万条病毒基因组,代表超过16万个潜伏病毒种及180个RNA病毒超群(至关于门或纲的分类级别),使RNA病毒超群数量扩容约9倍。其中23个超群无奈经过序列同源办法辨认,被称为病毒圈的“暗物资”。
    “这些病毒不只指感染人类的病原体,还包罗普遍存在于环境中的、感染各类生物的病毒。各种植物、动物、单细胞原生生物、真菌、细菌和古菌均可能感染病毒。深化理解环境中的病毒,有助于咱们更好地舆解全部生态零碎的运作机制。”论文第一作者侯新博士引见,“另外,咱们还能够利用这类办法发现与人类疾病亲密相干的病毒,用于新发沾染病的监测和预警。”
    依托数据挖掘出来的新病毒,是不是会停留在数字层面?经过对新发现病毒的剖析,迷信家们对病毒圈的认知也在不停深入。

    新发现病毒的遗传多样性(黄色部份)
    在这项钻研中,团队讲演了迄今最长的RNA病毒基因组,长度达到47,250个核苷酸;发现了超越以往认知的基因组构造,展示出RNA病毒基因组进化的灵敏性;辨认到多种病毒功用蛋白,特别是与细菌相干的功用蛋白,进一步标明还有更多类型的RNA噬菌体亟待探究。
    钻研指出,新发现的病毒散布在地球的各类生态环境中。整体上,落叶层、湿地、海水和废水环境的病毒多样性最高。但是,在南极底泥、深海热泉、活性污泥和盐碱滩等极端环境中,RNA病毒的多样性和丰度其实不低,乃至在深海热泉的低温环境中,仍有RNA病毒在活泼复制。
    “这项钻研中,病毒的发现应用了人工智能的技术,但分类仍基于现有的体系进行。面对远源的新病毒,现有的分类体系曾经显得力所能及。将来,这一体系在门、纲等更深档次的分类上,可能会有大范围的调剂。”施莽说,“咱们的钻研展现了病毒多样性的深度,但广度仍有待更多样本的增补。病毒的多样性远超人类想象,咱们目前所看到的还是冰山一角。”
    人工智能技术普遍运用 或助力破解更多科研困难
    LucaProt虽然是一个专门为RNA病毒发现设计的模型,但它同时融会了对蛋白质序列和隐含构造信息辨认的功用,也可用于蛋白质功用的鉴定。在论文中,钻研团队开源了LucaProt模型,并经过在线网站分享给寰球迷信家。
    “这个框架正在逐渐成为该畛域的前沿工具,也开始被运用到其余类型的蛋白质鉴定和功用发现工作上。”阿里云生物计算总监李兆融表现,人工智能正在逐渐改动迷信家解决包罗病毒学在内的各类迷信问题的形式。
    中国工程院院士、中国疾控核心沾染病溯源预警与智能决策全国重点试验室主任徐建国院士表现,LucaProt的胜利标记着人工智能算法在病毒发现方面的严重冲破。将来,人工智能办法无望成为微生物学畛域的次要工具,并可运用于病毒对人类致病性的预测。
    上海生物信息技术钻研核心主任、广州国度试验室李亦学钻研员以为,LucaProt可以从序列和空间构造两个程度上,融会提取RNA病毒基因组序列的长程相干信息和组成特点,可以先验地辨认数据中RNA病毒组成的模式和特点,这是传统的基于同源剖析的进化剖析办法难以企及的。因此能够看到,人工智能在解决生物学迷信问题中拥有更普遍的运用后劲。

    中山东大学学团队和阿里云团队在中山东大学学医学院探讨任务
    施莽引见,这项钻研与阿里云飞天试验室的AI4S-生物计算团队协作发展,他们专一于生物序列的根底模型钻研。中山东大学学团队担任病毒学方面的问题,而阿里云团队则专一于人工智能模型的开发和计算。“单方常常相互造访,一同坐上去探讨问题,帮忙彼此了解对方不相熟的畛域。”施莽说,“咱们但愿持续经过跨畛域、严密的科研协作,充沛利用云计算和人工智能的劣势,解决生命迷信畛域的首要问题。”

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题3

    帖子31

    积分127

    图文推荐