政讯通中心

欢迎访问 化工在线网!

当前所在:首页 > 化工书籍 > 正文

AI翻开生命“密码全书” 全新大模型可预测和设计基因序列

发布时间:2024-11-18  作者:佚名  来源: 河北省科学技术厅

  

  研究发表于本期科学封面。图片来源:《科学》网站

  科技日报北京11月15日电(记者张梦然)《科学》杂志15日发布了一项突破性研究成果:美国斯坦福大学Arc研究所团队利用人工智能(AI),开发出一种大规模基因组基础模型“Evo”,翻开了生命的“密码全书”。该模型采用先进架构,能够以前所未有的精度,解析和设计从分子层面到整个基因组级别的DNA、RNA及蛋白质序列。其不仅能够预测突变对细胞内部各个调控层级的影响,还能设计出用于操控细胞功能的DNA序列,这或将彻底改变合成生物学的发展路径。

  科学家一直试图借鉴大型语言模型的成功经验,让AI技术将DNA视为一种“语言”来建模,但现有模型捕捉广泛基因组交互作用的能力有限。

  此次,研究团队开发了具备70亿参数的Evo模型,能够生成覆盖整个基因组的DNA序列。该模型利用270万来自进化多样性微生物的基因组数据集进行了训练,并首次报告了DNA领域的缩放定律,这项发现与语言和视觉领域已知的现象相呼应。实验结果显示,Evo在预测性和生成性的生物学任务中均表现优异,无论是预测突变对细菌蛋白质和RNA的影响,还是在模拟基因调控机制方面,都展现出了极高的准确性。

  此外,Evo还能够处理编码序列与非编码序列之间的复杂共进化关系,支持设计包括功能性CRISPR-Cas复合体和转座子在内的复杂生物体系。这是首次实现蛋白质-RNA和蛋白质-DNA结构与语言模型协同设计的例子。在全基因组尺度上,Evo能够生成超过100万碱基对的序列,其预测和生成能力涵盖了从分子到基因组的多层次复杂度,极大推进了人们对生物学本质的认识和操控能力。

  团队认为,后续模型将进一步扩展至人类及其他真核生物的基因组数据学习,通过增加上下文长度来更好地捕捉大基因组间的远程相互作用。这将为生物学研究开辟新的视野,推动生命科学领域的持续发展。

  【总编辑圈点】

  基因组序列的变化,其实有助于生物体适应不断改变的环境条件,进而驱动物种进化。随着DNA测序技术的飞跃进步,科学家已能够在全基因组范围内绘制出基因组变异图谱。再结合创新的AI算法,使得构建一个能深入理解DNA、RNA和蛋白质功能及其相互作用的综合模型成为可能。换句话说,现在,人们拥有了一个解码生命指令的基因组基础模型。

  


原文链接:https://kjt.hebei.gov.cn/www/kxpj22/kjqy89/324522/index.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。

环保项目简介 本网招聘 本网概况 联系我们 会员服务 免责声明 网站地图 投稿服务
全国政务信息一体化应用平台

本站部分信息由相应民事主体自行提供,该信息内容的真实性、准确性和合法性应由该民事主体负责。化工在线网 对此不承担任何保证责任。
本网部分转载文章、图片等无法联系到权利人,请相关权利人与本网站联系。

北京中农兴业电子商务股份有限公司主办 | 政讯通-全国政务信息一体化办公室 主管

化工在线网 huagongzx.org.cn 版权所有。

京ICP备16042780号-93

联系电话:010-69940054 010-80447989 监督电话:17276752290 违法和不良信息举报电话:010-57028685

第一办公区:北京市西城区砖塔胡同56号西配楼;第二办公区:北京市东城区建国门内大街26号新闻大厦5层

邮箱:huanbaofzxczx@163.com  客服QQ:2834255374 通联QQ:3404733191

北京中农兴业电子商务股份有限公司