科技日报北京5月10日电 (记者张梦然)美国俄勒冈大学研究团队发布了一项突破性成果。他们利用ChatGPT同源技术,攻克了生物进化研究难题,开发出全球首个面向群体遗传学的语言模型。该人工智能(AI)工具可解析DNA序列中的突变规律,几分钟就可追溯基因对的共同祖先,为重建生物进化史提供了全新模式。相关论文刊登于新一期《美国国家科学院院刊》。
图片来源:AI生成这项技术受大语言模型启发,采用改进版GPT-2架构,但训练数据并非自然语言,而是基于细菌、啮齿类、蚊媒及灵长类等多物种的进化模拟数据。模型通过学习DNA序列中“A、T、C、G”四种碱基构成的“遗传语言”,识别出类似文本错别字的突变模式,这些随世代累积的变异正是追溯血缘关系的分子路标。
在传统群体遗传学中,依赖概率统计的推断方法虽精度可靠,但面临计算效率瓶颈。尤其在应对大规模基因组数据时,解析单个染色体可能耗时数日,且难以处理片段缺失的不完整序列。新模型将繁重的统计运算前置到训练阶段,实际应用时仅需数分钟即可完成传统方法需数小时的任务,速度提升达数十倍。测试表明,其在推算基因“认祖”这一核心指标上,已媲美现有最优统计方法。
该技术对公共卫生研究具有直接价值。研究团队正将其应用于疟疾防控领域,通过分析蚊虫种群中抗药性基因的演化轨迹,揭示杀虫剂选择压力下的进化动态。而理解抗性基因何时出现、如何扩散,正是制定可持续防控策略的关键。模型对非完整数据的兼容性,恰好解决了野外采样常见的基因序列碎片化难题。
团队计划进一步拓展模型功能,从当前双谱系分析向多谱系全基因树重建迈进。尽管传统方法已能实现部分功能,但机器学习路线有望在处理海量数据方面展现独特优势。目前团队正致力于优化算法,以捕捉更复杂的进化信号。这项跨学科探索不仅为遗传学注入新方法,也为AI在生命科学领域的深度应用提供了新路径。
在庞大的维生素家族中,最为人所熟悉的恐怕就是维生素C了。 作为人体必需的维生素之一,维生素C因其具有的超强抗氧化 临近年末,开源领域“火力全开”:华为以超过120个上游软件和多个主流开源项目的贡献值,在多个主流开源项目中排名第一;上 12月18日晚,甘肃临夏州积石山县发生6.2级地震,震源深度10公里,已致多人遇难,部分水、电、交通、通讯等基础设施受损。应急管 编译 | 杜珊妮 美国高等教育的毕业率已经陷入了长达3年的停滞,辍学率常年维持在29%。这一令人震惊的数据由美国国家学生 2023年12月28日,陕西省审计厅在官网发布《2023年第9号审计结果公告》,其中西安工业大学2020年度预算执行及其他财务收支 ? 肖连团 ? 番兴明 ? 陈 勇 ? 马 洁(以上照片均为受访者提供) ? 数据来源:科技部、国 。本文链接:利用AI工具,几分钟即可追溯基因对共同祖先http://www.sushuapos.com/show-11-34229-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 3纳米以下二氧化钛薄膜“变身”铁电材料
下一篇: 五种金属构造出性能更优异的纳米晶体