人工智能(AI)蛋白质结构预测工具“阿尔法折叠”迎来重要升级。17日最新发布的“阿尔法折叠”数据集首次大规模纳入蛋白质复合物结构预测数据,数百万个由AI预测的蛋白质复合物结构向全球科研人员开放。这一成果由欧洲分子生物学实验室的欧洲生物信息学研究所、谷歌旗下“深度思维”公司、英伟达和韩国首尔大学四方合作完成,形成迄今规模最大的蛋白质复合物预测数据集。
新数据集首次系统性纳入蛋白质复合物结构预测数据,新增170万个高置信度的同源二聚体(由两个相同蛋白质组成的复合物)结构,为理解蛋白质如何通过相互作用发挥生命功能提供了重要基础。该数据集还优先收录了与人类健康和疾病研究密切相关的蛋白质。
自2021年开放以来,“阿尔法折叠”数据集已收录约2亿个单个蛋白质结构预测结果。不过,蛋白质往往并不是以单个分子形式发挥作用,而是通过形成复合物来实现功能。预测蛋白质复合物结构的难度远高于单体结构,对算力需求极高。
为此,研究团队对人类、小鼠、酵母以及结核分枝杆菌等20种研究最为深入的物种进行了系统分析,生成约3000万个同源二聚体预测结果,最终筛选出约170万个高质量数据纳入数据库。
科学界认为,将蛋白质复合物纳入结构数据库,是从“单个分子结构”走向“分子相互作用网络”的关键一步。研究表明,对于部分蛋白质而言,只有在以复合物形式建模时,才能获得准确的三维结构信息。
团队同时提醒,AI预测结果仍需谨慎使用。部分预测结构可能与真实生物状态存在差异,仍需通过实验手段加以验证,以确认其生物学意义。
据介绍,“阿尔法折叠”数据集未来还将进一步扩展,计划加入由两个不同蛋白质组成的异源二聚体结构预测。
当地时间12月17日,美国国家航天航空局(NASA)发表声明称,受不利的天气情况影响,美国国家航天航空局和太空探索技术公司(Spa 2024年度国家自然科学基金委员会与韩国国家研究基金会合作交流与双边研讨会项目指南 根据国家自然科学基金委员会(NS 陈志潜(1903—2000),生于四川成都。公共卫生学家、医学教育家、中国近现代农村公共卫生体系的开创者。1929年毕业于北京协 距离地球“只有”大约2200万光年的超新星SN 2023ixf发生了爆炸,也许它不是浩渺宇宙中最独特的星体,但其爆炸却对地球上的 2023年12月28日,陕西省审计厅在官网发布《2023年第9号审计结果公告》,其中西北大学2019年度预算执行及财务收支情况审计 据江苏省扬州市职业大学网站消息,扬州市职业大学教学督导室2023年12月28日发布《2023-2024学年第一学期教师及学生座谈 。本文链接:“阿尔法折叠”首次大规模纳入蛋白结构预测数据http://www.sushuapos.com/show-11-32674-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。