设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元文生图大模型全面开源

2024-05-29 08:51:07 来源: 科技日报

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。9ES速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:腾讯混元文生图大模型全面开源http://www.sushuapos.com/show-2-6308-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 山西大学团队用图调控网络 实现高性能点云分割

下一篇: 具身智能:步入AI舞台中央?

热门资讯

  • 我国科研团队揭示非洲猪瘟病毒感染致病机制

    记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制

  • 数字化管理已在故宫广泛应用

    在今天的故宫,工作人员使用的数字化办公平台名叫“内务辅”,这款应用的开发者,是与故宫博物院合作的钉钉(中国)信息技术有限公司(以下简称“钉钉”)。3月1

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 阿尔茨海默病早期症状可能表现在视力上

    据阿根廷布宜诺斯艾利斯经济新闻网报道,一项国际研究发现,阿尔茨海默病的早期症状可能表现在视力上。研究显示,即便眼科检查结果正常,但阅读、估计距离

  • 每12个恒星或有一个吞过行星

    据《自然》20日消息称,天文学家对91对恒星所作的光谱分析显示,大约每12个恒星中就有一个可能吞噬了一个行星。在吞噬一个行星后,恒星的化学构成可能发

  • 肺癌蛋白质致命弱点发现

    肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团

  • 12类健康食品获电商10亿资源扶持 “吃得健康”酝酿产业机会

    21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道“民以食为天,食与民同欢”,吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者

  • 云海二号02组卫星发射成功

    记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任

  • “AI钢铁侠”黄仁勋,又进化了英伟达

      “AI钢铁侠”黄仁勋,又进化了英伟达  作 者丨倪雨晴  2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI爱好者翘首以待黄仁勋的独家SOLO。  北京

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • iPhone总裁库克访问中国:女子手持huaweiMate60与其合影

    3月25日消息,国内一场经济高峰论坛上,iPhone总裁蒂姆·库克再次成为焦点。然而,引起人们关注的并非库克的讲话内容,而是一张自拍照片。在论坛现场,一

  • 首批未来产业创新成果惊艳亮相

    全球首台无细胞蛋白质合成生物反应器、全球首台全高温超导托卡马克装置(洪荒70)、64比特超导量子计算机研发与产业化项目、深海可燃冰探采重载作业机

推荐资讯

  • 日榜
  • 周榜
  • 月榜