设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

京东开源图像模型,实测AI如何能真正“看懂”空间

发布时间: 2026-04-09 10:07:48 来源: 新京报

用AI做图、修图时,大众经常会遇到一些难题:想把图中的杯子挪个位置,结果杯子变形了;想换个视角看看画面,透视却完全不对;想调整两个物体的前后位置,也会出现遮挡混乱、比例失衡……0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月8日,记者从京东获悉,京东探索研究院近日正式开源了自研的JoyAI-Image-Edit图像模型,以解决上述难题。京东探索研究院称该模型是业内首个把“空间智能”刻进骨子里的开源模型,让AI终于能真正“看懂”空间、“编辑”空间,从原来的平面修图,升级成了三维空间重塑,而且模型的推理代码全部开放,开发者能直接拿来做应用。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方资料显示,JoyAI-Image-Edit贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全面兼容15类通用编辑能力擅长长文本精准渲染0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体而言,该模型打破了AI“理解图像”和“生成图像”的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致。不管是移动物体、换视角,还是调整物体间的关系,都能保持场景的几何规律,遮挡、光影也都自然合理,不会再出现变形、错乱的情况。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人对新京报贝壳财经记者表示,JoyAI-Image-Edit的核心跃升,在于其攻克了此前开源模型难以逾越的空间理解难题,具备三大辨识度高的空间编辑能力:视角变换——用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;空间漫游——支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中“走动”;物体空间关系操控——在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在实现空间级突破的同时,JoyAI-Image-Edit全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角一致性生成等行业高难度任务中表现卓越,真正做到了全场景、无死角的高效创作。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东高级副总裁何晓冬在接受新京报贝壳财经记者采访时表示,通用人工智能有两个方向要走,一个方向是多模态,大模型必须具有视觉能力,未来甚至可以更进一步延伸向嗅觉、触觉;另外一个方向是走向具身智能,包括机器人、机械臂、无人车等,让通用人工智能走向物理世界。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

重点应用于具身智能领域模型还将探索多种场景0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

应用层面,JoyAI-Image-Edit模型可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具身智能相关测试图。受访者供图0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在具身智能实测领域,演示效果显示:用户仅需输入自然语言提示词(如“机器人左手举起来”),并通过画框框选目标区域,即可对指定物体的动作、姿态、旋转角度进行精细化操控。在机器人做家务的实拍场景中,模型在完整保留背景环境、物体空间关系与物理合理性的前提下,生成了机器人抬手的全新姿态。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2025年,京东在具身智能领域完成关键布局。其依托JoyAI大模型底层能力,正式推出JoyInside“附身智能”解决方案,面向智能家电、机器人等终端硬件植入高情商交互系统,将AI的认知与情感能力深度嵌入硬件终端,实现更贴合人类习惯的自然交互。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此后,京东持续探索具身智能生态建设。一方面,围绕JoyInside平台迭代技术版本,升级语音、多模态感知等核心能力;另一方面,加快产业落地,通过开放接口、合作开发等模式,与多家家电及机器人企业达成合作,推动具身智能技术在家庭陪伴、日常服务等场景的规模化应用。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人称,此次JoyAI-Image-Edit的开源,是京东在AI多模态模型领域的重要布局,让AI图像编辑实现了从平面到空间的大跨越。未来该模型还将持续落地更多场景,不断探索空间智能落地价值。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用AI做图、修图时,大众经常会遇到一些难题:想把图中的杯子挪个位置,结果杯子变形了;想换个视角看看画面,透视却完全不对;想调整两个物体的前后位置,也会出现遮挡混乱、比例失衡……0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月8日,记者从京东获悉,京东探索研究院近日正式开源了自研的JoyAI-Image-Edit图像模型,以解决上述难题。京东探索研究院称该模型是业内首个把“空间智能”刻进骨子里的开源模型,让AI终于能真正“看懂”空间、“编辑”空间,从原来的平面修图,升级成了三维空间重塑,而且模型的推理代码全部开放,开发者能直接拿来做应用。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方资料显示,JoyAI-Image-Edit贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全面兼容15类通用编辑能力擅长长文本精准渲染0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体而言,该模型打破了AI“理解图像”和“生成图像”的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致。不管是移动物体、换视角,还是调整物体间的关系,都能保持场景的几何规律,遮挡、光影也都自然合理,不会再出现变形、错乱的情况。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人对新京报贝壳财经记者表示,JoyAI-Image-Edit的核心跃升,在于其攻克了此前开源模型难以逾越的空间理解难题,具备三大辨识度高的空间编辑能力:视角变换——用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;空间漫游——支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中“走动”;物体空间关系操控——在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在实现空间级突破的同时,JoyAI-Image-Edit全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角一致性生成等行业高难度任务中表现卓越,真正做到了全场景、无死角的高效创作。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东高级副总裁何晓冬在接受新京报贝壳财经记者采访时表示,通用人工智能有两个方向要走,一个方向是多模态,大模型必须具有视觉能力,未来甚至可以更进一步延伸向嗅觉、触觉;另外一个方向是走向具身智能,包括机器人、机械臂、无人车等,让通用人工智能走向物理世界。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

重点应用于具身智能领域模型还将探索多种场景0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

应用层面,JoyAI-Image-Edit模型可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具身智能相关测试图。受访者供图0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在具身智能实测领域,演示效果显示:用户仅需输入自然语言提示词(如“机器人左手举起来”),并通过画框框选目标区域,即可对指定物体的动作、姿态、旋转角度进行精细化操控。在机器人做家务的实拍场景中,模型在完整保留背景环境、物体空间关系与物理合理性的前提下,生成了机器人抬手的全新姿态。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2025年,京东在具身智能领域完成关键布局。其依托JoyAI大模型底层能力,正式推出JoyInside“附身智能”解决方案,面向智能家电、机器人等终端硬件植入高情商交互系统,将AI的认知与情感能力深度嵌入硬件终端,实现更贴合人类习惯的自然交互。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此后,京东持续探索具身智能生态建设。一方面,围绕JoyInside平台迭代技术版本,升级语音、多模态感知等核心能力;另一方面,加快产业落地,通过开放接口、合作开发等模式,与多家家电及机器人企业达成合作,推动具身智能技术在家庭陪伴、日常服务等场景的规模化应用。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人称,此次JoyAI-Image-Edit的开源,是京东在AI多模态模型领域的重要布局,让AI图像编辑实现了从平面到空间的大跨越。未来该模型还将持续落地更多场景,不断探索空间智能落地价值。0WT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业的创新浪潮。新质生产力时代到来,政企用云进 民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精神的持续亢奋,该大学生还经常出现整晚不睡觉 据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成为全球范围内导致人们健康损害的主要原因。 21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道“民以食为天,食与民同欢”,吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者已不止于填饱肚子,而是讲求“精耕细作”。消   中新经纬3月22日电 据《日本经济新闻》22日报道,夏普正在讨论缩小液晶显示器业务,夏普已将子公司显示器(SDP、位于市)停产纳入视野。显示器业务持续陷入苦战,成为夏普在2022财年(截至2023年3月)时隔5年陷入最终亏损 在近日开幕的中国国际核工业展览会上,中国核学会理事会党委书记、理事长王寿君表示,中国内地现有在运核电机组55台、居全球第三;在建核电机组26台,保持全球第一。这些成绩的取得,离不开智能化技术 。

本文链接:京东开源图像模型,实测AI如何能真正“看懂”空间http://www.sushuapos.com/show-2-15970-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 北京研发出全球首款全自主网球人形机器人

下一篇: DeepSeek上线专家模式

热门资讯

推荐资讯

  • 花呗怎么取钱出来,商家教您5妙招

    花呗,作为支付宝旗下的消费信贷服务,凭借其便捷性和低门槛,深受广大用户喜爱。然而,在遇到急需用钱的情况时,如何将花呗里的钱“套”出来,成为了不少用户关注的焦点。今天,小编就为

  • 哪里可以套京东白条

    一、筛选合适京东商家: 选择官方合作商家,京东白条有一些官方指定或合作的线下商家,这些商家在操作规范性和安全性上更有保障。例如部分大型连锁超市、家电卖场等,它们与京东有

  • 哪个平台套花呗最简单,4种有效方法

    一、通过购物的方式提现花呗的额度。在淘宝、天猫等平台选择和提现金额相仿的商品下单,然后利用花呗账单和退款的时效性,将这笔资金提现。 二、通过支付宝商家进行套现。可以

  • 专业白条取现商家,小白必看3种方法

    京东白条本身并不支持直接提现功能。这是因为它主要作为一种信用支付工具,用于在京东平台上进行消费时使用,覆盖商品购买、部分服务支付等场景。 不过有间接方法可以获取现金

  • 豆包专业版上线,最高月费500元

    6月24日,豆包正式宣布推出豆包专业版。该服务基于最新的豆包2.1系列大模型,面向复杂办公和生产力场景,提供更高的复杂工作场景使用额度,并上线全新的办公任务模式。 专业版采

  • 台湾处理器巨头要涨价,手机厂商日子更难过?

    据中国台湾《经济日报》报道,近日,IC设计大厂联发科向客户发出涨价通知,这也是近年来联发科少数以正式函文方式启动价格调整机制。 市场解读认为,在全球半导体供应链成本持续垫

  • 烧死蒂尔丨Findme

    所谓“烧死蒂尔”在直播讲过,来自一篇文章,作者叫保罗·贝南蒂。此人是方济各的AI顾问,原文发在法国杂志《大大陆》,标题是“美国的异端邪说:彼得蒂尔

  • 以“债务咨询”为名围猎负债人

      以“债务咨询”为名围猎负债人    监管持续高压整治,但以律师事务所、债务法律咨询等为伪装的金融黑灰产,仍在各类短视频、社交、搜索平台全域渗透。近期,有消费者告诉

  • 【经纬晚班车】“电子工业大米”MLCC价格涨势胜黄金;*ST元道取消年度现金分红

    【晚间热点要闻】七部门:严厉打击非法回收拆解报废机动车活动近日,商务部等七部门办公厅制定了《报废机动车非法回收拆解专项整治行动方案》,其中指出,严厉打击非法回收拆解报废

  • *ST元道取消年度现金分红 已提示八次退市风险

      中新经纬6月24日电 *ST元道突然取消年度现金分红。  24日午间,*ST元道(元道通信股份有限公司,下称“元道通信”)发布公告称,公司第四届董事会第十八次会议审议通过了《关

  • 磷酸铁锂价格翻倍,买车要多掏钱?

      中新经纬6月24日电 (林琬斯)据央视财经21日报道,一包约400公斤的磷酸铁锂,现在的价格超过25000元。而在一年前,它的价格仅10000元,一年时间价格翻了一倍多。  磷酸铁锂作

  • 37批次食品抽检不合格:涉及零食、饮料等

      中新经纬6月23日电 据国家市场监督管理总局网站23日消息,国家市场监管总局办公厅发布关于37批次食品抽检不合格情况的通报。  近期,市场监管总局组织食品安全监督抽检18

  • 日榜
  • 周榜
  • 月榜