设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

从“抠图”到“抠视频” Meta上新AI工具SAM 2

发布时间: 2024-08-02 14:51:49 来源:

21世纪经济报道记者孔海丽、实习生王甜 北京报道1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

继2023年4月首次推出SAM,实现对图像的精准分割后,Meta于北京时间7月30日推出了能够分割视频的新模型SAM 2(Segment Anything Model 2)。SAM 2将图像分割和视频分割功能整合到一个模型中。所谓“分割”,是指区别视频中的特定对象与背景,并可以追踪目标。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2将图像分割能力泛化到了视频领域,其响应能力和准确度是一代的6倍,也是目前最优秀的视觉分割模型。Meta AI发布此版本时强调:“相信我们的数据、模型和见解将成为视频分割和相关感知任务的重要里程碑。”1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同日,扎克伯格在与黄仁勋的对谈中,透露出更多Meta 的AI进展,包括将推出一款基于Llama3.1模型构建的名为AI Studio的新工具,允许用户创建、分享和设计个性化的AI聊天机器人,用户还可以在社交媒体平台上分享他们的人工智能角色。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“细分一切”

SAM 2可以识别视频中的特定对象,并实时实现该对象的追踪与提取,在视频编辑与特效制作中,可以高效辅助工作。该模型也可以根据用户具体诉求,选择分割某个物体或某个区域,使控制更加精准。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与其他模型不同的是,SAM 2拥有对不熟悉物体和图像的零样本泛化能力,无需额外训练,只需单击一帧视频中的任何物体,即可实现对目标对象的实时追踪,快速处理未来每一帧。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除此以外,该模型还可以集成到更大的系统中,它善于从其他智能系统中获取提示,使系统之间完成协作。例如,SAM 2能够在AR/VR穿戴式设备中选择用户注视对象,也可以读取分割对象的边界框提示,完成文本提示到视频图像分割的转化。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了训练SAM 2,Meta自己建构了一个数据引擎——SA-V数据集,有效收集大量多样化的视频分割数据集并利用其去迭代模型。SA-V数据集包含5.1万个视频和64.3万个时空分割掩码(即masklet),是迄今为止最大的数据集,收集了47个国家/地区地理分布各异的真实世界场景的视频。SAM 2就在Meta开源的SA-V数据集上进行训练,为SAM 2提供的注释包括整个物体、部分物体和物体被遮挡的情况。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2模型辅助人类标注目标对象的掩码,与此同时,SAM 2将标注的掩码传播到视频其他帧,生成时空掩码,接受提示的SAM 2受益于对象在时间维度上的记忆,生成掩码预测。如此循环往复,使SAM 2得到不断更新。业内观点认为,SAM 2为视觉数据提供更快的注释工具,有望被用来训练下一代计算机视觉系统。
1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于视频中的动态物体,SAM 2如何精准识别呢?Meta为SAM引入了一种记忆机制。对于视频,记忆组件可以存储对象的有关交互信息和之前处理过的信息,使SAM 2能够在整个视频中实现预测行为。根据其提示式设计理念,如果在其他帧上提供了相关提示,SAM 2还可以根据存储的对象记忆上下文(前后帧)有效地纠正其预测,显著减少人工标注时间。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta官网提供了一个例子,目标对象被遮挡或从视野中消失。为了向模型解释这种新的模式,在SAM 2里新应用了“遮挡头”模型,用于预测当前帧中是否存在目标对象,判断物体是否可见,即使在物体暂时被遮挡时也有助于分割物体,使SAM 2能够有效地处理遮挡。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,当遇到长时间遮挡或者场景中有多个相似对象等情况时,SAM 2可能会丢失对物体的跟踪或是混淆物体。但同时,以上情况可以通过人为干预提供细化提示来解决。
1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尽管Meta自曝了SAM 2的不足,用户对该模型的未来依然寄予厚望。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在以往的视频编辑技术中,视频抠图需要一帧一帧地编辑。比如,国内明星真人秀节目数次遇到的“因某明星个人危机,需重新剪辑全部画面”问题,可能不再需要视频剪辑通宵达旦、连续加班。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2的应用范围广泛,在许多需要实时反馈的应用场景中将发挥其作用,包括自动驾驶、医学、视频拍摄剪辑、监控等。比如,捕捉动态对象实现实时交互,提高车载计算机视觉系统的敏锐性;在辅助医学治疗中,定位腹腔镜摄像机锚定的区域;在追踪摄影中,帮助无人机镜头跟随追踪濒危动物;在机场、车站人流密度大的区域实时监控人群,预警异常情况;也为视频内容博主提供了更多视频创意创作的可能性。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更好的开源生态

SAM 2也为新模型的出现埋下伏笔。SAM 2的分割生成结果可以输出给其他AI系统(例如现代视频生成模型),SAM 2本身也可以接受其他AI系统的输入提示,实现与目标对象的实时交互,比如,应用于直播时的AI公众形象搭建,自动驾驶路况分析等。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了使学术界能够在目前的基础上继续研究,Meta公开发布了预先训练的SAM 2模型、SA-V数据集、演示和代码。值得注意的是,尽管需要巨大算力支持,SAM 2仍坚持开源,并允许广大用户免费使用(在Amazon SageMaker平台上托管)。这让Meta庞大的透明开源生态又添一员。
1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期,扎克伯格多番强调了人工智能开源的意义,他曾撰写的长文中表示:“开源人工智能比任何其他现代技术都更具有潜力,可以提高人类的生产力、创造力和生活质量,同时还能加速经济增长并推动突破性的医学和科学研究。”1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“当今大多数领先的科技公司和科学研究都是建立在开源软件之上的。最重要的是,开源人工智能代表了世界上利用这项技术为每个人创造最大经济机会和安全的最佳机会。”扎克伯格补充说。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在与黄仁勋的对谈中,扎克伯格也再次表达了“希望下一代计算机发展回到开放生态系统获胜的局势”。1nA速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  诺贝尔化学奖获得者阿龙・切哈诺沃:做研究保持好奇心很重要  中新网宁波3月17日电(林波)对于学生而言,如何找到研究的信心和价值,让他们有继续下去的动力?  “做研究保持好奇心很重要。”3月17日,2004年诺贝尔化学 美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许多国家蛋白质消费极大比例的全球性行为,但捕 3月21日是世界睡眠日,今年中国主题为“健康睡眠 人人共享”。人的一生约有三分之一的时间是在睡眠中度过,睡眠、运动、营养被视为保障机体正常发育和健康的三大要素。关于睡眠有哪些常见认知误   我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面级,成功将云海二号02组卫星发射升空,卫星顺利 3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介绍,中国知网在人工智能大模型领域的深入研发 3月23日20时30分许,内蒙古自治区鄂尔多斯市,约200米的高楼、磐石造型博物馆、书籍外形图书馆等主要地标建筑纷纷关闭灯光,人们在静下来的城市里感受地球的呼吸与脉动。今年“地球一小时”中国 。

本文链接:从“抠图”到“抠视频” Meta上新AI工具SAM 2http://www.sushuapos.com/show-2-7792-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年的休闲对战游戏,仍是大DAU富矿?

下一篇: 北京中轴线申遗,数字技术参与深度前所未有

热门资讯

  • 云南首批621座变电站实现人工智能巡检

    “远方巡视启动!”南方电网云南保山220千伏大寨变电站日前启动首次全套智能巡视,109个摄像头快速旋转,10套在线监测系统开始收集数据,变电站的无人机机

  • 239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远

      239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 探月工程四期鹊桥二号中继星成功发射

    3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后,星箭分离,将鹊桥二号中继星

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • 云海二号02组卫星发射成功

    记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任

  • GPU持续升级 如何应对算力“贫富差距”

    英伟达的GPU又升级了。3月19日,英伟达CEO黄仁勋发布了最新的B200算力芯片GPU,FP8精度下的训练性能是上一代的2.5倍,FP4精度下的推理性能更是达到了上

  • 限量抢!xiaomiCivi 4 Pro限定色真机照来了:3599元

    3月23日消息,xiaomi集团王晓雁晒出了xiaomiCivi 4 Pro限定色真机照,该系列共有三款颜色,分别是蓝色、粉色和黑与白,定价为3599元,将于4月1日开始发售。据了

  • 北京首例负碳示范建筑正式亮相

    3月22日,在2024低碳建筑产业论坛上,北京首例负碳示范建筑——首程时代中心负碳示范建筑正式亮相。活动现场,中国建筑节能协会、北京绿色交

  • 甘蓝育种大突破:“一步法”快速创制不育系

    3月24日,记者从中国农业科学院获悉,该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队,开发了快速创制细胞质雄性不育系的新方法——“一步法

推荐资讯

  • 日榜
  • 周榜
  • 月榜