设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI之后,英伟达也卷入类似诉讼

2024-03-14 13:44:13 来源:

21世纪经济报道记者 冯恋阁 实习生肖文旸 广州报道VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI淘金热下,“卖铲人”英伟达也卷入到人工智能版权纷争中。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近日,英伟达和软件公司Databricks被多名作家在旧金山联邦法院提起集体诉讼,称两家公司在训练各自的大模型时“未经同意、未经认可、无补偿”地复制和借鉴了他们的书籍。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据集侵权,英伟达被诉

根据起诉书,英伟达和Databricks被指控分别使用盗版数字电子书库Books3的数据训练了旗下的大模型NeMo Megatron和MosaicML。“在训练期间,大模型复制并摄取训练数据集中的每个文本作品,并从中提取受保护的表达。”原告认为,两家公司在训练大模型时使用了含有盗版内容的数据集,因此构成著作权侵权。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

NeMo Megatron模型托管在大模型社区Hugging Face上。在这个网站中,每个模型都有一个介绍其相关信息的“模型卡”,其中就包括模型的训练数据集信息。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达模型所附的“模型卡”显示,它的训练数据包括EleutherAI提供的数据集“The Pile”。The Pile中包含了800GB的数据,有108GB是来自于Books3的图书数据。据悉,Books3由超过196000册来自影子图书馆Bibliotik的书籍组成。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所谓影子图书馆,是指未经许可收藏了大量享有著作权的书籍,并向公众免费开放的网站。除了本案中的Bibliotik,电子书网站Z-Library、文献网站Sci-Hub等都在此列。深陷版权诉讼中的Open AI此前也曾被质疑使用了来自影子图书馆的数据训练模型。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

影子图书馆在版权方面存在一定瑕疵。原告起诉书提到,2023年10月,Hugging Face上的Book3数据集被删除,并附有一条解释:“由于报告的版权侵权,该数据集已失效且无法再访问”。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

原告认为,NeMo已经承认在模型训练时采用了The Pile数据集,而The Pile数据集其中就包含了因版权问题被删除的Book3,基于此,NeMo也有著作权侵权的可能。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了对英伟达的诉讼,三位作家还针对Databricks及其旗下的MosaicML公司发起诉讼。起诉书表示,该公司最近收购了MosaicML公司,而MosaicML生产MPT系列大型语言模型中也使用了Books3数据集进行训练。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据报道,英伟达发言人回应媒体称:“我们尊重所有内容创作者的权利,并相信我们创建 NeMo 完全符合版权法。”VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

版权成原罪,争议难解

大模型的训练和调整离不开海量数据的输入,这些数据中混入侵权材料的情况也许并不罕见。版权瑕疵似乎也因此成为了大模型的“原罪”。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达并非唯一一家被指控大模型侵犯版权的科技公司。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

早在去年1月,美国三名漫画艺术家就对包括Stability AI在内的三家科技公司发起集体诉讼,指控其开发的付费AI图像生成工具构成版权侵权。去年7月,多名喜剧演员、作家对OpenAI和Meta分别发诉讼,指控其侵犯版权。10月,环球音乐集团及其他出版商也起诉美国人工智能公司Anthropic称其滥用“无数”受版权保护的歌词。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

日前,也有多位艺术家公开表示,Midjourney在未经他们许可的情况下,模仿他们的画风生成作品并输出的行为是"小偷行为"和对艺术家的不尊重。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而此前《纽约时报》诉 OpenAI “世纪大案”中的两方仍在缠斗。在OpenAI指控《纽约时报》方恶意引导模型生成版权内容后,《纽约时报》回击称此举是为了追踪“该工具侵犯版权的全部范围”。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在国内,大模型侵权的争议也一直存在。2023年6月,北京笔神公司起诉学而思称其窃取其数据;同年12月,正版青团子等四名画师起诉小红书,指控其未经授权使用画师的原创作品作为训练数据。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

科技公司大模型屡次遭起诉为拥有AI大模型及欲进入这一领域的科技公司敲响了警钟。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开发可检测AI内容是否侵权的工具或许是一种解法。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今年年初,人工智能模型评估公司Patronus AI发布了一款名为“CopyrightCatcher”的大模型检测工具,用以检测大语言模型的输出结果中是否含有侵权内容。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也有大模型企业选择“破财消灾”,通过签署授权协议达成对版权作品的合规使用。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2023年12月,据媒体报道,有知情人士表示,苹果拿出5000万美元尝试Condé Nast(《Vogue》和《纽约客》的出版商)、NBC和IAC等新闻机构交涉以获得新闻文章的授权,用以其生成式AI产品开发。OpenAI也在今年1月与数十家出版商洽谈签署文章授权协议,以获取数据训练其AI模型。VSO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:OpenAI之后,英伟达也卷入类似诉讼http://www.sushuapos.com/show-2-3718-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 人形机器人走向何方

下一篇: 芯片战场丨英伟达市值再度站上2.3万亿美元,能否继续“狂飙”?

热门资讯

  • 我国成功研制可靶向送药的磁驱软体机器人

    中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合

  • 站在“人工智能+”探索前列

    今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是

  • 打造平台级AI 引领行业创新

    3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣

  • 多功能金纳米花颗粒 可促进感染性组织修复

    3月17日,记者从海南大学获悉,该校化学化工学院副教授李萌婷与相关研究团队合作,合成了多功能复合金纳米花颗粒。该颗粒配合温和光热、光动力、药物控

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 研究发现神经系统疾病成人类健康主要“杀手”

    据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成

  • 探月工程四期鹊桥二号中继星成功发射

    3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后,星箭分离,将鹊桥二号中继星

  • 肠道菌群关键代谢物可增强抗癌药疗效

    记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢

  • 新研究揭示 光合作用进化“缺失的一环”

    一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 我国网民规模达10.92亿人:互联网普及率77.5%!

    3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12

  • 盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明

      盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明  澎湃新闻记者 吴遇利  Neuralink新技术或将造福数千万名失明人士。  当地时间3月21日,特斯拉C

推荐资讯

  • 日榜
  • 周榜
  • 月榜