设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

涉17万个视频!英伟达等巨头被曝违规使用YouTube数据训练模型

发布时间: 来源:

  涉17万个视频!英伟达等巨头被曝违规使用YouTube数据训练模型dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  澎湃新闻记者 胡含嫣dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  科技巨头被曝使用未经授权的YouTube内容训练AI(人工智能)模型。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  当地时间7月16日,据外媒报道,包括苹果、英伟达、Salesforce和Anthrophic在内的一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的未授权数据。这些公司使用了一个由第三方提供的数据集,其中包含从YouTube上抓取的大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的规定。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  报道指出,这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的数据集,大小为5.7GB,包含4.89亿个单词,来自Youtube上超过4.8万个频道中的17.35万个视频。该数据集由视频字幕的纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  非营利性组织EleutherAI是争议数据集的创作者,公司尚未对此事作出回应。根据官网介绍,EleutherAI的目标是“降低AI开发的门槛,通过训练和发布模型,让大家接触到尖端的AI技术”。此前,EleutherAI发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括YouTube Subtitles。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  资料显示,在苹果于今年4月发布端侧小模型OpenELM模型的几周之前,公司就使用了Pile进行训练。不过,值得注意的是,苹果自己并没有下载这些数据。因此,从技术层面来说,是EleutherAI违反了YouTube的使用条款。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  AI初创公司Anthropic的一位发言人证实,Pile数据集已被用于训练公司的生成式AI助手Claude,而YouTube的相关条款仅涉及“直接使用其平台”,建议与Pile的原作者讨论任何违反YouTube服务条款的行为。苹果、英伟达、Salesforce等其他公司尚未对此事作出回应。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此次事件影响到的创作者包括Marques Brownlee、MrBeast和PewDiePie等知名博主,以及《纽约时报》、英国广播公司(BBC)和美国ABC News等大型新闻出版商。另外,数据集中的一些材料宣传了“地平说”等阴谋论,甚至还包含了已被删除的视频的内容。现在,Pile已从官方下载网站上下架,但仍可通过文件共享服务访问。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对此,知名科技博主Marques Brownlee在X(原推特)平台上表示:“苹果从几家公司获取了他们AI所需的数据,其中一家从YouTube视频中抓取了大量数据/转录文本,包括我的视频。从技术上来说苹果没有‘犯错’,他们没有主动抓取数据。但这将是一个长期存在的问题。”dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  虽然苹果和其他公司或许是使用了公开的数据集,并没有违规行为,但此次事件让人们又一次关注到AI训练背后的数据问题。今年年初,YouTube的母公司谷歌被曝利用该平台的视频来训练旗下模型,谷歌当时回应称,这种行为没有违反平台与创作者的协议。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  今年3月,OpenAI首席技术官米拉・穆拉蒂(Mira Murati)在接受采访时还曾对文生视频模型Sora的训练数据来源含糊其词。4月,YouTube首席执行官尼尔・莫汉(Neal Mohan)在采访中表示,他并没有直接证据能够证明OpenAI确实使用了YouTube的视频来完善其文生视频AI工具Sora,如果真的使用了,那就“明显违反”了YouTube平台的使用条款。dax速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月17日,记者从陆军军医大学西南医院获悉,该院消化内科教授陈磊团队联合陆军军医大学教授张定林首次提出,活性氧响应性纳米材料能够把程序性死亡配体-1蛋白精准传递到肠道炎症部位,有效缓解肠炎 英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuum)是源自于大多数人听说过却未必完全了解的 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数   “AI钢铁侠”黄仁勋,又进化了英伟达  作 者丨倪雨晴  2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI爱好者翘首以待黄仁勋的独家SOLO。  北京时间3月19日凌晨,GTC终于拉开大幕。英伟达创 回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都比较强势,搭配清晰的产品定位策略和稳扎稳打 据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出租车在2030年广泛使用铺平道路。尽管在最初 。

本文链接:涉17万个视频!英伟达等巨头被曝违规使用YouTube数据训练模型http://www.sushuapos.com/show-2-7656-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: Shift Up上市背后:灵魂人物金亨泰与“伯乐”腾讯

下一篇: AI眼中的中国|今日大暑,万物盛极

热门资讯

  • 马斯克开源3140亿参数的Grok,大模型争相开源所为何求?

      马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯

  • 人工智能重新定义职场技能

    据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道,在人工智能(AI)迅速重新定义就业格局的今天,通常被称为“软”技能的人类技能成为最有韧性、最有价值

  • 我国科学家揭示东北黑土成因

    记者3月20日从中国科学院地质与地球物理研究所获悉,该所科研人员在东北黑土区开展了大范围的野外调查和样品采集工作,通过分析采集的黑土样品发现,黑

  • 原来,中国空间站里“四季如春”

    春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • vivo X Fold3首发碳纤维龙骨铰链:比苹果 15 Pro Max还轻薄

    3月23日消息,vivo即将于3月26日发布vivo X Fold3系列折叠屏电话,其中包含vivo X Fold3和vivo X Fold3 Pro两款新品。据悉,vivo X Fold3采用了首发的碳纤维

  • 限量抢!xiaomiCivi 4 Pro限定色真机照来了:3599元

    3月23日消息,xiaomi集团王晓雁晒出了xiaomiCivi 4 Pro限定色真机照,该系列共有三款颜色,分别是蓝色、粉色和黑与白,定价为3599元,将于4月1日开始发售。据了

  • 千元机皇 小8Gen3+1.5K直屏+5500mAh大电池 有点香啊!

    回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都

  • 英媒:人工智能助力抗体设计

    据英国《自然》周刊网站3月19日报道,研究人员首次利用生成式人工智能(AI)制造出全新抗体。报道称,本周生物学预印本资料库中的一份预印本报告的原理验

  • “地球一小时”背后:绿色低碳生产生活蔚然成风

    3月23日20时30分许,内蒙古自治区鄂尔多斯市,约200米的高楼、磐石造型博物馆、书籍外形图书馆等主要地标建筑纷纷关闭灯光,人们在静下来的城市里感受

  • 第三颗“厦门造”卫星出征

    3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门

推荐资讯

  • 国家外汇局:2月国际收支货物和服务贸易进出口规模39349亿元

      中新经纬3月27日电 27日,国家外汇管理局网站公布2026年2月我国国际收支货物和服务贸易数据。  2026年2月,我国国际收支货物和服务贸易进出口规模39349亿元。其中,货物和

  • 美股收跌,纳指进入回调区间,国际油价大涨

      中新经纬3月27日电 美东时间周四,美国三大股指全线收跌,纳指进入回调区间,即较其最近的高点下跌10%以上。来源:Wind  截至收盘,道指跌1.01%报45960.11点,标普500指数跌1.74%

  • 2025年营收超72亿!从卫龙年报看魔芋品类的“狂飙”

      当“低卡”“低糖”“高纤维”成为年轻人零食消费的关键词,一种来自深山、曾经默默无闻的食材――魔芋,正在完成一场华丽的逆袭。  从火锅里的配角,到年轻人手边的“解馋

  • 瑞银:2027年初黄金目标价5900美元

      中新经纬3月26日电 (罗琨)26日,中新经纬获悉,瑞银财富管理投资总监办公室(CIO)发表机构观点称,黄金仍将发挥对冲作用,预期黄金2027年初目标价将在每盎司5900美元。  本周

  • A股三大指数集体低开 存储芯片板块领跌

      中新经纬3月26日电 周四,A股三大指数集体低开。上证指数跌0.17%,报3924.96点;深证成指跌0.32%,报13756.87点;创业板指跌0.54%,报3299.03点。  来源:同花顺  盘面上,行业板块

  • 9连涨后2连跌停,*ST新潮称“无应披未披事项”

      中新经纬3月25日电 25日晚间,*ST新潮发布《股票交易异常波动公告》称,截至公告披露日,除已披露事项外,不存在应披露而未披露的重大信息  Wind显示,近日,*ST新潮股价走出“过

  • “中园石化”被立案调查 律师解读是否涉嫌“傍名牌”|宅男财经

      【宅男财经|专家面对面】有网友发帖称,加完油才发现自己去的是“中园石化”,而不是“中国石化”,并称名字真的太像了!当前,河北石家庄鹿泉区市监局已对此立案调查,将根据调

  • 洲际油气高息借钱,还压上核心资产

      中新经纬3月25日电 (张澍楠)贷款利率10.5%、核心资产担保、被抵押主体资产高于合并报表总资产,这些字眼出现在洲际油气下属子公司贷款公告中。  上交所网站截图  该

  • 中上协:2月末全市场总市值再创新高,同比增34%

      中新经纬3月25日电 25日,“中国上市公司协会”微信号发布统计月报。  截至2026年2月28日,境内股票市场(以下简称“全市场”)共有上市公司5492家,沪、深、北证券交易所分

  • 泡泡玛特营收破300亿,股价盘中跌超21%

      中新经纬3月25日电 (郑艺佳)在泡泡玛特2025年8月举办的2025年中期业绩会上,泡泡玛特创始人、CEO王宁曾表示感觉营收“300亿也很轻松”。  3月25日,泡泡玛特国际集团有限

  • 林毅夫:看到“内卷”不用太紧张 必然会出现

      中新经纬3月24日电 (薛宇飞)“我们看到‘内卷’也不用太紧张,因为我们知道这是必然会出现的,就像人不断在长大,原来的衣服就会不合适,要买新的衣服一样,‘内卷’也是同样的。

  • 纳睿雷达终止收购,股价高开低走

      中新经纬3月24日电 24日,纳睿雷达股价高开超4%,此后迅速翻绿,截至发稿跌超2%。  3月23日,纳睿雷达发布公告称,鉴于市场环境变化等因素,董事会审议通过了终止发行股份及支付

  • 日榜
  • 周榜
  • 月榜