设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗

发布时间: 来源:

21世纪经济报道记者冯恋阁 实习生孔雅萱 广州报道U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

#斯坦福抄袭中国大模型#的话题近日出现在各大平台热搜中,引发了全网关注。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2名斯坦福学生和1名南加州大学学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称训练出了一个开源多模态模型Llama 3-V。这一模型比GPT-4、Gemini Ultra、Claude Opus等模型能力更强,更引人注目的是,其训练成本只需要500美元。很快,Llama 3-V 冲上了全球知名开源社区HuggingFace的趋势榜首页。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不久,有网友发现,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型结构、代码、配置文件等方面几乎一模一样,只是将变量名称做了更改。该网友更是直接将相关的关键证据一一截图,进行列举证明。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随后,面壁智能团队证实,Llama3-V与MiniCPM一样,可以识别出“清华简”上的战国古文字(清华大学于2008年7月收藏的一批战国竹简),“不仅对得一模一样、连错得都一模一样”。 这一古文字数据是研究团队花费数月从竹简上逐字扫描、人工标注得到的,并未对外公开。Llama 3-V模型的团队成员 Aksh Garg在其社交平台上发文回应了质疑,表示所有训练代码由团队另一位成员编写,自己并不知情,并对原作者表达歉意。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

至此,此次大模型套壳抄袭事件暂告一段落。不过,公众对于大模型套壳的讨论并未止歇。斯坦福团队错在何处?大模型“套壳”争议频出,究竟是开源常态还是原创性缺失? U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源,开的是什么?

早在生成式AI影响力大爆炸前,开源和闭源就是软件开发过程中必须要经历的决策。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“源”最初指的就是源代码。公开与否,决定了后来者在使用、改编这个软件时有多大的自由度。闭源意味着只有编写者或者系统开发商掌握着修改源代码的权力,这虽然为经营者带来了先发优势,但一定程度上也抑制了后来者的创造能力,进而导致后期影响力扩大变得相对困难。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,随着技术进步,开源逐渐成为互联网精神的一部分。比如,操作系统Linux,在上世纪90年代初发布时就坚持开源至今。Linux开源极大推动了互联网发展。此前,360公司创始人周鸿祎评论“没有开源就没有 Linux,没有 Linux 就没有互联网。” U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从字面意思来看,开源似乎意味着开源模型成为一种公共资源,可以被随意使用、修改。但事实上,开源生态不是“法外之地”,其使用行为将受到开源许可的约束和管理。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研发者作为版权所有人,可以通过开源许可授予不特定的使用者附条件的版权许可。使用者需要按约定,通过特定使用方式、在约定包含的场景中使用开源模型。“大模型开源的程度、方式不尽相同,开源协议自然也不一样。”阿里研究院AI治理中心主任傅宏宇指出。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前通行的开源协议包括GPL、BSD、MIT、Mozilla、Apache和LGPL等,它们在修改后是否可闭源、修改后是否需要说明等方面要求各不相同。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面壁智能联合创始人、首席科学家刘知远在朋友圈发表了一篇言辞恳切的回应,认为Llama3-V团队未能遵守开源协议对前人成果尊重,严重破坏了开源共享的基石。“Llama3-V团队的问题不仅仅在于违反了哪项开源协议,而是将他人成果声称为自己的成果。”刘知远在接受21世纪经济报道记者采访时进一步指出。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本次事件主角MiniCPM采用的开源协议Apache Licence 2.0。这一协议允许使用者修改代码,也允许使用者将成果开源或商用。对应的交换条件则是,后续使用者需要在被修改的文件中说明修改过代码;在修改后以及源代码衍生的代码中需要包含源代码的协议、商标、专利声明等说明。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如何分清“壳”与“核”?

违背开源协议的“套壳”行为是如何被发现的? U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然针对特殊数据集的识别能力并不是惯用的防伪手段,但这次风波中“套壳”嫌疑最终被确认,直接证据是能够识别“清华简”上的战国古文字。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据刘知远介绍,除了类似“清华简”识别能力这样的“水印”外,“套壳”一般通过大模型的分词词表、架构设置(如层数、向量维数等)和能力表现等判断。“这次之所以能够比较确认Llama3-V套壳MiniCPM-Llama3-V 2.5,主要还是这层‘壳’薄到近乎透明,能够找到多方面的直接证据。”刘知远表示。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在傅宏宇看来,窃取模型参数、谎报模型来源等不负责任的使用行为,违背了诚信原则和开源精神,开源社区可采取措施予以处理和规范。如果对开源模型的“抄袭”构成知识产权侵权行为,开源模型权利人则可以依据开源许可协议保护自身权益。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他认为,此次Llama 3-V对MiniCPM的套壳,符合知识产权侵权行为的定义。“虽然项目已经开源,但研发者依然是工作成果的版权权利人,有权对其作品主张权益保护。”傅宏宇指出,斯坦福团队这种将他人开源的工作成果微调并直接转化为自己的工作成果公开发布的行为,可参考《计算机软件保护条例》的相关规定构成传统软件知识产权侵权,具体涉及复制著作权人软件、向公众发行、通过网络传播软件、故意删除或者改变软件权利管理电子信息等侵权行为。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

围绕大模型套壳的是非之争并不是首次上演。在此之前,多家国内外企业都曾卷入类似纷争。比如,李开复零一万物发布的大模型“Yi”就曾被指控使用了Llama的架构,只对两个张量进行了重命名。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,这些争议到最后似乎都没有迎来一个确定的结果。在几个回合的指控与回应后,没有判决、赔款或者标准来回应各界的关注。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

站在巨人的肩膀上 

“套壳”争议屡屡出现,可能是由于各界对这一概念存在不同的理解和判断。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

刘知远告诉21世纪经济报道记者,“套壳”的说法,很多时候宽泛地包括了所有已有开源模型利用自有数据进一步训练和微调,从而形成定制模型的行为。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但与大众对“套壳”的负面看法有些许不同的是,对开源模型的微调动作,实际上是被允许和鼓励的。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“套壳”这种说法本身就带有贬义的意味。刘知远坦陈:“很多开源模型的协议允许定制和修改,只要遵守开源协议就应当支持和保护。” U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“善用前人成果,努力站在巨人肩膀上实现高质量发展,是开源社区的重要价值。”他指出。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI技术日新月异,市场需求也瞬息万变。金沙江创投主管合伙人朱啸虎曾经公开表态,AI应用应该尽可能实现快速商业化,而Llama的发布增大了创业者在逐渐收紧的时间窗口活下来的几率。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了时间,算力、算法、数据无一不是自研大模型需要面对的难关。这种情况下,以开源模型为基础微调的定制模型成为性价比最高的选择。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此前,现象级AI搜索产品Perplexity所在公司的CEO Aravind Srinivas在一档播客上直白地表示,“一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义”。U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就如通往成功的路站在巨人的肩膀上更好走,“质疑套壳、理解套壳、成为套壳”或许是AI应用元年的一种求生思路。 U2R速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,人工智能(AI)领域的激烈竞争,对该领域的监管 未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足球比赛中预测角球结果并提供实际且准确的战 英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内容编译如下:美国开放人工智能研究中心(OpenAI 21世纪经济报道记者雷晨 北京报道随着人工智能技术的飞速发展,Kimi概念股成为资本市场的新宠。3月21日,受Kimi智能助手技术突破的催化,相关概念股集体走高,市场对AI板块的热情再次被点燃 “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源管理司副司长张鸿星21日接受科技日报记者采 有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权其型号。这可能是为了向中国的iPhone客户提 。

本文链接:斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗http://www.sushuapos.com/show-2-6922-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 对话丨面壁智能刘知远谈被斯坦福学生AI团队抄袭:善用开源成果,将快速提升AI能力的“下限”

下一篇: 马斯克赢下天价薪酬关键一战 560亿美元可以买下中芯国际

热门资讯

推荐资讯

  • 中国人寿总裁利明光回应单季度亏损:建议拉长周期看报表

      中新经纬3月26日电 (李自曼)“周期越短,受到波动影响会更大,这是经营过程中经常遇到的一个现象。”26日,中国人寿总裁利明光在中国人寿2025年度业绩发布会上说。  财报显

  • A股三大指数跌超1%,化工板块逆市走强

      中新经纬3月26日电 26日,A股低开低走,三大指数跌超1%。上证指数跌1.09%,报3889.08点;深证成指跌1.41%,报13606.44点;创业板指跌1.34%,报3272.49点。  Wind截图  盘面上看,油

  • 沪指半日跌0.58% 光伏设备板块集体回调

      中新经纬3月26日电 周四早盘,A股三大指数早盘冲高回落。截至午间收盘,上证指数跌0.58%,报3909.16点;深证成指跌0.38%,报13748.30点;创业板指跌0.07%,报3314.64点。  沪深两市

  • 外媒:欧洲天然气库存快空了

      中新经纬3月25日电 据彭博社报道,欧洲即将进入天然气储备季,但储罐已快耗尽,这意味着它将需要与亚洲买家竞争以确保供应。  报道称,根据欧洲天然气基础设施公司的数据,目前

  • 拟撤销私人银行专营牌照?交通银行回应:现有业务不受影响

      中新经纬3月25日电 (魏薇)近日,有媒体报道称,交通银行拟申请撤销私人银行专营机构牌照。25日,中新经纬从交通银行方面获悉,为强化财富金融特色,提升客户服务能力,经董事会审议

  • 徐必久任生态环境部副部长

      中新经纬3月25日电 人社部网站25日消息,国务院任免国家工作人员。人社部网站截图  任命徐必久为生态环境部副部长;任命刘海波为国家机关事务管理局副局长;任命章冬梅(女)

  • 泡泡玛特营收破300亿,股价盘中跌超21%

      中新经纬3月25日电 (郑艺佳)在泡泡玛特2025年8月举办的2025年中期业绩会上,泡泡玛特创始人、CEO王宁曾表示感觉营收“300亿也很轻松”。  3月25日,泡泡玛特国际集团有限

  • 沪指收复3900点!券商:A股仍处牛市,大盘蓝筹有较好安全边际|宅男财经

      【宅男财经|首席面对面】25日,沪指高开后持续拉升,盘中重回3900点,超5000股上涨,玻璃纤维、CPO、高速铜连接等算力硬件题材活跃。  昨日,A股在地缘政治风险缓和预期的背

  • 外媒:英国商业活动增长几近停滞

      中新经纬3月25日电 据英国《金融时报》中文网24日消息,美伊局势推高成本,英国商业活动增长几近停滞。  报道指出,一项备受关注的调查显示,英国商业活动正以自9月以来最慢

  • 妙可蓝多亿元投资公允价值归零

      中新经纬3月25日电 上海妙可蓝多食品科技股份有限公司(下称“妙可蓝多”)24日披露2025年年度报告。其中提到,对上海祥民投资的公允价值调整至零。  亿元投资公允价值归

  • 中国电信2025年净利微增,全年拟派息248.9亿元

      中新经纬3月24日电 24日晚间,中国电信披露《2025年年度报告》称,2025年实现营业收入5239.25亿元,同比增长0.1%;归属于上市公司股东的净利润331.85亿元,同比增长0.5%。  中

  • 博鳌对话|林桂军:能源消费要像饮食一样多样化

      中新经纬3月24日电 (薛宇飞 闫淑鑫)“保障能源安全,一是要做好能源多样化,二是要做好能源消费多样化。”24日,在博鳌亚洲论坛2026年年会上,对外经济贸易大学原副校长林桂军

  • 日榜
  • 周榜
  • 月榜