设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

DeepSeek把自己误认成了ChatGPT?分析人士:或用了GPT生成文本做训练数据

发布时间: 来源:

  DeepSeek把自己误认成了ChatGPT?分析人士:或用了GPT生成文本做训练数据lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者 喻琰lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  DeepSeek新发布的AI模型会“报错家门”?日前,有网友发现,在向DeepSeek-V3模型提问“你是谁”时,DeepSeek-V3似乎将自己识别为ChatGPT。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在进一步提问DeepSeek API的问题,它回答也是如何使用OpenAI API的说明,甚至讲了一些与GPT-4一模一样的笑话。有网友发出疑问,“DeepSeek是否在ChatGPT生成的文本上进行了训练?”lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  DeepSeek-V3是由国内知名量化资管巨头幻方量化创立的杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)最新发布的全新系列模型,由于这款模型总训练成本低,性价比高,发布后不少网友称其为“国产之光”,且有“AI界的拼多多”之称。但在发布后的一天,便出现了上述疑似“翻车”现象。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  截至发稿前,深度求索公司尚未对此进行回应。但目前再次向DeepSeek-V3模型提问“你是谁”时,模型问答已恢复正常。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  DeepSeek-V3并不是第一个混淆自己的模型。科技媒体TechCrunch报道,此前谷歌的AI模型Gemini在被使用中文提问你是谁时,也回答自己是百度的文心一言。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  国内一家智能科技公司的技术负责人向澎湃科技记者分析时认为,DeepSeek-V3有可能直接将在ChatGPT生成的文本上作为训练基础,在训练过程中,该模型可能已经记住了一些GPT-4的输出,并正在逐字复述这些内容。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  另有业内人士指出,目前互联网大模型优质数据训练集有限,训练过程中不可能没有重合,但是否构成抄袭也很难定义。即便“站在了ChatGPT巨人肩膀上,但成本降下来是真的”。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,直接在ChatGPT生成的文本上训练DeepSeek-V3也并不奇怪,前述智能科技公司技术负责人指出,拿GPT的回答作为数据集训练自有模型在国内很常见,“这种不用抓取数据,并且能够额外做数据处理,能节省时间、人力和训练成本。”训练一个大模型需要吞噬海量数据,耗尽了世界上所有容易获取的数据。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  TechCrunch在报道中分析认为,造成这类现象的原因在于,目前互联网(AI公司获取大量训练数据的地方)正充斥着AI垃圾。生成式人工智能大模型在互联网数据上进行训练,而这些数据虽然信息丰富,但也充斥着不准确的内容,其中不乏“胡言乱语”。ChatGPT、Copilot和Gemini等AI工具都会为用户提供看似真实但却是捏造的数据。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  另据欧洲联盟执法机构的一份报告指出,到2026年,网络内容中可能有90%是由人工合成生成的。报告预测,这种数据“污染”,使得从训练数据中彻底过滤AI生成内容变得非常困难。lCe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023年1月23日在北京西城区拍摄的金星(左上)、土星 21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基础销售额同比增长1%;调整后营业利润5.73亿,同 3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/小时速度运行的列车,每公里实际运行平均能耗 2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个 3月23日消息,荣耀Magic6 RSR 保时捷设计于3月22日正式开售,售价为9999元。该款电话首销当天即被抢购一空,荣耀商城显示,下一轮销售时间将是3月29日上午10:08。荣耀总裁赵明在微博上表示,荣耀Magic6 RS 3月24日,记者从中国农业科学院获悉,该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队,开发了快速创制细胞质雄性不育系的新方法——“一步法”。相关研究日前发表在国际期刊《自然&midd 。

本文链接:DeepSeek把自己误认成了ChatGPT?分析人士:或用了GPT生成文本做训练数据http://www.sushuapos.com/show-2-10083-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 英伟达擂阵  “科技春晚”敲响AI PC时代鼓点

下一篇: VisionPro和AI均不及预期,苹果在2025年能否扭转局面?

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜