DeepSeek把自己误认成了ChatGPT?分析人士：或用了GPT生成文本做训练数据

发布时间: 2025-01-09 09:35:19 来源：

观看：197

　　DeepSeek把自己误认成了ChatGPT?分析人士：或用了GPT生成文本做训练数据

　　记者喻琰

　　DeepSeek新发布的AI模型会“报错家门”？日前，有网友发现，在向DeepSeek-V3模型提问“你是谁”时，DeepSeek-V3似乎将自己识别为ChatGPT。

　　在进一步提问DeepSeek API的问题，它回答也是如何使用OpenAI API的说明，甚至讲了一些与GPT-4一模一样的笑话。有网友发出疑问，“DeepSeek是否在ChatGPT生成的文本上进行了训练？”

　　DeepSeek-V3是由国内知名量化资管巨头幻方量化创立的杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)最新发布的全新系列模型，由于这款模型总训练成本低，性价比高，发布后不少网友称其为“国产之光”，且有“AI界的拼多多”之称。但在发布后的一天，便出现了上述疑似“翻车”现象。

　　截至发稿前，深度求索公司尚未对此进行回应。但目前再次向DeepSeek-V3模型提问“你是谁”时，模型问答已恢复正常。

　　DeepSeek-V3并不是第一个混淆自己的模型。科技媒体TechCrunch报道，此前谷歌的AI模型Gemini在被使用中文提问你是谁时，也回答自己是百度的文心一言。

　　国内一家智能科技公司的技术负责人向澎湃科技记者分析时认为，DeepSeek-V3有可能直接将在ChatGPT生成的文本上作为训练基础，在训练过程中，该模型可能已经记住了一些GPT-4的输出，并正在逐字复述这些内容。

　　另有业内人士指出，目前互联网大模型优质数据训练集有限，训练过程中不可能没有重合，但是否构成抄袭也很难定义。即便“站在了ChatGPT巨人肩膀上，但成本降下来是真的”。

　　不过，直接在ChatGPT生成的文本上训练DeepSeek-V3也并不奇怪，前述智能科技公司技术负责人指出，拿GPT的回答作为数据集训练自有模型在国内很常见，“这种不用抓取数据，并且能够额外做数据处理，能节省时间、人力和训练成本。”训练一个大模型需要吞噬海量数据，耗尽了世界上所有容易获取的数据。

　　TechCrunch在报道中分析认为，造成这类现象的原因在于，目前互联网(AI公司获取大量训练数据的地方)正充斥着AI垃圾。生成式人工智能大模型在互联网数据上进行训练，而这些数据虽然信息丰富，但也充斥着不准确的内容，其中不乏“胡言乱语”。ChatGPT、Copilot和Gemini等AI工具都会为用户提供看似真实但却是捏造的数据。

　　另据欧洲联盟执法机构的一份报告指出，到2026年，网络内容中可能有90%是由人工合成生成的。报告预测，这种数据“污染”，使得从训练数据中彻底过滤AI生成内容变得非常困难。

今年全国两会期间，人工智能成为热点话题，“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局，一头连着行业变革与创新，“人工智能+”既是新质生产力发展的“新引擎”，也是产业和消费 3月18日，在2024年黑龙江农机产品展示交易会上，一部可智能播种，又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械播种机价格相当，据悉，研发团队通过自主研发和据法新社巴黎3月15日报道，15日发布的一项新的重要分析称，影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病，成为全球范围内导致人们健康损害的主要原因。 21世纪经济报道记者雷晨北京报道随着人工智能技术的飞速发展，Kimi概念股成为资本市场的新宠。3月21日，受Kimi智能助手技术突破的催化，相关概念股集体走高，市场对AI板块的热情再次被点燃 3月23日，“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式，这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星，标志着厦门航天卫星应用领域商业化、产业化发展更进一 3月22日，在2024低碳建筑产业论坛上，北京首例负碳示范建筑——首程时代中心负碳示范建筑正式亮相。活动现场，中国建筑节能协会、北京绿色交易所分别授予首程时代中心负碳示范建筑“零。

本文链接：DeepSeek把自己误认成了ChatGPT?分析人士：或用了GPT生成文本做训练数据http://www.sushuapos.com/show-2-10083-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：英伟达擂阵 “科技春晚”敲响AI PC时代鼓点

下一篇： VisionPro和AI均不及预期，苹果在2025年能否扭转局面？

DeepSeek把自己误认成了ChatGPT?分析人士：或用了GPT生成文本做训练数据

热门资讯

推荐资讯

科技最热文章