用AI识别AI：西湖大学一项研究可高效检测AI生成文本

发布时间: 2024-06-29 07:53:23 来源：澎湃新闻

观看：188

虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利，但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT，无需训练即可识别各种AI大语言模型生成的文本内容。

?

Fast-DetectGPT演示网页

据了解，该研究的论文5月发表在2024年国际表征学习大会上。第一作者、西湖大学文本智能实验室博士鲍光胜6月28日告诉澎湃新闻（www.thepaper.cn），Fast-DetectGPT针对GPT3.5生成的文本识别率可达96%，对GPT4生成的文章的识别率达90%。与斯坦福大学2023年提出的DetectGPT检测方法相比，Fast-DetectGPT 的检测速度提高340倍，检测准确率相对提升75%，在对目前被广泛使用的ChatGPT 和GPT-4 生成文本的检测上，准确率均超过商用系统 GPTZero。

“我的研究方向是自然语言处理，注意到AI大语言模型的应用在多个领域提升了生产力，但其误用也带来了诸如虚假新闻、恶意产品评论、学术不端等问题，去年启动了这项研究，历时约半年完成。” 鲍光胜介绍，AI生成的文本内容流畅连贯，往往难以辨别，这项研究则引入了能区分机器生成文本和人类撰写文本特征差异的统计量——条件概率曲率。

“Fast-DetectGPT的操作基于一个前提：人类和机器在文本生成过程中倾向于选择不同的词汇，人类的选择比较多样，机器则更倾向于选择有更高模型概率的词汇，因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为，而非个体行为。” 鲍光胜解释，“具体而言，两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有所相同，我们提取覆盖这些区别特征的统计量，分析它们在两种不同文本的分布，当某个文本的统计特征值主要落在机器生成文本的分布中，模型就会判断为AI大语言模型生成的。”

鲍光胜同时表示，Fast-DetectGPT不能完全准确地识别文本是否由机器生成，只是提供概率，在Fast-DetectGPT演示网页的对话框输入一段文本，结果会显示“文本有2%的概率是机器生成”。“当被测文本混合了机器生成文本和人工撰写文本，检测会更难。” 他说，“构建一个更好的内容环境还需要各方的努力。”

这些年，我们为什么越来越频繁提到创新？因为只有在原始创新上持续发力，在基础理论方法上有所突破，我们才能摆脱对国外的科技日报北京12月19日电（记者马爱平）19日，记者从中国农业科学院茶叶研究所获悉，该所茶叶质量与风险评估创新团队首创了如果有一只眼睛，能帮我们一直看到中国南海海底深处，会看到什么？除了深邃黑暗的海洋，慢慢爬动的潜铠虾和海底岩石等，好像还有 12月18日晚，甘肃临夏州积石山县发生6.2级地震，震源深度10公里，已致多人遇难，部分水、电、交通、通讯等基础设施受损。应急管法国政府近日推出“2030国家生物多样性战略”，包括40项措施和200项行动，旨在保护和恢复生态系统、减少对生物多样性的 1月18日，浙江科技大学、嘉兴大学分别在杭州、嘉兴举行揭牌仪式。面向未来，两所高校提出了各自的发展目标。浙江科技大学。

本文链接：用AI识别AI：西湖大学一项研究可高效检测AI生成文本http://www.sushuapos.com/show-11-7730-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：科技部发布4个重点专项2024年度项目申报指南

下一篇： AI为填报高考志愿当“参谋”

用AI识别AI：西湖大学一项研究可高效检测AI生成文本

热门资讯

推荐资讯

科学最热文章