虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利,但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT,无需训练即可识别各种AI大语言模型生成的文本内容。
Fast-DetectGPT演示网页
据了解,该研究的论文5月发表在2024年国际表征学习大会上。第一作者、西湖大学文本智能实验室博士鲍光胜6月28日告诉澎湃新闻(www.thepaper.cn),Fast-DetectGPT针对GPT3.5生成的文本识别率可达96%,对GPT4生成的文章的识别率达90%。与斯坦福大学2023年提出的DetectGPT检测方法相比,Fast-DetectGPT 的检测速度提高340倍,检测准确率相对提升75%,在对目前被广泛使用的ChatGPT 和GPT-4 生成文本的检测上,准确率均超过商用系统 GPTZero。
“我的研究方向是自然语言处理,注意到AI大语言模型的应用在多个领域提升了生产力,但其误用也带来了诸如虚假新闻、恶意产品评论、学术不端等问题,去年启动了这项研究,历时约半年完成。” 鲍光胜介绍,AI生成的文本内容流畅连贯,往往难以辨别,这项研究则引入了能区分机器生成文本和人类撰写文本特征差异的统计量——条件概率曲率。
“Fast-DetectGPT的操作基于一个前提:人类和机器在文本生成过程中倾向于选择不同的词汇,人类的选择比较多样,机器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有所相同,我们提取覆盖这些区别特征的统计量,分析它们在两种不同文本的分布,当某个文本的统计特征值主要落在机器生成文本的分布中,模型就会判断为AI大语言模型生成的。”
鲍光胜同时表示,Fast-DetectGPT不能完全准确地识别文本是否由机器生成,只是提供概率,在Fast-DetectGPT演示网页的对话框输入一段文本,结果会显示“文本有2%的概率是机器生成”。“当被测文本混合了机器生成文本和人工撰写文本,检测会更难。” 他说,“构建一个更好的内容环境还需要各方的努力。”
中新网北京12月19日电 (记者 孙自法)施普林格·自然旗下专业学术期刊《自然-计算科学》最新发表一篇论文称,研 ·“由于猫只在很短的时间内排出生物体,因此人类通过与它们一起生活的猫接触而感染弓形虫的机会相对较小。也就是 中新网伦敦1月2日电 (彭欣怡)当地1月2日,英国气象局发布数据指出,2023年是英国自1884年有气象记录以来第二热的一年,仅 美国哈佛大学校长克洛迪娜·盖伊当地时间1月2日发表声明,宣布辞去哈佛大学校长一职。 盖伊在声明中说,她 编者按 世界在变,变化中不断积蓄着突破的力量。局势纵横看似山重水复,历史规律昭示未来终将柳暗花明。2023年与我们挥 中国工程院资深院士、胜利油田原资深首席高级专家顾心怿同志,因病医治无效,于2024年1月2日在济南逝世,享年88岁。 顾心怿 。本文链接:用AI识别AI:西湖大学一项研究可高效检测AI生成文本http://www.sushuapos.com/show-11-7730-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
下一篇: AI为填报高考志愿当“参谋”