精准识别AI生成内容:让AI“识破”AI|焦点热门
时间:2025-08-18 15:06:51来源:中国青年报
近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC国产大模型逐渐变成人们学习、工作中的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,即“AI幻觉”;依赖AI工具代写作业甚至毕业论文,冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,还创新性地提出了“直接差异学习”优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025接收。

目前AI生成内容检测主要有两种路线:一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种标准进行分类。

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前曾有媒体报道,《荷塘月色》《流浪地球》等作品被某常用论文AI率检测系统检出高AI率。


(资料图片)

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“我们的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近10万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用团队的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

标签:

最新
  • 精准识别AI生成内容:让AI“识破”AI|焦点热门

    近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着

  • 动态:上交所明确科创成长层标准 多方协力推动改革尽快落地见效

    为了落实中国证监会发布的《关于在科创板设置科创成长层 增强制度

  • 报告:我国18岁及以上人群平均睡眠时长为7.06—7.18小时

    中国睡眠大数据中心发布会暨全国睡眠障碍筛查工作发布会于16日在京

  • 第29届法语活动月华南地区系列活动启幕

    第29届法语活动月华南地区新闻发布会和开幕式8日于广州大剧院举办。

  • 南阳市卧龙区法院走访联络省人大代表、政协委员

    为深入贯彻党的二十大精神,践行以人民为中心的发展思想,自觉接受人大

  • 中新真探:出汗就是在燃烧脂肪吗?

    中新网9月25日电 许多人认为,出汗就是脂肪在燃烧,甚至还有一些鼓

  • 刷牙时间越长越好……是真是假?|谣言终结站|每日简讯

    多学一个知识点——全家人可以共用一管牙膏吗?如果与家人共用牙膏

  • 中国制造实现跨越式增长

    来源标题:从120亿元到39 9万亿元 中国制造实现跨越式增长75年前,

  • 热点评!搜狐2024年Q2营收增长13%,品牌广告收入下降17%

    8月5日消息,搜狐公司公布了其截至2024年6月30日的未经审计的第二季度

  • 邓州市民政局:筑牢保护墙 优化未成年人成长环境

    眼下,邓州市民政局将持续关注困境儿童的成长需求,推进未成年人的法治

  • 河南省内乡县:满城月季满城香-新动态

    四月的内乡县,城区大小游园各色月季迎来盛花期,一团团、一簇簇,姹紫

  • ​同在蓝天下 一起来成长——西平县焦庄毛寨小学开展“关爱留守儿童”主题教育活动

    随着经济的迅速发展和社会的进步,农村外出务工的人数与日俱增,许多儿

  • 饮料瓶造球场,康师傅冰红茶打造全新“运动场景环保生态圈”

    9月20日,康师傅可持续发展计划创新项目重磅上线,携全新运动场景环

  • 深挖暑期“热经济”潜力,还需持续优化消费环境

    本文来源:时代周报作者:迟雨近期以来,商务部和各地商务部门抓住暑期

  • 高擎奋进旗帜 汇聚榜样力量

    高擎奋进旗帜汇聚榜样力量广西出入境边防检查总站举办先进典型主题报告

  • 龙卡Visa卡境外消费返现“高高高调”来袭!

    此页面是否是列表页或首页?未找到合适正文内容。

  • 旅游
    • 有子曰信近于义言可复也恭近于礼远耻辱也(有子曰信近于义言可复)

    • 人身安全保护令怎么执行的?人身安全保护令可以包括的措施有哪些?

    • 医缓解偏头痛有哪些方法?偏头痛怎么治疗除根?

    • 世界快看:集合竞价时间是几点呢?集合竞价挂单技巧有哪些?