欢迎您阅览陕西科技报!
通版阅读请点击:
展开通版
收缩通版
当前版:03版
发布日期:
新工具可识别AI“代笔”
  不久前,人工智能(AI)聊天机器人ChatGPT的首次亮相引起了全世界热议,它具有强大的文本处理和对话能力。不过,许多线索可以帮助人们区分机器人和人类。
  如今,美国科学家开发了一种工具,可以识别人工智能生成的学术文本,准确率超过99%。相关研究近日发表于《细胞报告物理学》。
  “我们努力创造一种易于使用的方法,用来辨别人工智能写作问题。如此一来,高中生也可以建立一个针对文本的人工智能检测器。”论文第一作者、美国堪萨斯大学教授Heather Desaire说。
  “目前,人工智能写作存在一些明显的问题。”Desaire说,“最大的一个问题是,它汇集了许多来源的文本,却没有任何形式的准确性检查。”
  尽管网上有许多人工智能文本检测器,并且表现相当好,但它们并不是专门为学术写作而构建的。为了填补这一空白,该团队希望构建一个具有更好性能的学术写作检测工具。他们关注的是观点文章——科学家撰写的特定研究主题的概述。该团队选择了64个主题,并在相同的研究主题上创建了128篇由ChatGPT生成的文章来训练模型。当他们比较这些文章时,发现了人工智能写作的一个指标——可预测性。
  与人工智能相反,人类写作的段落结构更复杂,每段的句子数量和总字数都不一样,句子长度也不稳定。此外,对标点符号和词汇的偏好也是一个线索。例如,科学家倾向于使用“然而”“但是”和“尽管”这样的词,而ChatGPT在写作中经常使用“其他人”和“研究人员”。最终,该团队为新模型列出了20个指标。
  经过测试,对于整篇观点文章,该模型区分人类和人工智能作者的准确率达到100%。对于识别单个段落,该模型的准确率为92%,远远超过了市场上现有的人工智能文本检测器。
  接下来,研究人员计划确定模型的适用范围。他们想在更广泛的数据集和不同类型的学术写作中测试它。随着人工智能聊天机器人的不断发展,研究人员想知道该模型能否跟得上形势。
  尽管该模型在区分人工智能和人类作者方面非常熟练,但Desaire表示,它的设计初衷并不是为了区分人工智能生成的学生论文。不过她指出,人们可以很容易地复制他们的技术建立有针对性的新模型。

(冯维维)


社址:西安市药王洞155号 邮编:710003 电话/编辑部:029-87345421
广告部:029-87347875 投稿信箱:sxkjb169@aliyun.com 版权所有:陕西科技报社 技术支持:锦华科技