根据11月6日发表在《细胞报告物理科学》上的一项研究称,机器学习工具可以很容易地发现使用ChatGPT撰写的化学论文。这种专门的分类器的性能优于现有的两个人工智能(AI)检测器,可以帮助学术出版商识别由人工智能文本生成器创建的论文。
“大多数文本分析领域都需要一个通用的检测器,它可以检测任何文本。”合著者、堪萨斯大学劳伦斯分校的化学家Heather Desaire说。研究结果表明,通过针对特定类型的写作定制软件,可以促进开发AI检测器的努力。
Desaire和她的同事在6月首次描述了他们的ChatGPT检测器,当时他们将其应用于《科学》杂志的Perspec-tive文章,使用机器学习和检查写作风格的20个特征,包括句子长度的变化,以及某些单词和标点符号的频率,以确定是出自学术人员还是ChatGPT。“你可以利用一小部分特征来获得高水平的准确性。”Desaire说。
在最新的研究中,该探测器接受了美国化学学会(ACS)出版的十种化学期刊论文的介绍部分的训练。研究人员在100篇已发表的引言上训练了他们的工具,将其作为人类撰写的文本,然后要求ChatGPT-3.5以ACS期刊风格撰写200篇引言。其中100篇论文的标题为该工具提供,另外100篇论文的论文摘要为该工具。
当对人类撰写的引言和人工智能从同一期刊生成的引言进行测试时,该工具以100%的准确率根据标题识别出ChatGPT-3.5撰写的部分。对于ChatGPT基于摘要生成的介绍,准确率为98%。相比之下,人工智能检测器ZeroGPT识别人工智能撰写的引言的准确率仅为35-65%左右,具体取决于所使用的ChatGPT版本以及引言的生成来源。ChatGPT的制造商OpenAI生产的文本分类器工具也表现不佳——它能够以大约10-55%的准确率发现AI编写的内容。
新的ChatGPT捕手甚至在未经训练的期刊的介绍中表现良好,它捕获了由各种提示创建的AI文本,包括旨在混淆AI检测器的提示。
(彪轶辰)