欺诈性研究的增加正在影响学术出版界。在成功试点之后,Springer Nature正在推出两款新的定制AI工具,以支持识别包含AI生成的虚假内容和/或问题图像的论文——这两个研究诚信问题的指标。
与Slimmer AI Science部门合作开发,Springer Nature在2023年收购了该部门,其中一款工具Geppetto检测AI生成的内容,这是论文工厂活动的典型迹象。
Geppetto通过将论文分成各个部分,并使用其自己的算法检查每个部分中文本的连贯性来工作。然后根据文本被AI生成的概率为各个部分打分。分数越高,存在问题的概率越大,从而引发Springer Nature员工的进一步人工检查。Geppetto已经成功识别了数百篇提交后不久的虚假论文,防止它们被发表,从而节省了编辑和同行评审的宝贵时间。
另一款内部开发的工具SnappShot是一款AI辅助的图像完整性分析工具。目前用于分析包含凝胶和印迹图像的PDF文件,并查找这些图像类型的重复——这是行业内已知的另一个完整性问题——这将被扩展以涵盖更多图像类型和完整性问题,并加快对论文的检查。
与Geppetto一样,SnappShot并不决定提交是否应进入编辑过程的下一个阶段,而是提供是否需要对图像进行人工评估的信号。该工具不仅有助于避免发布重复或操纵的数据,还支持对作者图表的良好反馈,例如在无意中重复图表的情况下,鼓励更高标准的研究实践和数据管理。
Springer Nature研究诚信总监Chris Graf评论说:
“出版行业面临着来自论文工厂或不良行为者的恶意威胁,他们提交包含捏造数据的虚假论文,我们决心不让这些内容通过我们的系统。这些尝试可能对科学信任产生严重后果,调查和解决这些问题可能需要大量的时间和资源。
“我们不断改进的新工具正在帮助我们领先于欺诈者,并确保我们发表的研究是稳健的,可以被信任并用于构建。”
这些AI工具是Springer Nature目前正在内部开发的众多工具中的两款,作为其确保发布内容完整性的持续承诺的一部分,其中包括对一个迅速增长、专家团队的投资和广泛的技术开发。Springer Nature还致力于与更广泛的出版界进行持续合作,作为STM Integrity Hub的贡献组织,该Hub促进知识和数据交换,并开发共享技术工具。