Skip to main content

随着生成式人工智能在过去几年中的兴起,人工智能检测变得必不可少也就再正常不过了。这类内容在学术界造成了巨大的问题,但也正在占领整个网络内容。甚至有报道称,最近维基百科上的很多内容都是由人工智能编写的。

了解假阳性:

当人工智能检测工具错误地将完全由人类撰写的文本识别为人工智能生成的文本时,就会出现误报。鉴于这些工具的工作性质,我们将探讨发生这些不幸事件的几个原因。

人工智能检测器误报的原因:

我们在前一篇文章中探讨过人工智能检测的工作原理;误报的根本原因在于人工智能检测的工作原理是分析文本,并返回文本是由人类还是机器人所写的概率。根据人工智能检测器的训练程度,它在辨别人类文本和人工智能文本时会更加准确。如果一个文本缺乏生动性和迷惑性,而且极易预测,那么人工智能检测工具可能会觉得它很可疑。然而,像 Winston AI 这样最好的人工智能检测器已经针对这些情况进行了广泛的训练,并改进了自己的模型,以尽量避免这些不幸事件的发生。

每个人工智能检测工具都有一个重要因素,它是造成误报的根源:评估是基于概率的。换句话说,人工智能检测器会扫描您的文本,并返回您的文本是人工智能生成还是人类生成的概率。与剽窃检测工具的既定证据不同,人工智能检测工具将提供概率评估。

鉴于上述原因,使用人工智能检测器的教育工作者在将评估结果作为任何不法行为的绝对证据时,必须谨慎行事。

假阳性的后果:

人工智能检测工具在学校实施需要一段时间,原因之一是 Turnitin 的新人工智能检测功能报告了大量误报。作为一款传统的抄袭软件,Turnitin 不得不推出人工智能检测来帮助学校识别 ChatGPT 内容。然而,关于学生被诬告作弊的报道层出不穷。对于花费了无数时间在作业上的学生来说,这是极其令人沮丧和无法接受的。

对于花费大量时间进行研究和写作的内容发布者来说,如果有人把你的内容标记为人工智能生成的,那将是一件非常令人沮丧的事情。

尽量减少误报的策略:

要避免触发人工智能探测器,一个显而易见的 “小窍门 “就是避免使用任何人工智能生成工具来帮助写作。

在许多误报案例中,有报告称人工智能实际上是用来帮助作者的。如果您使用 Grammarly 等工具来帮助修改某些句子或段落结构,要知道这些工具是由人工智能驱动的,可能会触发人工智能检测器。

尽可能保持内容的趣味性和洞察力,最重要的是,避免在文章中使用过多无助于实现文章目标的词语。

结论

生成式人工智能模型和人工智能检测工具很可能会在未来几年里玩一场猫捉老鼠的游戏。像 Winston AI 这样功能强大的人工智能检测器应该知道何时标记人工智能内容,就像避免误报一样。

保持写作的原创性和深刻性,避免使用非必要的词语和废话,这样就一定能避免被人工智能检测工具不公平地标记出来。

Thierry Lavergne

温斯顿人工智能公司(Winston AI)联合创始人兼首席技术官。我拥有超过 15 年的软件开发经验,擅长人工智能和深度学习。在温斯顿人工智能公司,我领导技术愿景,专注于开发创新的人工智能检测解决方案。我之前的经验包括为各种规模的企业构建软件解决方案,我热衷于推动人工智能技术的发展。我喜欢撰写与人工智能和技术有关的一切文章。