top of page

只用了DeepL也会被检测出来?Turnitin检测AI新系统Q&A!

所谓道高一尺,魔高一丈。


在ChatGPT“帮助”了不少同学的作业、论文之后,各学校也是使出浑身解数来防止学生使用人工智能作弊。


随即,知名查重软件Turnitin也宣布研发出了AI书写检测的新功能。

但大部分人对Turnitin这个新功能还是略有些摸不着头脑,大家发现不仅是ChatGPT,就连使用了一些翻译、润色软件的文章,也会被检测出很高的AI重合率。



但让人摸不着头脑的地方主要还是在于这个新功能的判定很迷惑,有时候就会被检测出来,有时候又不会检测出来。



这种“玄学”让大家也不知道交给学校后查出的AI重合率到底会高还是不高,所以大家的状态一整个惴惴不安,心里七上八下,只好求助于互联网:这个AI查重到底是在查什么啊?



所以小E特意去Turnitin的官网查询了一番,总结出了几个Q&A,希望大家看完之后能对这个新功能有所了解,打开正确的查重方式!

Q

它是如何工作的?


A:当提交给Turnitin一篇论文时,AI检测功能先会将文章分成大约几百字的文本片段(大约五到十个句子),然后将这些片段相互重叠,捕捉每个句子的上下文。

AI检测功能会给每个句子打0到1分,如果确定一个句子不是由人工智能产生的,它会打出0分。如果它确定该句子的全部内容是由人工智能产生的,它会打出1分。

然后取所有文本片段的平均分数生成一个总体预测结果,也就是它认为提交的论文中有多少文本是由人工智能生成的。(Turnitin表示,基于他们人工智能创新实验室收集和验证的数据,这个结果有98%的可信度。


Q

最终的百分比是什么意思?


A:报告最终显示的百分比是人工智能检测功能检测出的由AI产生的文本的数量。

但这种文本只包括散文句子(prose sentences),软件只分析用标准语法句子写成的文本块,不包括其他类型的写作,如列表(lists)、要点(bullet points)或其他非句子结构(non-sentence structures)。

也就是说,最终显示的指标和百分比并不包括文档中除了达到一定长度的句子之外的内容。



Q

显示的百分比有时与突出显示的文本数量不匹配。这是为什么?


A:与相似性检测报告不同,AI检测得出的百分比不一定与提交的文本数量相关。Turnitin的人工智能写作检测功能只检测长篇写作中的散文句子(prose sentences)。长篇写作中包含的散文文本(Prose text)是指包含在段落中的单个句子,这些句子构成了较长的书面作品,如essay、dissertation或article等。

这个功能不能准确地检测出人工智能生成的非散文(non-prose)的文本,如诗歌(poetry)、脚本(scripts)或代码(code),也不能检测出短篇或非常规写作,如要点(bullet points)、表格(tables)或注释书目(annotated bibliographies)。


Q

不同的指示是什么意思?

A:经过检测,人工智能写作检测报告会显示以下情况:

· 蓝色,百分比显示在0到100之间。代表着提交的文件已经成功处理。显示的百分比表示检测出的由AI产生的文本的数量。

这个百分比不一定是全部文本的百分比。如果提交材料中的文本不是长文本(long-form prose text)的,它是不包括在百分比内的,大家要注意这一点。

· 灰色,没有显示百分比,这代表AI写作检测功能无法处理提交的内容。这可能是由于以下原因:

1. 提交的文档是在Turnitin的AI检测功能发布之前就检测过的,需要重新提交一次才能看到人工智能写作检测报告结果。

2. 提交的文件不符合要求。提交的文件需要满足以下要求:

· 文件大小必须小于100MB

· 文件必须有至少150字的长写作格式的散文文本(prose text)

· 文件不得超过15000字

· 文件必须用英文书写

· 接受的文件类型:.docx, .pdf, .txt, .rtf


Q

此功能是否适用于英文以外的文本?

不支持,这个功能目前的模式只会处理英文文本。


Turnitin的官网也表示了他们的人工智能写作检测可能并不总是准确的,它可能会错误地识别人类和人工智能生成的文本。所以它不应该被用作判断学生是否使用AI作弊的唯一依据。

而是需要进一步地审查和人类的判断,以确定学生是否属于学术不端行为。


不过基于这个新功能的不确定性,大家还是一定要慎重对待自己的作业、论文,万一真的被认定为学术不端就得不偿失了!




208 views0 comments
bottom of page