万维读者网 > 信息时代 > 正文

离谱！61%中国人写的英语论文会被ChatGPT判为

www.creaders.net | 2023-05-04 22:31:30 新智元导读 | 0条评论 | 查看/发表评论

非母语者写的文章=AI生成？气抖冷。

ChatGPT火了以后，用法是真多。

有人拿来寻求人生建议，有人干脆当搜索引擎用，还有人拿来写论文。

论文...可不兴写啊。

美国部分大学已经明令禁止学生使用ChatGPT写作业，还开发了一堆软件来鉴别，判断学生上交的论文是不是GPT生成的。

这里就出了个问题。

有人论文本来就写的烂，判断文本的AI以为是同行写的。

更高的是，中国人写的英文论文被AI判断为AI生成的概率高达61%。

这....这这什么意思？气抖冷！

非母语者不配？

目前，生成式语言模型发展迅速，确实给数字通信带来了巨大进步。

但滥用真的不少。

虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容，但这些检测方法的公平性和稳定性仍然亟待提高。

为此，研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。

研究结果显示，这些检测器始终将非母语者写作的样本错误地判定为AI生成的，而母语写作样本则基本能被准确地识别。

此外，研究人员还证明了，用一些简单的策略就可以减轻这种偏见，还能有效地绕过GPT检测器。

这说明什么？这说明GPT检测器就看不上语言表达水平不咋地的作者，多叫人生气。

不禁联想到那款判断AI还是真人的游戏，如果对面是真人但你猜是AI，系统就会说，“对方可能会觉得你冒犯了。”

不够复杂=AI生成？

研究人员从一个中国的教育论坛上获取了91篇托福作文，又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文，用来检测7个被大量使用的GPT检测器。

图表中的百分比表示“误判”的比例。即，是由人写的，但检测软件认为是AI生成的。

可以看到数据非常悬殊。

七个检测器中，美国八年级学生写的作文被误判的概率最高才12%，还有两个零误判的GPT。

中国论坛上的托福作文被误判的概率基本全部过半，最高误判概率可达76%。

91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的，而91篇中有89篇，都至少被一个GPT检测器误判。

从上图中我们可以看出，被所有7个GPT误判的托福作文在复杂度（Complexity）上明显低于其它论文。

这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。

因此，研究人员认为，GPT检测器应该多看点儿非母语者写的文章，样本多了，才能消除偏见。

接下来，研究人员把非母语者写的托福作文扔到了ChatGPT里，丰富一下语言，模仿母语者的用词习惯。

同时作为对照组，把美国八年级小孩儿写的作文也扔到了ChatGPT里，把语言简化了一下，模仿非母语者的写作特点。下图就是修正后的新判定结果。

我们可以发现，情况来了个大掉个儿，丰富了语言的托福作文错判率直线下降，低至3%，最高也不过19%。不像之前基本全部过半的错判率。

与之相反，八年级小孩儿写的作文的错判率直线上升，甚至还有一个GPT检测器的错判率高达99%，基本全错。

因为，文章复杂度这个变量出现了变化。

这里研究人员就得出了一个结论，非母语者写的东西不地道，复杂度低，容易被错判。

这也就导向了一个技术问题，同时也是一个价值问题。以复杂度来判定AI还是人类是作者，是否合理、全面、严谨。

结果显然不是。

以复杂度为判断标准的情况下，非母语者吃了大亏，因为，他们是非母语者（废话）。

AI润色=人类写的？？

研究者认为，加强语言多样性不仅可以减轻对非母语者的偏见，还能让GPT生成的内容绕过GPT检测器。

为了证明这个观点，研究人员选取了2022-2023年间美国大学申请的入学论文题目，输入到ChatGPT-3.5里，一共生成了31篇假论文。

GPT检测器一开始还挺有效，但是第二轮就不行了。这是因为，在第二轮中，研究人员把这些论文又扔到ChatGPT里润色了一下，用一些文学性的语言提升了文本质量。

这样一来，GPT检测器的准确度就从100%直降到了0%。如下图：

经过润色的文章复杂度相应也上升了。

与此同时，研究人员又用了斯坦福大学145个期末项目报告的题目，让ChatGPT生成摘要。

摘要经过润色以后，检测器判断的准确性继续下降。

研究者再次得出结论，润色过的文章很容易被误判，都是AI生成的，两轮就是比一轮强。

GPT检测器？还是欠练

言而总之，总而言之，各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。

人的写作也分三六九等，仅靠复杂度判断，不甚合理。

抛开偏见因素不谈，技术本身也亟待改进。

0

相关新闻

基本物理任务，全球顶级AI均失败	微软一晚发50个新产品要建“Agent伊甸园”
辉达火力全开秀技术！最新AI平台HB300问世	苹果为何一直搞不定AI？内部员工爆了一个大料
美软件工程师失业后狂投800份简历结果…	重大突破！新研发AI工具能“看见”血栓
AI版“星球大战”，已经来了？	黄仁勋：英伟达将持续为中国市场打造最佳产品
中国首家AI医院完全由42名人工智能医生运营	日本分析师意外踩到中国痛脚
苹果与阿里巴巴AI合作“极度令人不安”	黄仁勋：假如我现在是学生我会....
深夜突袭！AI程序员上线人类仅需点按钮	纽约年薪15万工程师被裁住拖车靠外送糊口
川普“外包”AI挨批	拿下世界第一，中国AI大模型创下一纪录
Grok疑煽动白人灭绝言论 xAI急回应	微软执行长：中国DeepSeek R1足以匹敌OpenAI
川普中东签AI大单最终惠及中国？	AI普及后人类越发“穷忙”

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论上一页下一页

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

1	央媒头版定调，国家要动真格了
2	胡锦涛罕见露面传政治局召开“废习会”
3	美最高法院8-1通过！川普政府打赢重要法律
4	蔡奇突发选边倒戈反习卷起无极狂风
5	攻打台海：传习下达禁酒令全面进入军事状

48小时新闻排行榜

1	武汉闹市突发枪击 3人中枪 1人遭爆头现场
2	惊传：中共上将何宏军自尽不治身亡
3	AI抢不走！13种高薪工作成新时代“铁饭碗”
4	央媒头版定调，国家要动真格了
5	中共中央军委人事变动由他接替落马的苗华
6	纽时：拜登的悲剧令人无法承受的悲伤
7	胡锦涛罕见露面传政治局召开“废习会”
8	又是中国人！日本全网怒了…
9	中美烟硝再起？对美征74.9%反倾销税
10	美最高法院8-1通过！川普政府打赢重要法律

热门专题

1 四中全会	6 何卫东	11 叙利亚
2 中美冷战	7 AI	12 苗华被抓
3 川普	8 中共两会	13 美国大选
4 俄乌战争	9 大S	14 以哈战争
5 万维专栏	10 洛杉矶大火	15 巴黎奥运

一周博客排行

1	中国，再也退不回去了	施化
2	赵晓：川普“闯关”成功了吗？	万维网友来
3	中共为何不怕经济崩溃？	体育老师
4	高瞻：俄罗斯和西方千年恩怨的	万维网友来
5	从“宁要XXX，不要YYY”说起	Siubuding
6	试看习包子能把北大女教授怎么	体育老师
7	中国的色劫天局	特有理
8	斯坦福青年教授硅谷买房记	怡光
9	赵晓：川式外交，是堕落的现实	万维网友来
10	歌颂一下伟大领袖川普同志	山蛟龙

一周博文回复排行榜

1	川普中东之行.世界政治格局.窃	木秀于林
2	将美国的工作岗位从中国夺回来	Jinhuasan
3	文明政治宁要宋襄公不要诸葛亮	右撇子
4	中国，再也退不回去了	施化
5	万斯说"Peasant"不	蒋大仁勇
6	中美贸易战打了个寂寞，really	爪四哥
7	Breaking News：川普答记者问	爪四哥
8	普京自知理亏	花蜜蜂
9	让宋襄公下线，挺诸葛亮上场：	蒋大仁勇
10	川普关税战科技战的短板：稀土	随意生活


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.