AI，正在疯狂污染中文互联网

www.creaders.net | 2023-06-18 11:28:53 华尔街见闻 | 0条评论 | 查看/发表评论

使用模型生成的内容训练其他模型，会导致结果模型出现不可逆的缺陷。

污染中文互联网，AI成了“罪魁祸首”之一。

事情是这样的。

最近大家不是都热衷于向AI咨询嘛，有位网友就问了Bing这么一个问题：

象鼻山是否有缆车？

在给出肯定的答复之后，Bing还贴心地附带上了票价、营业时间等细节信息。

不过这位网友并没有直接采纳答案，而是顺藤摸瓜点开了下方的“参考链接”。

此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。

于是他点开了这位叫“百变人生”的用户主页，猛然发觉，介是个AI啊！

因为这位用户回答问题速度可以说是极快，差不多每1、2分钟就能搞定一个问题。

甚至能在1分钟之内回答2个问题。

在这位网友更为细心的观察之下，发现这些回答的内容都是没经过核实的那种……

并且他认为，这就是导致Bing输出错误答案的原因：

这个AI疯狂地污染中文互联网。

那么被网友发现的这位AI用户，现在怎么样了？

从目前结果来看，他已经被被知乎“判处”为禁言状态。

但尽管如此，也有其他网友直言不讳地表示：

不止一个。

若是点开知乎的“等你回答”这个栏目，随机找一个问题，往下拉一拉，确实是能碰到不少“机言机语”的回答。

例如我们在“AI在生活中的应用场景有哪些？”的回答中便找到了一个：

不仅是回答的语言“机言机语”，甚至回答直接打上了“包含AI辅助创作”的标签。

然后如果我们把问题丢给ChatGPT，那么得到回答……嗯，挺换汤不换药的。

事实上，诸如此类的“AI污染源”不止是在这一个平台上有。

就连简单的科普配图这事上，AI也是屡屡犯错。

网友们看完这事也是蚌埠住了：“好家伙，没有一个配图是河蚌”。

甚至各类AI生成的假新闻也是屡见不鲜。

例如前一段时间，便有一则耸人听闻的消息在网上疯传，标题是《郑州鸡排店惊现血案，男子用砖头砸死女子！》。

但事实上，这则新闻是江西男子陈某为吸粉引流，利用ChatGPT生成的。

无独有偶，广东深圳的洪某弟也是通过AI技术，发布过《今晨，甘肃一火车撞上修路工人，致9人死亡》假新闻。

具体而言，他在全网搜索近几年的社会热点新闻，并使用AI软件对新闻时间、地点等进行修改编辑后，在某些平台赚取关注和流量进行非法牟利。

警方均已对他们采取了刑事强制措施。

但其实这种“AI污染源”的现象不仅仅是在国内存在，在国外亦是如此。

程序员问答社区Stack Overflow便是一个例子。

早在去年年底ChatGPT刚火起来的时候，Stack Overflow便突然宣布“临时禁用”。

当时官方给出来的理由是这样的：

（这样做）的目的是减缓使用ChatGPT创建的大量答案流入社区。

因为从ChatGPT得到错误答案的概率太高了！

他们认为以前用户回答的问题，都是会有专业知识背景的其他用户浏览，并给出正确与否，相当于是核实过。

但自打ChatGPT出现之后，涌现了大量让人觉得“很对”的答案；而有专业知识背景的用户数量是有限，没法把这些生成的答案都看个遍。

加之ChatGPT回答这些个专业性问题，它的错误率是实实在在摆在那里的；因此Stack Overflow才选择了禁用。

一言蔽之，AI污染了社区环境。

而且像在美版贴吧Reddit上，也是充斥着较多的ChatGPT板块、话题：

许多用户在这种栏目之下会提出各式各样的问题，ChatGPT bot也是有问必答。

不过，还是老问题，答案的准确性如何，就不得而知了。

但这种现象背后，其实还隐藏着更大的隐患。

滥用AI，也毁了AI

AI模型获得大量互联网数据，却无法很好地辨别信息的真实性和可信度。

结果就是，我们不得不面对一大堆快速生成的低质量内容，让人眼花缭乱，头晕目眩。

很难想象ChatGPT这些大模型如果用这种数据训练，结果会是啥样……

而如此滥用AI，反过来也是一种自噬。

最近，英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。

探讨了现在AI生成内容污染互联网的现状，然后公布了一项令人担忧的发现，使用模型生成的内容训练其他模型，会导致结果模型出现不可逆的缺陷。

这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲，未来通过抓取互联网数据来训练模型会变得更加困难。

论文作者，剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言：

正如我们用塑料垃圾布满了海洋，用二氧化碳填满了大气层，我们即将用废话填满互联网。

对于虚假信息满天飞的情况，Google Brain的高级研究科学家达芙妮 · 伊波利托(Daphne Ippolito)表示：想在未来找到高质量且未被AI训练的数据，将难上加难。

假如满屏都是这种无营养的劣质信息，如此循环往复，那以后AI就没有数据训练，输出的结果还有啥意义呢。

基于这种状况，大胆设想一下。一个成长于垃圾、虚假数据环境中的AI，在进化成人前，可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。

就像1996年的科幻喜剧电影《丈夫一箩筐》，影片讲述了一个普通人克隆自己，然后又克隆克隆人，每一次克隆都导致克隆人的智力水平呈指数下降，愚蠢程度增加。

那个时候，我们可能将不得不面临一个荒谬困境：人类创造了具有惊人能力的AI，而它却塞满了无聊愚蠢的信息。

如果AI被喂进的只是虚假的垃圾数据，我们又能期待它们创造出什么样的内容呢？

假如时间到那个时候，我们大概都会怀念过去，向那些真正的人类智慧致敬吧。

话虽如此，但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题，并推出相关规定加以限制。

一些个AI公司也开始搞能鉴别AI生成内容的技术，以减少AI虚假、垃圾信息的爆炸。

相关新闻

热议：10大最易被AI淘汰职业！第一名超意外	辉达下一个“万亿级美元商机”，来了
比DeepSeek还具威胁性！这家中国AI公司引发关注	2名中国AI人才高调加入辉达晒与黄仁勋合影
跟谷歌、微软拼了 OpenAI将推AI版Office	AI学会撒谎与威胁？专家忧发展失控
OpenAI开始租用Google芯片	逮住OpenAI猛薅 Meta又挖走4位知名研究人员
“机器人胶囊” 震撼世界吞下能无痛检查胃	软银拼当超级AI领头羊
川普高招果然有用 DeepSeek新模型难产	英伟达夺回全球市值王黄仁勋身价暴增
人类会与AI相爱吗？	扎克伯格开出$1亿天价挖人亲发邀请被误为诈骗
Tesla试运营无人出租车安全员陪同每次$4.2	华为鸿蒙6来了众多关键能力升级全面拥抱AI
全球扫地机器人5强中国企业包办前4	用人脑细胞跑AI，我快搞不懂这个世界了
马斯克：超级智能最晚明年到	马斯克重磅演讲：AI革命袭来超级智能最晚明年

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	空姐坦白：机组人员在飞行中这样“发生性
2	重磅！川普放话，关税大消息
3	习近平8月下台？美前外交官细数可疑迹象
4	马尔代夫快破产了！栽在中国手里
5	川普承认对中国采取这项行动：这是个肮脏的

48小时新闻排行榜

更多>>

1	比恒大还多1.14万亿的巨头，倒了
2	普京沉痛宣布:我们被骗了
3	北京出了啥事？美前顶级情报头子发话
4	4年倒闭5万多家中国最暴利行业要彻底消
5	刚刚！美联储，突传重磅
6	哈梅内伊又装了一回，代价也来了
7	空姐坦白：机组人员在飞行中这样“发生性
8	重磅！川普放话，关税大消息
9	“全国一盘棋”重演？习近平的新时代
10	黄石公园野牛遭活活烫死许多游客亲眼目睹

热门专题

1 美伊冲突	6 俄乌战争	11 大S
2 以伊战争	7 万维专栏	12 洛杉矶大火
3 四中全会	8 何卫东	13 叙利亚
4 中美冷战	9 AI	14 苗华被抓
5 川普	10 中共两会	15 美国大选

一周博客排行

更多>>

1	空前绝后：24岁的中共总书记及	赵大夫话室
2	俺吃错过药	阿妞不牛
3	人养金毛犬，我养白眼狼：伊朗	高伐林
4	回国避坑：既不能评论国内好坏	aoe2
5	走出中国城，走活中国人	解滨
6	中美空军相差多远？看运-20和C	弓长贝占郎
7	人死后灵魂还在吗？	骆驼
8	共产革命之前的上海和伊斯兰革	陈家梁子
9	为何黄左反川甚于反共？	蛇形刁手
10	习大大唱独角戏，听床师们情何	蛇形刁手

一周博文回复排行榜

更多>>

1	人死后灵魂还在吗？	骆驼
2	俺吃错过药	阿妞不牛
3	文明、优雅、格局	体育老师
4	为何黄左反川甚于反共？	蛇形刁手
5	走出中国城，走活中国人	解滨
6	奇袭伊朗.高法裁决.外交内政.	木秀于林
7	2024回国：海南环岛游	马黑
8	人养金毛犬，我养白眼狼：伊朗	高伐林
9	相信固执己见可以治愈	施化
10	再反转：B-2只炸了个皮毛？	北栖


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.