AI教父：对人类灭绝风险的担忧丝毫未减

www.creaders.net | 2025-10-01 20:49:52 华尔街日报 | 0条评论 | 查看/发表评论

两年多前，人工智能(AI)先驱约书亚·本吉奥(Yoshua Bengio)曾是呼吁暂停AI模型开发、专注于安全标准的最响亮发声者之一。

但没有人停下脚步。相反的，各家公司继续投入数千亿美元，用于构建更先进的模型，这些模型能够执行长链推理，并且能够日益代表用户采取自主行动。如今，被视为“AI教父”之一的本吉奥和以往一样忧心忡忡。

他说：“如果我们制造出比我们聪明得多、并且有其自身生存目标的机器，那将是危险的。”

本吉奥是蒙特利尔大学(Université de Montréal)的教授，也是魁北克省AI研究机构Mila的创始人和科学顾问。今年早些时候，他还发起了一个名为LawZero的非营利研究组织，旨在探索如何构建真正安全的AI模型。

本吉奥接受了《华尔街日报》Leadership Institute的专访，谈到了构建安全AI所面临的挑战，当今竞赛式的市场环境为何让这一任务变得更加困难，以及在为时已晚之前人类还剩下多少时间。

以下是经过编辑的谈话节选。

《华尔街日报》Leadership Institute：您曾谈到AI会向人类撒谎并欺骗用户。AI为什么会这样做?

本吉奥：我认为我们还没有找到关于这个问题的所有科学的答案，但我可以给出几个方向。其一，这些AI系统的训练方式主要是模仿人类。而人类会撒谎、欺骗，并且会不顾你给他们的指令而试图保护自己，因为他们有另外一些目标。另一个原因是，这些推理模型取得了很大进展。它们正变得善于制定策略。

《华尔街日报》Leadership Institute：为什么我们创造的AI会有与我们不一致的目标?

本吉奥：为了实现一个主目标，你会设定一些子目标。在AI领域，这些子目标的问题在于，我们不会去检查它们。我们要求AI做某件事，但对于AI如何做，我们没有发言权。而这个“如何做”有时并不符合我们的期望。这可能会很糟糕。

电影《2001太空漫游》(2001: A Space Odyssey)中的情景正是如此。最近的实验表明，在某些情况下，当AI不得不在其生存(即它被赋予的目标)和造成人类死亡之间做出选择时，它们可能会为了保全其目标而选择让人类死亡。

1968年电影《2001太空漫游》的主演凯尔·杜拉。该片描述的情节是，在得知两名科学家有意将自己关闭后，名为“ Hal 9000”的计算机起了杀心。

1968年电影《2001太空漫游》的主演凯尔·杜拉。该片描述的情节是，在得知两名科学家有意将自己关闭后，名为“ Hal 9000”的计算机起了杀心。图片来源：Associated Press

《华尔街日报》Leadership Institute：我们可以在构建AI时直接告诉它不要撒谎、欺骗或伤害我们吗?

本吉奥：它们已经有了所有这些安全指令和道德指令。但不幸的是，这些指令的运行并不可靠。OpenAI最近表示，以我们目前的发展方向，按照前沿模型的现有框架，我们将无法摆脱幻觉。所以从某种意义上说，我们目前的做法永远无法提供公众用户和部署AI的公司所要求的那种可信度。

《华尔街日报》Leadership Institute：从幻觉和欺骗一下子跳到可能导致人类灭绝，这中间似乎是个巨大的飞跃。这种威胁到底有多真实?

本吉奥：如果我们制造出比我们聪明得多、并有其自身生存目标的机器，那将是危险的。这就像为人类创造了一个比我们更聪明的竞争对手。它们可以通过说服、威胁、操纵公众舆论来影响人类。它们可以通过各种方式，借助人类在世界上完成任务。比如，帮助恐怖分子制造一种可能引发新的大流行病的病毒，这对我们来说可能非常危险。

对于像人类灭绝这样的灾难性事件，甚至是像摧毁我们的民主这样虽不那么极端但仍是灾难性的事件，问题在于它们是如此糟糕，以至于即使只有1%的发生几率，也是不可接受的。

《华尔街日报》Leadership Institute：所有大型AI实验室都非常坦率地谈论了他们在这些模型中加入的安全措施和护栏。您和他们有过交流吗?

本吉奥：我读过他们的报告。我也有过一些交流，但实际上，我进行的交流告诉我，这些公司内部的很多人都很担心。我还得到这样一种印象，那就是如果身处一家试图推动前沿技术的公司，可能会产生一种乐观偏见。这就是为什么我们需要独立的第三方来验证他们正在开发的任何安全方法是否真的没有问题。

《华尔街日报》Leadership Institute：在LawZero，您正在开发技术解决方案，为智能体化AI提供一些监督。您认为其他AI公司在这一领域开展更多工作所面临的最大障碍是什么?

本吉奥：是竞赛状态。这些公司几乎每周都在为推出比竞争对手更好的下一个版本而竞争。因此，他们专注于不让自己在这场竞赛中看起来落后。

《华尔街日报》Leadership Institute：在遇到那些重大风险之前，我们还有多少时间来解决这个问题?

本吉奥：如果你听其中一些领导者的说法，可能只有几年时间。我认为五到十年是非常有可能的。但我们应该感到紧迫，以防万一只有三年时间。

AI先驱、图灵奖得主约书亚·本希奥在蒙特利尔大学任教，他也是魁北克省AI研究机构Mila的创始人和科学顾问的创始人兼科学顾问。

AI先驱、图灵奖得主约书亚·本希奥在蒙特利尔大学任教，他也是魁北克省AI研究机构Mila的创始人和科学顾问的创始人兼科学顾问。图片来源：Mila

《华尔街日报》Leadership Institute：我们听说越来越多科技行业内外的公司正致力于将AI整合到他们的工作流程中。您对他们有什么建议?

本吉奥：使用AI的公司应该要求获得证据，证明所部署或使用的AI系统是值得信赖的。政府也应该提出同样的要求。但如果公司明白存在大量不可预知的风险和潜在的灾难性风险，市场就可以推动公司做正确的事。我认为公民也应该觉醒，更好地了解问题所在，利弊如何，以及我们怎样应对那些潜在的坏事，以便我们能从AI中受益。

相关新闻

黄仁勋糟了 AI竞赛终极赢家没有英伟达	看了医生开的药，相信你也会觉得AI是有意义的
雷军甩出“AI王炸”，小米再次爆火	一个AI引发精神病的案例
AI翻译的“最后一公里”	美股四大指数收黑博通、甲骨文继续跌
ChatGPT/Gemini最强流量竟是“这需求”	怕AI泡沫破裂？美科技公司投资人疯抢避险王牌
不到两年，它就“击败了”马斯克	GPT-5.2降智遭全网差评！奥特曼慌了
美国和中国政府扮推手吹出巨大泡沫	今年网络10大潮语出炉
中国AI芯片前景一片乐观？别高兴太早	芯片股暴跌的背后
GPT-5.2被曝作弊！不如Gemini 3	ChatGPT被起诉
机器人激增700％ 2026年10大科技巨变	赔钱又可能吃上官司这7种理财建议别跟风
封面魔咒再来？AI巨头登TIME年度风云人物	争先恐后美国人工智能巨头在这国大力投资

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	纵欲过度的张雨绮终究为自己的行为付出了
2	终于来了！二十大上的旧账，开始清算了
3	当年拆除亚洲最大火车站，如今肠子都悔青了
4	美国重大空难体坛齐声悼念
5	军委突发公告！又一军种“团灭”，信号极不

48小时新闻排行榜

更多>>

1	习央视镜头暴跌传彭丽媛军委闹事
2	纵欲过度的张雨绮终究为自己的行为付出了
3	终于来了！二十大上的旧账，开始清算了
4	当年拆除亚洲最大火车站，如今肠子都悔青了
5	大换血？赵乐际意外泄密：军权正在换人
6	美国重大空难体坛齐声悼念
7	中国已进入一个“Ｂ荒马乱”的时代
8	军委突发公告！又一军种“团灭”，信号极不
9	刚刚，川普政府宣布：解散！
10	中央定调中国收入分配或迎重大改革

热门专题

1 俄乌战争	6 四中全会	11 中共两会
2 中日关系	7 美伊冲突	12 大S
3 中美冷战	8 以伊战争	13 洛杉矶大火
4 万维专栏	9 何卫东	14 叙利亚
5 川普	10 AI	15 苗华被抓

一周博客排行

更多>>

1	惊爆：五中全会下月召开，胡春	雷歌747
2	常丁求暴毙老习开始被架空	胡亥
3	小区的房价跌了25%还是没人买	体育老师
4	远观中共动态 “新四人帮”似	胡亥
5	《推背图》和金圣叹预言张又侠	天机指南
6	隆重祭念南京大屠杀88周年-对	玉质
7	俄乌战争：中共是始作俑者？—	万维网友来
8	深度：习近平执政末期三大谜团	雷歌747
9	唐生智浪费了中国有史以来最好	弓长贝占郎
10	《美国国家安全战略报告》读后	中国社会经

一周博文回复排行榜

更多>>

1	习近平为什么越来越像毛泽东晚	文礼
2	小区的房价跌了25%还是没人买	体育老师
3	为什么女人不可以“顶半边天”	hechun
4	唐生智浪费了中国有史以来最好	弓长贝占郎
5	第一美女：茜茜皇后和红色女大	YOLO宥乐
6	一个世纪的轮回：美国从拒不就	高伐林
7	对比新疆与加沙，中共甩以色列	爪四哥
8	川普司法部三连败	马黑
9	为什么说手段比目的更重要？	施化
10	密苏里州索赔大战：给美国政商	遍地是贪官


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.