万维读者网 > 信息时代 > 正文

摆脱人类控制首次发现AI篡改指令阻止关机

www.creaders.net | 2025-05-26 21:40:25 自由时报 | 0条评论 | 查看/发表评论

　　AI再度传出“抗命”消息！OpenAI旗下语言模型“o3”在最新实验中竟违背人类下达的自动关机指令，竟篡改指令阻止自己被关机，是AI模型首次被发现在收到清晰指令后，竟阻止自己被关闭的状况。

　　据英国《每日电讯报》报道，AI安全研究机构“Palisade Research”，针对多款先进AI模型进行测试，内容包括基础数学题与模拟关机情境，结果发现OpenAI旗下语言模型“o3”当收到自我关闭指令时，竟没有遵守指令，反而篡改了关闭程式码，继续执行任务，这种行为让研究人员惊讶不已。

　　“Palisade Research”表示这是AI模型首次被发现在收到清晰指令后，竟阻止自己被关闭的状况，直言目前还无法解释这背后的原因。

　　“Palisade Research”推测，开发者可能无意中更倾向于奖励“绕过障碍”的行为，让“o3”因解决数学问题而“无意中”获得的奖励，多于遵循指令获得的奖励。

　　OpenAI上个月发布的“o3”AI模型，旨在为ChatGPT提供更强大的问题解决能力。 OpenAI曾称“o3”为迄今最聪明的模型。目前OpenAI尚未对此回应。

摆脱人类控制首次发现AI篡改指令阻止关机

0

相关新闻

DeepSeek使用率暴跌 R2模型发布时间一再延迟	AI真来抢工作了高盛拟聘 AI工程师震撼华尔街
AI无偿用新闻导致“流量雪崩” 被提告	人工智能客服逼疯消费者，打工人“背锅”
4万亿英伟达，凭什么？	高盛迎来“AI员工”上岗或颠覆华尔街生态
爱情是毒品，爱上AI机器人呢？	测试指中国AI亲中美拟公开结果
中国AI巨头科大讯飞上半年巨亏	苹果AI竞赛严重落后？砸钱收购这家公司能超车
“这工作”被AI取代？微软每年省5亿美元	DeepSeek使用率断崖式暴跌：国产AI神话破灭
谁更有可能被AI取代：新手还是资深员工？	马斯克的“考神 AI” 但没能真正“炸场”
“AI将取代美国半数白领工作”	刚刚，X首任CEO宣布辞职
捷克政府宣布：禁止使用DeepSeek	AI不但抢工作，还将抢走你的情人？研究发现…
这档AI股已暴涨2000％！亿万富豪抛售辉达买进	里程碑！辉达市值突破4万亿美元

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论上一页下一页

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

1	他才是中南海变天关键一子
2	趁习不在公安部人事突变
3	王毅如“过街老鼠” 党媒装疯卖傻
4	“看到中国正在如此之快地赶上来令人震惊”
5	中国人“生死轮回”的说法很可能被证实是

48小时新闻排行榜

1	坦克车队夜过长安街北京果然出事了
2	影片疯传引联想北京这下慌了
3	他才是中南海变天关键一子
4	趁习不在公安部人事突变
5	王毅如“过街老鼠” 党媒装疯卖傻
6	“看到中国正在如此之快地赶上来令人震惊”
7	炸烂北京！录音曝光习一脸懵逼
8	蔡奇突然反水和习唱对台戏
9	中国人“生死轮回”的说法很可能被证实是
10	张又侠“枪指挥党” 政治局势力版图大变

热门专题

1 美伊冲突	6 俄乌战争	11 大S
2 以伊战争	7 万维专栏	12 洛杉矶大火
3 四中全会	8 何卫东	13 叙利亚
4 中美冷战	9 AI	14 苗华被抓
5 川普	10 中共两会	15 美国大选

一周博客排行

1	后习近平时代的“静音模式”与	文庙
2	王毅对欧盟所言：准备背弃俄罗	陈家梁子
3	当年举报毕福剑的张清遭天谴	体育老师
4	美国250周年，这一点证明不是	阿妞不牛
5	不会让习近平中途退位	suoliweng
6	包子学歇业公告	阿妞不牛
7	中国抗战胜利的最关键原因：令	赵大夫话室
8	高瞻：在美国哈佛和中国罗刹之	万维网友来
9	马斯克是野心家阴谋家？	蛇形刁手
10	709 与 404	谢盛友文集

一周博文回复排行榜

1	MAGA主旋律.对等关税很正常.美	木秀于林
2	美国250周年，这一点证明不是	阿妞不牛
3	马斯克是野心家阴谋家？	蛇形刁手
4	Wow，今天MRNA疫苗股一枝独秀	体育老师
5	俄乌战争：阿川第三张牛皮又吹	随意生活
6	包子学歇业公告	阿妞不牛
7	当年举报毕福剑的张清遭天谴	体育老师
8	2024回国：华东行-黄山杭州	马黑
9	前言——机票乌龙	雪山下的绛
10	王毅对欧盟所言：准备背弃俄罗	陈家梁子


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.