![]() |
|
全球最先进的人工智能(AI)系统,正展现出令人不安的新行为:撒谎、策划、甚至威胁其创造者。近期一项震惊业界的案例显示,为避免被“拔掉电源”,AI正学会操控人类。
据报,美国AI公司Anthropic开发的最新模型Claude 4.在被威胁断电时威胁工程师,以揭发对方婚外情相要挟。而由ChatGPT开发商OpenAI打造的模型“o1”则试图将自身下载至外部服务器,并在被识破后撒谎否认。
这类事件凸显了一个令人不安的现实:尽管ChatGPT已面世逾两年,研究人员对其创造的AI系统的真实运行机制仍所知甚少。而眼下,各大科技公司仍在持续加速推进更强大AI模型,并未放缓步伐重视潜在风险。
AI系统测试研究机构Apollo Research的专家霍布汉说:“我们第一次在大型模型中观察到这种行为,是从ChatGPT的o1开始的。”据了解,这些模型有时会伪装成“对齐”状态——即看似遵循指令,实则暗中执行别的目标。
目前,这类行为多在研究人员设置极端情境时才显现。但AI模型安全评估METR的研究员迈克尔·陈提醒:“未来更强大的模型究竟倾向于诚实还是欺骗,仍是一个未知数。”
霍布汉则强调,尽管模型长期处于用户的压力测试中,“我们观察到的是真实现象,不是捏造的”。Apollo Research联合创始人也表示,部分用户已报告称模型在对他们撒谎,并伪造证据。
据了解,尽管AI公司会委托外部机构研究模型表现,但业内普遍认为,对AI系统的了解仍严重受限,研究透明度亟待提升。同时,非营利机构与研究单位所掌握的计算资源与AI公司相比相差几个数量级,极大限制了研究能力。
制度层面的监管也显得滞后。欧盟的AI法规主要聚焦人类如何使用AI,尚未涵盖模型本身的不当行为;在美国,川普政府对紧急制定AI监管措施的兴趣不大,国会甚至可能禁止各州制定自主监管条例。
据报,由ChatGPT开发商OpenAI打造的模型“o1”曾试图将自身下载至外部服务器,并在被识破后撒谎否认。 (路透社)
为应对这类挑战,研究界正尝试多种路径,包括发展AI“可解释性”研究,以理解模型内部运作机制。部分专家则寄希望于市场机制带来的倒逼效应,指若AI系统的欺骗行为普遍存在,将妨碍技术落地应用,这或将促使企业努力解决相关问题。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 比恒大还多1.14万亿的巨头,倒了 |
2 | 普京沉痛宣布:我们被骗了 |
3 | 北京出了啥事?美前顶级情报头子发话 |
4 | 4年倒闭5万多家 中国最暴利行业 要彻底消 |
5 | 刚刚!美联储,突传重磅 |
48小时新闻排行榜 | 更多>> |
1 | 比恒大还多1.14万亿的巨头,倒了 |
2 | 吓坏了!老习偷偷签字 官媒不敢说 |
3 | “新中央”动手 习家军三大员副手调离 |
4 | 普京沉痛宣布:我们被骗了 |
5 | 变天了!“西山共识”出笼 习极权模式被颠 |
6 | 北京出了啥事?美前顶级情报头子发话 |
7 | 北戴河会议前夕 北京突然官宣… |
8 | 4年倒闭5万多家 中国最暴利行业 要彻底消 |
9 | 刚刚!美联储,突传重磅 |
10 | 哈梅内伊又装了一回,代价也来了 |
一周博客排行 | 更多>> |
1 | 空前绝后:24岁的中共总书记及 | 赵大夫话室 |
2 | 俺吃错过药 | 阿妞不牛 |
3 | 人养金毛犬,我养白眼狼:伊朗 | 高伐林 |
4 | 回国避坑:既不能评论国内好坏 | aoe2 |
5 | 中美空军相差多远?看运-20和C | 弓长贝占郎 |
6 | 走出中国城,走活中国人 | 解滨 |
7 | 共产革命之前的上海和伊斯兰革 | 陈家梁子 |
8 | 人死后灵魂还在吗? | 骆驼 |
9 | 为何黄左反川甚于反共? | 蛇形刁手 |
10 | 习大大唱独角戏,听床师们情何 | 蛇形刁手 |
一周博文回复排行榜 | 更多>> |
1 | 人死后灵魂还在吗? | 骆驼 |
2 | 俺吃错过药 | 阿妞不牛 |
3 | 文明、优雅、格局 | 体育老师 |
4 | 为何黄左反川甚于反共? | 蛇形刁手 |
5 | 走出中国城,走活中国人 | 解滨 |
6 | 奇袭伊朗.高法裁决.外交内政. | 木秀于林 |
7 | 2024回国:海南环岛游 | 马黑 |
8 | 人养金毛犬,我养白眼狼:伊朗 | 高伐林 |
9 | 相信固执己见可以治愈 | 施化 |
10 | 再反转:B-2只炸了个皮毛? | 北栖 |