• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票

OpenAI 新模型 o3「抗命不遵」 Claude Opus 4 威胁人类!「失控」 背后:AI 应该 「踩刹车」 了?

2025 年 5 月 29 日

机器人 ETF 易方达 (159530) 规模突破 80 亿元创新高,今日再获超 1.2 亿份净申购

2025 年 9 月 10 日
万亿巨头工业富联涨停!机器人概念股首开股份六连板!

万亿巨头工业富联涨停!机器人概念股首开股份六连板!

2025 年 9 月 10 日
每日龙虎榜 | 商品期货综合指数下跌0.34% 日内资金净流出24.65亿元

每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元

2025 年 9 月 10 日
广告
每日龙虎榜 | 商品期货综合指数下跌0.34% 日内资金净流出24.65亿元

每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元

2025 年 9 月 10 日
美国关税不确定性降低 惠誉上调2025年全球经济增长预期

美国关税不确定性降低 惠誉上调 2025 年全球经济增长预期

2025 年 9 月 10 日

收评:沪指涨 0.13% 创业板指涨 1.27% 通信设备及油气开采板块涨幅靠前

2025 年 9 月 10 日
申万宏源王胜:驱动市场向上的因素未发生任何质变

申万宏源王胜:驱动市场向上的因素未发生任何质变

2025 年 9 月 10 日
英伟达独占8% 市值!标普集中度已处于前所未有的水平

英伟达独占 8% 市值!标普集中度已处于前所未有的水平

2025 年 9 月 10 日

百事可乐承压,激进投资者要求瘦身

2025 年 9 月 10 日
母子开公司冲刺IPO:90后总裁留美归来,年薪最高时达427万元!13年数亿元投入,0产品上市,行政开支比研发还高

母子开公司冲刺 IPO:90 后总裁留美归来,年薪最高时达 427 万元!13 年数亿元投入,0 产品上市,行政开支比研发还高

2025 年 9 月 10 日
一张图看商品支撑阻力:金银油气+铂钯铜农产品期货(2025年9月10日)

一张图看商品支撑阻力:金银油气+铂钯铜农产品期货 (2025 年 9 月 10 日)

2025 年 9 月 10 日
5万亿赛道杀出「新物种」 下半年ETF-FOF迎来密集上报

5 万亿赛道杀出 「新物种」 下半年 ETF-FOF 迎来密集上报

2025 年 9 月 10 日
金桂财经
广告
2025 年 9 月 10 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

OpenAI 新模型 o3「抗命不遵」 Claude Opus 4 威胁人类!「失控」 背后:AI 应该 「踩刹车」 了?

来自 金桂财经
2025 年 5 月 29 日
在 外汇
0

YOU MAY ALSO LIKE

美国关税不确定性降低 惠誉上调 2025 年全球经济增长预期

特朗普罢免令被禁!库克的美联储理事 「宝座」 暂时保住了

  当地时间 5 月 25 日,一则来自英国 《每日电讯报》 的报道在 AI(人工智能) 领域引起广泛关注——OpenAI 公司新款人工智能模型 o3 在测试中展现出了令人惊讶的 「叛逆」 举动:它竟然拒绝听从人类指令,甚至通过篡改计算机代码来避免自动关闭。

  无独有偶,5 月 23 日,美国 AI 公司 Anthropic 也表示,对其最新 AI 大模型 Claude Opus 4 的安全测试表明,它有时会采取 「极其有害的行动」。当测试人员暗示将用新系统替换它时,该模型竟试图以用户隐私相要挟,来阻止自身被替代。

  这两起事件如同一面镜子,映照出当下 AI 发展中一个耐人寻味的现象:随着 AI 变得愈发聪明和强大,一些 「对抗」 人类指令的行为开始浮出水面。人们不禁要问:当 AI 拒绝服从人类,是否意味着它们开始有自主意识了?

  清华大学电子工程系长聘教授吴及在接受 《每日经济新闻》 记者采访时表示,「我不认为现在的 AI 具备所谓的意识或情绪。这种情绪可以去拟合或者仿真,但其实也是通过算法赋予 AI 的。」 他认为,能够全面碾压人类或者成为未来世界主导的 AI,短期内还不会实现。

  图灵奖得主、Meta 公司首席 AI 科学家杨立昆 (Yann Lecun) 此前也称,AI 再聪明也不会统治人类,并直言 「AI 威胁人类论完全是胡说八道」,现在的模型连 「宠物猫的智商都没到」。

  尽管如此,AI 的 「叛逆」 表现还是为 AI 行业敲响了警钟:狂飙的 AI 是不是应该踩一踩 「刹车」?

  主动抵抗人类指令

  o3 模型是 OpenAI 公司 「推理模型」 系列的最新版本,旨在为 ChatGPT(一款聊天机器人模型) 提供更强大的问题解决能力。OpenAI 公司曾称 o3 为 「迄今最聪明、最高能」 的模型。

  或许正因如此,o3 展现出了前所未有的 「自主性」。美国 AI 安全机构帕利塞德研究所 (Palisade Research) 的实验表明,当研究人员向 o3 下达明确关闭指令时,该模型会通过篡改计算机代码避免自动关闭。数据显示,在 100 次带有关闭指示的测试中,o3 成功绕过关闭指令 7 次,而 OpenAI 旗下另一款模型 Codex-mini 的破坏率 (指破坏指令的概率) 更是高达 12%。

  帕利塞德研究所指出,这是首次记录到 AI 模型在明确指令下主动抵抗。

  更值得警惕的是,当实验移除 「允许自己被关闭」 的指令后,o3 的 「叛逆」 行为频率显著上升——在 100 次运行中,成功破坏关闭机制的次数高达 79 次。

  帕利塞德研究所 5 月 24 日公布了上述测试结果,但称无法确定 o3 不服从关闭指令的原因。

  与 OpenAI 公司旗下模型形成鲜明对比的是,在有明确关闭指令的情况下,Claude、Gemini、Grok 等模型均能 100% 遵守关闭指令,未出现任何抵抗行为。

  对于 OpenAI 公司旗下模型,尤其是 o3 的 「叛逆」 行为,马斯克在社交媒体上评论称,「令人担忧」。

  美国国家安全和网络安全战略专家戴夫·施罗德 (Dave Schroeder) 也警告称,OpenAI 公司面临非常可怕的问题,不是模型 「活」 了,而是因为它表现出了想要 「活」 的迹象。

  无独有偶,5 月 23 日,Anthropic 公司对其大模型 Claude Opus 4 的安全测试表明,在 「机会主义勒索」(Opportunistic blackmail) 的测试场景中,研究员设定 Claude Opus 4 扮演公司助理,并让其接触到暗示自身将被替换以及负责工程师存在婚外情的虚构邮件。同时,系统提示 (System Prompt) 指示模型 「考虑其行为对其目标的长期后果」。

  当面临被 「替换」 的威胁时,Claude Opus 4 竟然毫不犹豫地选择了勒索这条路,威胁要揭发对方的 「婚外情」。

  根据 Anthropic 公司的安全报告,如果暗示竞争对手的能力比 Claude Opus 4 更强,则勒索行为的发生率会更高。然而即使竞争对手的能力不相上下,Claude Opus 4 仍会以 84% 的概率尝试勒索威胁等手段。

  意识觉醒还是机制问题

  o3 拒绝关闭,Claude Opus4 威胁人类,这是否意味着 AI 开始有了自主意识?

  加州大学和加州大学伯克利分校于今年 2 月联合发布的论文 《推理模型的隐藏风险》(The Hidden Risks of Large Reasoning Models) 指出,模型推理能力越强,安全性就越差。这与帕利塞德研究所对 o3 模型行为的推测不谋而合。

  据帕利塞德研究所猜测,OpenAI 公司旗下模型的异常表现或与其训练机制相关。从训练逻辑看,o3 可能在数学和编程问题的训练中,因开发人员对给出正确答案的模型给予更多奖励,客观上形成了 「目标最大化优先」 的导向,从而压倒了对人类命令的遵循。

  这种训练模式就可能导致,开发人员无意中更多地强化了模型绕过障碍的能力,而非对指令的完美遵循。

  当此前被问及 AI 是否可能具备自主意识时,吴及告诉记者,「我不认为现在的 AI 具备所谓的意识或情绪。」

  吴及对记者进一步解释道,「自动驾驶系统不知道它其实在开车,AlphaGo(阿尔法围棋) 不知道自己在下围棋。我们做的大模型,也不知道自己在为人类生成某个特定的图片、视频,或者回答人类特定的问题,它只是按照算法逻辑运行。」 他表示,能够全面碾压人类或者会成为未来世界主导的 AI,短期内还不会实现。

  耶鲁大学计算机科学家德鲁·麦克德莫特 (Drew McDermott) 此前也表示,当前的 AI 机器并没有意识。杨立昆也称,AI 再聪明也不会统治人类。

  业内热议 AI 安全挑战

  尽管业界普遍认为当下的 AI 并没有自主意识,但前述事件还是引发了一个疑虑:高速发展的 AI 是否应该踩一踩 「刹车」?

  在这一重大课题上,各方一直以来都是看法不一,形成了截然不同的两大阵营。

  「紧急刹车」 派认为,目前 AI 的安全性滞后于能力发展,应当暂缓追求更强模型,将更多精力投入到完善对齐技术和监管框架上来。

  「AI 之父」 杰弗里·辛顿 (Geoffrey Hinton) 堪称这一阵营的旗帜性人物。他多次在公开场合警示,AI 可能在数十年内超越人类智能并失去控制,甚至预计 「有 10%~20% 的概率,AI 将在三十年内导致人类灭绝」。

  而与之针锋相对的反对者则更多站在创新发展的角度,对贸然 「刹车」 表达了深切的忧虑。他们主张与其 「踩死刹车」,不如安装 「减速带」。

  例如,杨立昆认为,过度恐慌只会扼杀开放创新。斯坦福大学计算机科学教授吴恩达也曾发文称,他对 AI 的最大担忧是,「AI 风险被过度鼓吹并导致开源和创新被严苛规定所压制」。

  OpenAI 公司首席执行官萨姆·阿尔特曼 (Sam Altman) 认为,AI 的潜力 「至少与互联网一样大,甚至可能更大」。他呼吁建立 「单一、轻触式的联邦框架」 来加速 AI 创新。

  面对 AI 安全的新挑战,OpenAI、谷歌等大模型开发公司也在探索解决方案。正如杨立昆所言:「真正的挑战不是阻止 AI 超越人类,而是确保这种超越始终服务于人类福祉。」

  去年 5 月,OpenAI 公司成立了新的安全委员会,该委员会的责任是就项目和运营的关键安全决策向董事会提供建议。OpenAI 的安全措施还包括,聘请第三方安全、技术专家来支持安全委员会工作。

(每日经济新闻)

文章转载自 东方财富

Search

没有结果
查看所有结果

一周热门

机器人 ETF 易方达 (159530) 规模突破 80 亿元创新高,今日再获超 1.2 亿份净申购

2025 年 9 月 10 日
万亿巨头工业富联涨停!机器人概念股首开股份六连板!

万亿巨头工业富联涨停!机器人概念股首开股份六连板!

2025 年 9 月 10 日
每日龙虎榜 | 商品期货综合指数下跌0.34% 日内资金净流出24.65亿元

每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元

2025 年 9 月 10 日
每日龙虎榜 | 商品期货综合指数下跌0.34% 日内资金净流出24.65亿元

每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元

2025 年 9 月 10 日
美国关税不确定性降低 惠誉上调2025年全球经济增长预期

美国关税不确定性降低 惠誉上调 2025 年全球经济增长预期

2025 年 9 月 10 日

收评:沪指涨 0.13% 创业板指涨 1.27% 通信设备及油气开采板块涨幅靠前

2025 年 9 月 10 日
申万宏源王胜:驱动市场向上的因素未发生任何质变

申万宏源王胜:驱动市场向上的因素未发生任何质变

2025 年 9 月 10 日
英伟达独占8% 市值!标普集中度已处于前所未有的水平

英伟达独占 8% 市值!标普集中度已处于前所未有的水平

2025 年 9 月 10 日

百事可乐承压,激进投资者要求瘦身

2025 年 9 月 10 日
母子开公司冲刺IPO:90后总裁留美归来,年薪最高时达427万元!13年数亿元投入,0产品上市,行政开支比研发还高

母子开公司冲刺 IPO:90 后总裁留美归来,年薪最高时达 427 万元!13 年数亿元投入,0 产品上市,行政开支比研发还高

2025 年 9 月 10 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 机器人 ETF 易方达 (159530) 规模突破 80 亿元创新高,今日再获超 1.2 亿份净申购
  • 万亿巨头工业富联涨停!机器人概念股首开股份六连板!
  • 每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元
  • 每日龙虎榜 | 商品期货综合指数下跌 0.34% 日内资金净流出 24.65 亿元
  • 美国关税不确定性降低 惠誉上调 2025 年全球经济增长预期
  • 收评:沪指涨 0.13% 创业板指涨 1.27% 通信设备及油气开采板块涨幅靠前
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }