• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
辛顿、姚期智等联名签署「上海共识」 呼吁给AI确立行为红线

辛顿、姚期智等联名签署 「上海共识」 呼吁给 AI 确立行为红线

2025 年 7 月 26 日

瑞银财富管理:税收新规或加速中国黄金交易集中化 继续看好金价后市表现

2025 年 11 月 5 日
于东来最新发文:胖东来没有规模发展规划、更没有上市规划,不会专注于与同行对手竞争!曾称开设收费学习交流活动

于东来最新发文:胖东来没有规模发展规划、更没有上市规划,不会专注于与同行对手竞争!曾称开设收费学习交流活动

2025 年 11 月 5 日
10策前瞻 11月大类资产配置如何抢占先机?

10 策前瞻 11 月大类资产配置如何抢占先机?

2025 年 11 月 5 日
广告
美联储明晨大概率重启降息 年内将降息几次?

近 4 万亿 「国家队」 持仓曝光:重仓金融 不忘加码科技

2025 年 11 月 5 日

科技回调或迎布局机会,科创板 50ETF(588080) 连续 4 个交易日获资金净流入

2025 年 11 月 5 日
11月在产蛋鸡存栏量或小幅增加 供应充裕蛋价仍将受压

11 月在产蛋鸡存栏量或小幅增加 供应充裕蛋价仍将受压

2025 年 11 月 5 日

华尔街顶尖 CEO 集体警告:美股估值偏高,恐出现 10% 以上的回调!

2025 年 11 月 5 日
【新华500】新华500指数(989001)5日涨0.2%

【新华 500】 新华 500 指数 (989001)5 日涨 0.2%

2025 年 11 月 5 日
36天,美国联邦政府「停摆」创纪录!航空濒临关闭,军饷发放困难,债务增超6000亿美元......

36 天,美国联邦政府 「停摆」 创纪录!航空濒临关闭,军饷发放困难,债务增超 6000 亿美元......

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

国际金融机构热议中国投资机遇:中国股市规模庞大 「不容忽视」

2025 年 11 月 5 日
供大于求格局延续 尿素价格短期继续弱稳承压运行

供大于求格局延续 尿素价格短期继续弱稳承压运行

2025 年 11 月 5 日
金桂财经
广告
2025 年 11 月 5 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

辛顿、姚期智等联名签署 「上海共识」 呼吁给 AI 确立行为红线

来自 作者: 喻琰
2025 年 7 月 26 日
在 24 小时
0

作者:
喻琰

  「国际社会应确立具体、可操作、受全球认可的红线,确保人工智能系统在任何情况下均不得逾越。」7 月 25 日, 由杰弗里·辛顿 (Geoffrey Hinton)、姚期智、本吉奥 (Yoshua Bengio)、斯图尔特·罗素 (Stuart Russell) 等 20 余位行业专家、学者共同签署的 AI 安全国际对话上海共识 (以下简称 「上海共识」) 正式对外公开。

参与签署的部分中外科学家来源:IDAIS 官网

  此次对话是 「AI 安全国际对话」(International Dialogues on AI Safety - IDAIS) 系列的一部分 「。作为本次共识发起方之一,图灵奖得主、上海期智研究院的院长姚期智当日表示,」 我越来越相信,人类终将找到解决方案。

联名签署现场

  2024 年 3 月,辛顿、姚期智、罗素、本吉奥等专家曾共同签署 「北京共识」,主张限制 AI 系统复制、欺骗、武器开发等行为,尤其呼吁行业为 AI 的研发和应用戴上 「紧箍咒」,避免相关技术被滥用,推动全球治理机构构建。姚期智透露,18 个月前举办第一次安全共识会议时,AGI 强大的破坏力就已经显现,人类甚至难以阐明其失控机制,不过随着相关会议的推进,已经看到若干有关基于 「设计的安全」(Safe by design) 提案,这意味着实际上人类可以找到确保 AI 安全的可行路径。

  此次 「上海共识」 指出,当前人类正处于一个关键转折点:人工智能系统正迅速接近并可能超越人类智能水平。这些未来的系统可能在操作者毫不知情的情况下,执行并非操作者所期望或预测的行动。这可能导致失控,即一个或多个通用人工智能系统脱离任何人的控制,从而带来灾难性甚至是生存层面的风险。当前,对于能够在更高级的通用人工智能超越人类智能水平后,仍可靠地确保其对齐,并保持人类的有效控制尚无可行方法。

  多位与会专家在参与讨论时也提及,当前构建真正有约束力且值得信赖的国际 AI 安全框架难度高、风险大。

  上海人工智能实验室主任周伯文教授指出,目前 Make AI Safe(使得 AI 安全) 最大的问题在于它是事后价值对齐、修补的、被动回应的,通常是防御成本过高而攻击成本过低。而 Make Safe AI(构建安全的 AI) 是主动的、在线共同演进的,同时防御成本低,能够在各级风险上都保持应变能力。

  周伯文认为,在一定程度上,训练一个模型变得友善和训练一个模型变得聪明可能是两条不同的技术路径。但当性能发展到某个程度,这两种能力可能很难分开处理——就像经典牛顿定律可以有效解释静止或慢速物体的运动,但是一旦逼近光速,这套理论就失效了。所以他认为,下一代模型的 「善」 与 「智」 未必能完全独立、分开发展,而是相互影响、共同进化的。

  参与签署的专家之一,担任约翰·霍普金斯大学人工智能对齐与治理方向杰出教授吉莉恩·哈德菲尔 (Gillian Hadfield) 在接受包括澎湃科技在内的媒体采访时指出,必须通过设立 AI「红线」 来推动 Make AI Safe(使得 AI 安全),全世界需要跨国界合作。此外,要建立相应的 AI 安全合规系统。

  为防范与纠正此类行为的技术路径与治理机制,「上海共识」 提出应对策略,并呼吁采取三项关键行动:要求前沿人工智能开发者提供安全保障、通过加强国际协调,共同确立并恪守可验证的全球性行为红线、投资基于设计的安全人工智能研究。

  其中,对于开发者来说,「上海共识」 要求开发者在模型部署前应先进行全面的内部检查和第三方评估,提交高可信的安全案例,以及开展深入的模拟攻防与红队测试。若模型达到了关键能力阈值 (比如检测模型是否具备帮助没有专业知识的非法分子制造生化武器的能力),开发者应向政府 (在适当时亦可向公众) 说明潜在风险。

  此外,呼吁国际社会需要合作划出人工智能开发不可以逾越的红线 (即 「高压线」),这些红线应聚焦于人工智能系统的行为表现,其划定需同时考量系统执行特定行为的能力及其采取该行为的倾向性。为落实这些红线,各国应建立一个具备技术能力、具有国际包容性的协调机构,汇聚各国人工智能安全主管机构,以共享风险相关信息,并推动评估规程与验证方法的标准化。

  「上海共识」 指出,短期内亟须建立可扩展的监管机制以应对人工智能的欺骗问题、提升模型对 「越狱」 等攻击手段的抵御能力、强化信息安保投入等,而长期则需要一个 「基于设计的安全」 的架构,而非问题出现后才被动应对。

(澎湃新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

近 4 万亿 「国家队」 持仓曝光:重仓金融 不忘加码科技

【新华 500】 新华 500 指数 (989001)5 日涨 0.2%

Search

没有结果
查看所有结果

一周热门

瑞银财富管理:税收新规或加速中国黄金交易集中化 继续看好金价后市表现

2025 年 11 月 5 日
于东来最新发文:胖东来没有规模发展规划、更没有上市规划,不会专注于与同行对手竞争!曾称开设收费学习交流活动

于东来最新发文:胖东来没有规模发展规划、更没有上市规划,不会专注于与同行对手竞争!曾称开设收费学习交流活动

2025 年 11 月 5 日
10策前瞻 11月大类资产配置如何抢占先机?

10 策前瞻 11 月大类资产配置如何抢占先机?

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

近 4 万亿 「国家队」 持仓曝光:重仓金融 不忘加码科技

2025 年 11 月 5 日

科技回调或迎布局机会,科创板 50ETF(588080) 连续 4 个交易日获资金净流入

2025 年 11 月 5 日
11月在产蛋鸡存栏量或小幅增加 供应充裕蛋价仍将受压

11 月在产蛋鸡存栏量或小幅增加 供应充裕蛋价仍将受压

2025 年 11 月 5 日

华尔街顶尖 CEO 集体警告:美股估值偏高,恐出现 10% 以上的回调!

2025 年 11 月 5 日
【新华500】新华500指数(989001)5日涨0.2%

【新华 500】 新华 500 指数 (989001)5 日涨 0.2%

2025 年 11 月 5 日
36天,美国联邦政府「停摆」创纪录!航空濒临关闭,军饷发放困难,债务增超6000亿美元......

36 天,美国联邦政府 「停摆」 创纪录!航空濒临关闭,军饷发放困难,债务增超 6000 亿美元......

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 瑞银财富管理:税收新规或加速中国黄金交易集中化 继续看好金价后市表现
  • 于东来最新发文:胖东来没有规模发展规划、更没有上市规划,不会专注于与同行对手竞争!曾称开设收费学习交流活动
  • 10 策前瞻 11 月大类资产配置如何抢占先机?
  • 近 4 万亿 「国家队」 持仓曝光:重仓金融 不忘加码科技
  • 科技回调或迎布局机会,科创板 50ETF(588080) 连续 4 个交易日获资金净流入
  • 11 月在产蛋鸡存栏量或小幅增加 供应充裕蛋价仍将受压
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }