• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
OpenAI最新模型打不动了?GPT-5.2因「降智」陷「差评潮」

OpenAI 最新模型打不动了?GPT-5.2 因 「降智」 陷 「差评潮」

2025 年 12 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

双航母将同现中东!美伊以三国 谁想真谈?谁谋真打?

2026 年 2 月 15 日
调整15% 产品组合、大刀阔斧「瘦身聚焦」!联合利华2025年所有业务线营业额均下滑,押注高端美容能否破局?

调整 15% 产品组合、大刀阔斧 「瘦身聚焦」!联合利华 2025 年所有业务线营业额均下滑,押注高端美容能否破局?

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

老铺金条变 「金甲」 万元黄金上指端 记者调查:「微金」 消费能撬动多大市场

2026 年 2 月 15 日
广告
生猪价格跌至年内新低 行业面临不同程度亏损

宠物年货摆上山姆盒马货架 「猫狗年夜饭」 提前两周售罄 上市公司抢跑千亿赛道

2026 年 2 月 15 日
Seedance2.0爆火 迪士尼指控侵权 好莱坞名编剧哀叹

Seedance2.0 爆火 迪士尼指控侵权 好莱坞名编剧哀叹

2026 年 2 月 15 日
老铺金条变「金甲」,万元黄金上指端⋯⋯记者调查:「微金」消费能撬动多大市场

老铺金条变 「金甲」,万元黄金上指端⋯⋯记者调查:「微金」 消费能撬动多大市场

2026 年 2 月 15 日
全线反弹!比特币价格一度站上70000美元 加密货币大涨 超9万人爆仓

全线反弹!比特币价格一度站上 70000 美元 加密货币大涨 超 9 万人爆仓

2026 年 2 月 15 日

截至 2025 年末我国境内公募基金规模达 37.71 万亿元

2026 年 2 月 15 日
从超230亿元亏损到AI购物「攻守道」:美团2026年「背水一战」

从超 230 亿元亏损到 AI 购物 「攻守道」:美团 2026 年 「背水一战」

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

加速推进可复用火箭研发 商业航天迎来融资潮

2026 年 2 月 15 日
北亚区去年销售额终于止跌 欧莱雅CEO叶鸿慕:中国市场高端消费正在恢复

北亚区去年销售额终于止跌 欧莱雅 CEO 叶鸿慕:中国市场高端消费正在恢复

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

牛市逻辑再现 AI 资本开支重塑有色金属需求 商品配置正当时?

2026 年 2 月 15 日
金桂财经
广告
2026 年 2 月 15 日 星期日
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

OpenAI 最新模型打不动了?GPT-5.2 因 「降智」 陷 「差评潮」

来自 金桂财经
2025 年 12 月 15 日
在 24 小时
0

来源:
界面新闻

  OpenAI 推出不到一周的最新旗舰模型没能等来 「好评如潮」。

  近日,OpenAI 在十周年之际发布了 GPT-5.2 系列模型,官方数据显示其在 GDPval 等专业基准测试中超越人类专家,是迄今为止在 「专业知识工作方面」 表现最好的模型。

  据 OpenAI 官方披露,GPT-5.2 在多领域实现技术突破:GDPval 测试中覆盖 44 个职业的任务表现 70.9% 优于顶尖专家,SWE-bench Pro 编程测试获 55.6% 的 SOTA 成绩,还将幻觉率较 GPT-5.1 降低 38%。该公司 CEO 山姆·奥特曼称其为 「许久以来最大的升级」,并透露计划 2026 年 1 月解除应对谷歌竞争的 「红色警报」。

  但该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,「智商不稳定」。

  SimpleBench 常识推理测试显示,GPT-5.2 得分低于 Anthropic 发布的 Claude Sonnet 3.7,甚至在 「garlic 有几个 r」 的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的 Gemini 3.0 等竞品均稳定通关。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前 AWS 总经理 Bindu Reddy 直言,「不值得从 GPT-5.1 升级」。

图片

网友晒出 GPT-5.2 在 SimpleBench 上的成绩单。

  一些编程爱好者则发现,GPT-5.2 生成的交通灯模拟代码画面仅达 「黑白火柴人级别」,蒙娜丽莎ASCII 艺术创作效果远逊于 GPT-4o。情感交互中有用户倾诉 「恐慌发作」,竟收到 「很高兴听到这个消息」 的回复,安慰失宠孩童时则机械强调 「生物都会停止运作」,缺乏此前版本的亲和力和自然表达。

  此外,该版本在处理连续对话时不稳定,甚至在明确选择 「高级思考模式」 时也会返回低质量的自动响应,令用户不得不重新调整使用方式。

  还有用户表示,GPT-5.2 的安全策略实施过于严格,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。

  有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI 推广时着重强调 GPT-5.2 的专业能力和基准测试成绩,但普通用户更关注日常对话、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差。

  截至发稿,OpenAI 尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。

  当前,OpenAI 仍面临来自谷歌的巨大竞争压力。谷歌此前推出的 Gemini 3 在编程、多模态理解等关键企业应用场景上实现了对 ChatGPT 的性能超越。11 月,谷歌宣布 Gemini 月活跃用户已突破 6.5 亿,较 7 月报告的 4.5 亿实现大幅增长,而 OpenAI 披露的周活跃用户数接近 8 亿。

  为此,奥特曼曾发布 「红色代码」 警报,决定暂时搁置包括 Sora 视频生成器在内的长期研发项目,转而在短期内全力通过提升用户活跃度来巩固 ChatGPT 的大众市场地位。但急转直下的口碑或在很大程度上影响 ChatGPT 的使用率,OpenAI 能否拿出更强有力的 「武器」 反击谷歌仍存在不确定性。

(界面新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

双航母将同现中东!美伊以三国 谁想真谈?谁谋真打?

Seedance2.0 爆火 迪士尼指控侵权 好莱坞名编剧哀叹

Search

没有结果
查看所有结果

一周热门

生猪价格跌至年内新低 行业面临不同程度亏损

双航母将同现中东!美伊以三国 谁想真谈?谁谋真打?

2026 年 2 月 15 日
调整15% 产品组合、大刀阔斧「瘦身聚焦」!联合利华2025年所有业务线营业额均下滑,押注高端美容能否破局?

调整 15% 产品组合、大刀阔斧 「瘦身聚焦」!联合利华 2025 年所有业务线营业额均下滑,押注高端美容能否破局?

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

老铺金条变 「金甲」 万元黄金上指端 记者调查:「微金」 消费能撬动多大市场

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

宠物年货摆上山姆盒马货架 「猫狗年夜饭」 提前两周售罄 上市公司抢跑千亿赛道

2026 年 2 月 15 日
Seedance2.0爆火 迪士尼指控侵权 好莱坞名编剧哀叹

Seedance2.0 爆火 迪士尼指控侵权 好莱坞名编剧哀叹

2026 年 2 月 15 日
老铺金条变「金甲」,万元黄金上指端⋯⋯记者调查:「微金」消费能撬动多大市场

老铺金条变 「金甲」,万元黄金上指端⋯⋯记者调查:「微金」 消费能撬动多大市场

2026 年 2 月 15 日
全线反弹!比特币价格一度站上70000美元 加密货币大涨 超9万人爆仓

全线反弹!比特币价格一度站上 70000 美元 加密货币大涨 超 9 万人爆仓

2026 年 2 月 15 日

截至 2025 年末我国境内公募基金规模达 37.71 万亿元

2026 年 2 月 15 日
从超230亿元亏损到AI购物「攻守道」:美团2026年「背水一战」

从超 230 亿元亏损到 AI 购物 「攻守道」:美团 2026 年 「背水一战」

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

加速推进可复用火箭研发 商业航天迎来融资潮

2026 年 2 月 15 日
金桂财经

2026 年 2 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
232425262728  
« 1 月    

近期动态

  • 双航母将同现中东!美伊以三国 谁想真谈?谁谋真打?
  • 调整 15% 产品组合、大刀阔斧 「瘦身聚焦」!联合利华 2025 年所有业务线营业额均下滑,押注高端美容能否破局?
  • 老铺金条变 「金甲」 万元黄金上指端 记者调查:「微金」 消费能撬动多大市场
  • 宠物年货摆上山姆盒马货架 「猫狗年夜饭」 提前两周售罄 上市公司抢跑千亿赛道
  • Seedance2.0 爆火 迪士尼指控侵权 好莱坞名编剧哀叹
  • 老铺金条变 「金甲」,万元黄金上指端⋯⋯记者调查:「微金」 消费能撬动多大市场
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }