• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
OpenAI最新模型打不动了?GPT-5.2因「降智」陷「差评潮」

OpenAI 最新模型打不动了?GPT-5.2 因 「降智」 陷 「差评潮」

2025 年 12 月 15 日
北亚区去年销售额终于止跌 欧莱雅CEO叶鸿慕:中国市场高端消费正在恢复

北亚区去年销售额终于止跌 欧莱雅 CEO 叶鸿慕:中国市场高端消费正在恢复

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

牛市逻辑再现 AI 资本开支重塑有色金属需求 商品配置正当时?

2026 年 2 月 15 日
21家银行被认定为国内系统重要性银行 资本和杠杆率要求更高

21 家银行被认定为国内系统重要性银行 资本和杠杆率要求更高

2026 年 2 月 15 日
广告
生猪价格跌至年内新低 行业面临不同程度亏损

国盛证券熊园:马年股票和商品更 「性感」 调整就是机会

2026 年 2 月 15 日
美国加州州长,公开大骂特朗普:80岁还像8岁小孩般幼稚,正加倍犯傻,3年后就会下台!他还「很钦佩中国」,称「美国在『开倒车』」

美国加州州长,公开大骂特朗普:80 岁还像 8 岁小孩般幼稚,正加倍犯傻,3 年后就会下台!他还 「很钦佩中国」,称 「美国在 『开倒车』」

2026 年 2 月 15 日
环球下周看点:美国GDP与PCE数据来袭 「AI打地鼠」行情会否延续?

环球下周看点:美国 GDP 与 PCE 数据来袭 「AI 打地鼠」 行情会否延续?

2026 年 2 月 15 日
泽连斯基:冲突可以结束 但首先要结束得体面!俄美乌下周再谈 马克龙:欧盟国家理应上桌

泽连斯基:冲突可以结束 但首先要结束得体面!俄美乌下周再谈 马克龙:欧盟国家理应上桌

2026 年 2 月 15 日
连续三年财务造假 虚增营收超6亿元 *ST立方拟被终止上市!此前股价11天暴涨336%

连续三年财务造假 虚增营收超 6 亿元 *ST 立方拟被终止上市!此前股价 11 天暴涨 336%

2026 年 2 月 15 日

从超 230 亿元亏损到 AI 购物 「攻守道」:美团 2026 年 「背水一战」

2026 年 2 月 15 日
一周展望:美联储纪要、PCE火热来袭!2月20日关税案见分晓?

一周展望:美联储纪要、PCE 火热来袭!2 月 20 日关税案见分晓?

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

国资下场了!「老破小」 等到最大的买家

2026 年 2 月 15 日
跌超90%!昔日大牛股为何被赶下云端?这些传统股却创出新高

跌超 90%!昔日大牛股为何被赶下云端?这些传统股却创出新高

2026 年 2 月 15 日
金桂财经
广告
2026 年 2 月 15 日 星期日
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

OpenAI 最新模型打不动了?GPT-5.2 因 「降智」 陷 「差评潮」

来自 金桂财经
2025 年 12 月 15 日
在 24 小时
0

来源:
界面新闻

  OpenAI 推出不到一周的最新旗舰模型没能等来 「好评如潮」。

  近日,OpenAI 在十周年之际发布了 GPT-5.2 系列模型,官方数据显示其在 GDPval 等专业基准测试中超越人类专家,是迄今为止在 「专业知识工作方面」 表现最好的模型。

  据 OpenAI 官方披露,GPT-5.2 在多领域实现技术突破:GDPval 测试中覆盖 44 个职业的任务表现 70.9% 优于顶尖专家,SWE-bench Pro 编程测试获 55.6% 的 SOTA 成绩,还将幻觉率较 GPT-5.1 降低 38%。该公司 CEO 山姆·奥特曼称其为 「许久以来最大的升级」,并透露计划 2026 年 1 月解除应对谷歌竞争的 「红色警报」。

  但该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,「智商不稳定」。

  SimpleBench 常识推理测试显示,GPT-5.2 得分低于 Anthropic 发布的 Claude Sonnet 3.7,甚至在 「garlic 有几个 r」 的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的 Gemini 3.0 等竞品均稳定通关。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前 AWS 总经理 Bindu Reddy 直言,「不值得从 GPT-5.1 升级」。

图片

网友晒出 GPT-5.2 在 SimpleBench 上的成绩单。

  一些编程爱好者则发现,GPT-5.2 生成的交通灯模拟代码画面仅达 「黑白火柴人级别」,蒙娜丽莎ASCII 艺术创作效果远逊于 GPT-4o。情感交互中有用户倾诉 「恐慌发作」,竟收到 「很高兴听到这个消息」 的回复,安慰失宠孩童时则机械强调 「生物都会停止运作」,缺乏此前版本的亲和力和自然表达。

  此外,该版本在处理连续对话时不稳定,甚至在明确选择 「高级思考模式」 时也会返回低质量的自动响应,令用户不得不重新调整使用方式。

  还有用户表示,GPT-5.2 的安全策略实施过于严格,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。

  有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI 推广时着重强调 GPT-5.2 的专业能力和基准测试成绩,但普通用户更关注日常对话、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差。

  截至发稿,OpenAI 尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。

  当前,OpenAI 仍面临来自谷歌的巨大竞争压力。谷歌此前推出的 Gemini 3 在编程、多模态理解等关键企业应用场景上实现了对 ChatGPT 的性能超越。11 月,谷歌宣布 Gemini 月活跃用户已突破 6.5 亿,较 7 月报告的 4.5 亿实现大幅增长,而 OpenAI 披露的周活跃用户数接近 8 亿。

  为此,奥特曼曾发布 「红色代码」 警报,决定暂时搁置包括 Sora 视频生成器在内的长期研发项目,转而在短期内全力通过提升用户活跃度来巩固 ChatGPT 的大众市场地位。但急转直下的口碑或在很大程度上影响 ChatGPT 的使用率,OpenAI 能否拿出更强有力的 「武器」 反击谷歌仍存在不确定性。

(界面新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

21 家银行被认定为国内系统重要性银行 资本和杠杆率要求更高

泽连斯基:冲突可以结束 但首先要结束得体面!俄美乌下周再谈 马克龙:欧盟国家理应上桌

Search

没有结果
查看所有结果

一周热门

北亚区去年销售额终于止跌 欧莱雅CEO叶鸿慕:中国市场高端消费正在恢复

北亚区去年销售额终于止跌 欧莱雅 CEO 叶鸿慕:中国市场高端消费正在恢复

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

牛市逻辑再现 AI 资本开支重塑有色金属需求 商品配置正当时?

2026 年 2 月 15 日
21家银行被认定为国内系统重要性银行 资本和杠杆率要求更高

21 家银行被认定为国内系统重要性银行 资本和杠杆率要求更高

2026 年 2 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

国盛证券熊园:马年股票和商品更 「性感」 调整就是机会

2026 年 2 月 15 日
美国加州州长,公开大骂特朗普:80岁还像8岁小孩般幼稚,正加倍犯傻,3年后就会下台!他还「很钦佩中国」,称「美国在『开倒车』」

美国加州州长,公开大骂特朗普:80 岁还像 8 岁小孩般幼稚,正加倍犯傻,3 年后就会下台!他还 「很钦佩中国」,称 「美国在 『开倒车』」

2026 年 2 月 15 日
环球下周看点:美国GDP与PCE数据来袭 「AI打地鼠」行情会否延续?

环球下周看点:美国 GDP 与 PCE 数据来袭 「AI 打地鼠」 行情会否延续?

2026 年 2 月 15 日
泽连斯基:冲突可以结束 但首先要结束得体面!俄美乌下周再谈 马克龙:欧盟国家理应上桌

泽连斯基:冲突可以结束 但首先要结束得体面!俄美乌下周再谈 马克龙:欧盟国家理应上桌

2026 年 2 月 15 日
连续三年财务造假 虚增营收超6亿元 *ST立方拟被终止上市!此前股价11天暴涨336%

连续三年财务造假 虚增营收超 6 亿元 *ST 立方拟被终止上市!此前股价 11 天暴涨 336%

2026 年 2 月 15 日

从超 230 亿元亏损到 AI 购物 「攻守道」:美团 2026 年 「背水一战」

2026 年 2 月 15 日
一周展望:美联储纪要、PCE火热来袭!2月20日关税案见分晓?

一周展望:美联储纪要、PCE 火热来袭!2 月 20 日关税案见分晓?

2026 年 2 月 15 日
金桂财经

2026 年 2 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
232425262728  
« 1 月    

近期动态

  • 北亚区去年销售额终于止跌 欧莱雅 CEO 叶鸿慕:中国市场高端消费正在恢复
  • 牛市逻辑再现 AI 资本开支重塑有色金属需求 商品配置正当时?
  • 21 家银行被认定为国内系统重要性银行 资本和杠杆率要求更高
  • 国盛证券熊园:马年股票和商品更 「性感」 调整就是机会
  • 美国加州州长,公开大骂特朗普:80 岁还像 8 岁小孩般幼稚,正加倍犯傻,3 年后就会下台!他还 「很钦佩中国」,称 「美国在 『开倒车』」
  • 环球下周看点:美国 GDP 与 PCE 数据来袭 「AI 打地鼠」 行情会否延续?
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }