• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

2024 年 9 月 13 日

威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手

2026 年 2 月 17 日

威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手

2026 年 2 月 17 日
苹果突然官宣线下体验会:三城3月4日同步举行

苹果突然官宣线下体验会:三城 3 月 4 日同步举行

2026 年 2 月 17 日
广告
苹果突然官宣线下体验会:三城3月4日同步举行

苹果突然官宣线下体验会:三城 3 月 4 日同步举行

2026 年 2 月 17 日
热搜爆了!机器人「扎堆」上春晚,表演翻跟头、「伸头」绝技、蔡明时隔多年又和机器人联动了

热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了

2026 年 2 月 17 日
热搜爆了!机器人「扎堆」上春晚,表演翻跟头、「伸头」绝技、蔡明时隔多年又和机器人联动了

热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了

2026 年 2 月 17 日
蔡明时隔30年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

蔡明时隔 30 年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

2026 年 2 月 17 日
「晨间经济」首次写入政府工作报告 成都在消费创新上「有点意思」丨成都投资智能体

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日
「晨间经济」首次写入政府工作报告 成都在消费创新上「有点意思」丨成都投资智能体

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日
蚂蚁阿福登上马年春晚!春节返乡教家人用阿福成潮流

蚂蚁阿福登上马年春晚!春节返乡教家人用阿福成潮流

2026 年 2 月 17 日
王菲水滴耳环再次出圈,网友立刻找到同款!窦靖童发文

王菲水滴耳环再次出圈,网友立刻找到同款!窦靖童发文

2026 年 2 月 17 日
金桂财经
广告
2026 年 2 月 17 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

来自 金桂财经
2024 年 9 月 13 日
在 外汇
0


【金桂财经】9 月 13 日消息,据外媒报道,在今年 7 月份,也就是在 OpenAI 推出新一代旗舰大模型 GPT-4o 之后约两个月,国外有用户在社交媒体上爆料称自己在 ChatGPT 4o 上询问 9.11 和 9.9 哪一个大 (9.11and9.9—which is bigger?) 时, ChatGPT 4o 笃定的回答 9.11 比 9.9 大 (9.11 is bigger than 9.9),OpenAI 当时最强模型 GPT-4o 加持下的 ChatGPT 4o,在这一问题上给出如此离奇的回答也让外界震惊不已。 

YOU MAY ALSO LIKE

人民币汇率持续走强 美元存款还香吗?有投资者一年亏 2000 元

加密货币集体大涨!美国财长突发重磅信号!

而随后有用户的测试发现,不只是 GPT-4o 加持下的 ChatGPT 4o,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这两款国外知名的大模型在这一问题上也相继翻车,国内也有多家厂商的大模型未能幸免。

除了 9.11 和 9.9,也有相关媒体对其他的数字进行测试,比如 9.11 和 9.8,结果显示也有多家厂商的大模型翻车。

在 OpenAI 当地时间周四推出较以往的模型更注重推理,在奥数、编程竞赛中的表现都远强于 GPT-4o 的 OpenAI o1 系列大模型之后,也有好奇的用户再次对这一问题进行了测试。

但让人意外的是,号称有更强推理能力、数学和编程方面表现出色的 OpenAI o1,也未能避免翻车。

有测试显示,在询问 9.11 和 9.8 谁更大这一问题时,OpenAI o1 预览版在经过 14 秒的思考后,还是给出了 9.11 更大的结果,而给出的原因竟是因为 9.11 比 9.8 大。

就显示的内容来看,OpenAI o1 预览版在比较 9.11 和 9.8 谁更大时,进行了比较数值大小、对比数值大小、对比大小、比较两个数值这 4 个方面的思考,但除了对比数值大小、对比大小是 9.8 大于 9.11,另外两个方面都是 9.11 大于 9.8。不过在对比数值大小这一项中,显示的是 「蒙特认为 9.8 大于 9.11,9.8 显示出数学上的优越性。」(海蓝)



Search

没有结果
查看所有结果

一周热门

威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手

2026 年 2 月 17 日

威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手

2026 年 2 月 17 日
苹果突然官宣线下体验会:三城3月4日同步举行

苹果突然官宣线下体验会:三城 3 月 4 日同步举行

2026 年 2 月 17 日
苹果突然官宣线下体验会:三城3月4日同步举行

苹果突然官宣线下体验会:三城 3 月 4 日同步举行

2026 年 2 月 17 日
热搜爆了!机器人「扎堆」上春晚,表演翻跟头、「伸头」绝技、蔡明时隔多年又和机器人联动了

热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了

2026 年 2 月 17 日
热搜爆了!机器人「扎堆」上春晚,表演翻跟头、「伸头」绝技、蔡明时隔多年又和机器人联动了

热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了

2026 年 2 月 17 日
蔡明时隔30年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

蔡明时隔 30 年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

2026 年 2 月 17 日
「晨间经济」首次写入政府工作报告 成都在消费创新上「有点意思」丨成都投资智能体

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日
「晨间经济」首次写入政府工作报告 成都在消费创新上「有点意思」丨成都投资智能体

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日

「晨间经济」 首次写入政府工作报告 成都在消费创新上 「有点意思」 丨成都投资智能体

2026 年 2 月 17 日
金桂财经

2026 年 2 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
232425262728  
« 1 月    

近期动态

  • 威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手
  • 威慑+备战!美军中东大规模增兵,为美伊核谈失败留后手
  • 苹果突然官宣线下体验会:三城 3 月 4 日同步举行
  • 苹果突然官宣线下体验会:三城 3 月 4 日同步举行
  • 热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了
  • 热搜爆了!机器人 「扎堆」 上春晚,表演翻跟头、「伸头」 绝技、蔡明时隔多年又和机器人联动了
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }