• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

2024 年 9 月 13 日

流光溢彩,智算成城——从三季报看通信如何布局?

2025 年 11 月 5 日
贵州茅台:拟以15亿至30亿元回购股份并注销

贵州茅台:拟以 15 亿至 30 亿元回购股份并注销

2025 年 11 月 5 日
李成钢国际贸易谈判代表兼副部长会见美国农产品贸易代表团

李成钢国际贸易谈判代表兼副部长会见美国农产品贸易代表团

2025 年 11 月 5 日
广告
美债曲线博弈「软着陆」,黄金与美元来到新十字路口

美债曲线博弈 「软着陆」,黄金与美元来到新十字路口

2025 年 11 月 5 日
行业ETF风向标丨光伏产业持续火热,电网设备ETF半日涨幅达4.62%

行业 ETF 风向标丨光伏产业持续火热,电网设备 ETF 半日涨幅达 4.62%

2025 年 11 月 5 日

瑞银喊多黄金:回调已暂时平息,乐观目标看向 4700

2025 年 11 月 5 日

每日机构分析:11 月 5 日

2025 年 11 月 5 日

每日机构分析:11 月 5 日

2025 年 11 月 5 日
11月5日东方财富财经晚报(附新闻联播)

11 月 5 日东方财富财经晚报 (附新闻联播)

2025 年 11 月 5 日
商务部:停止实施对原产于美国的进口相关截止波长位移单模光纤的反规避措施

商务部:停止实施对原产于美国的进口相关截止波长位移单模光纤的反规避措施

2025 年 11 月 5 日
低开高走强势反攻,沪指半日上涨0.05%

低开高走强势反攻,沪指半日上涨 0.05%

2025 年 11 月 5 日

沈南鹏对话 TPG、博枫、麦格理:从数据中心到能源变革,另类投资下一站何在?

2025 年 11 月 5 日
金桂财经
广告
2025 年 11 月 5 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

来自 金桂财经
2024 年 9 月 13 日
在 外汇
0


【金桂财经】9 月 13 日消息,据外媒报道,在今年 7 月份,也就是在 OpenAI 推出新一代旗舰大模型 GPT-4o 之后约两个月,国外有用户在社交媒体上爆料称自己在 ChatGPT 4o 上询问 9.11 和 9.9 哪一个大 (9.11and9.9—which is bigger?) 时, ChatGPT 4o 笃定的回答 9.11 比 9.9 大 (9.11 is bigger than 9.9),OpenAI 当时最强模型 GPT-4o 加持下的 ChatGPT 4o,在这一问题上给出如此离奇的回答也让外界震惊不已。 

YOU MAY ALSO LIKE

拨款法案再次 「闯关」 失败 美政府即将刷新 「停摆」 纪录

美国参议院未通过拨款法案 联邦政府 「停摆」 将破纪录

而随后有用户的测试发现,不只是 GPT-4o 加持下的 ChatGPT 4o,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这两款国外知名的大模型在这一问题上也相继翻车,国内也有多家厂商的大模型未能幸免。

除了 9.11 和 9.9,也有相关媒体对其他的数字进行测试,比如 9.11 和 9.8,结果显示也有多家厂商的大模型翻车。

在 OpenAI 当地时间周四推出较以往的模型更注重推理,在奥数、编程竞赛中的表现都远强于 GPT-4o 的 OpenAI o1 系列大模型之后,也有好奇的用户再次对这一问题进行了测试。

但让人意外的是,号称有更强推理能力、数学和编程方面表现出色的 OpenAI o1,也未能避免翻车。

有测试显示,在询问 9.11 和 9.8 谁更大这一问题时,OpenAI o1 预览版在经过 14 秒的思考后,还是给出了 9.11 更大的结果,而给出的原因竟是因为 9.11 比 9.8 大。

就显示的内容来看,OpenAI o1 预览版在比较 9.11 和 9.8 谁更大时,进行了比较数值大小、对比数值大小、对比大小、比较两个数值这 4 个方面的思考,但除了对比数值大小、对比大小是 9.8 大于 9.11,另外两个方面都是 9.11 大于 9.8。不过在对比数值大小这一项中,显示的是 「蒙特认为 9.8 大于 9.11,9.8 显示出数学上的优越性。」(海蓝)



Search

没有结果
查看所有结果

一周热门

流光溢彩,智算成城——从三季报看通信如何布局?

2025 年 11 月 5 日
贵州茅台:拟以15亿至30亿元回购股份并注销

贵州茅台:拟以 15 亿至 30 亿元回购股份并注销

2025 年 11 月 5 日
李成钢国际贸易谈判代表兼副部长会见美国农产品贸易代表团

李成钢国际贸易谈判代表兼副部长会见美国农产品贸易代表团

2025 年 11 月 5 日
美债曲线博弈「软着陆」,黄金与美元来到新十字路口

美债曲线博弈 「软着陆」,黄金与美元来到新十字路口

2025 年 11 月 5 日
行业ETF风向标丨光伏产业持续火热,电网设备ETF半日涨幅达4.62%

行业 ETF 风向标丨光伏产业持续火热,电网设备 ETF 半日涨幅达 4.62%

2025 年 11 月 5 日

瑞银喊多黄金:回调已暂时平息,乐观目标看向 4700

2025 年 11 月 5 日

每日机构分析:11 月 5 日

2025 年 11 月 5 日

每日机构分析:11 月 5 日

2025 年 11 月 5 日
11月5日东方财富财经晚报(附新闻联播)

11 月 5 日东方财富财经晚报 (附新闻联播)

2025 年 11 月 5 日
商务部:停止实施对原产于美国的进口相关截止波长位移单模光纤的反规避措施

商务部:停止实施对原产于美国的进口相关截止波长位移单模光纤的反规避措施

2025 年 11 月 5 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 流光溢彩,智算成城——从三季报看通信如何布局?
  • 贵州茅台:拟以 15 亿至 30 亿元回购股份并注销
  • 李成钢国际贸易谈判代表兼副部长会见美国农产品贸易代表团
  • 美债曲线博弈 「软着陆」,黄金与美元来到新十字路口
  • 行业 ETF 风向标丨光伏产业持续火热,电网设备 ETF 半日涨幅达 4.62%
  • 瑞银喊多黄金:回调已暂时平息,乐观目标看向 4700
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }