• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

2024 年 9 月 13 日
「十四五」时期重点领域、新兴领域有哪些立法措施?司法部:加强无人驾驶、人工智能等新技术新业态法规制度供给

「十四五」 时期重点领域、新兴领域有哪些立法措施?司法部:加强无人驾驶、人工智能等新技术新业态法规制度供给

2025 年 9 月 10 日
投资者押注美联储降息 美债收益率大幅下行!

投资者押注美联储降息 美债收益率大幅下行!

2025 年 9 月 10 日
投资者押注美联储降息 美债收益率大幅下行!

投资者押注美联储降息 美债收益率大幅下行!

2025 年 9 月 10 日
广告
深圳核心资产拍卖或引发退市预警 皇庭国际能否成功「渡劫」?

深圳核心资产拍卖或引发退市预警 皇庭国际能否成功 「渡劫」?

2025 年 9 月 10 日

20cm 速递|2025 全球能源互联网大会今日在京举行,共同推动能源可持续发展

2025 年 9 月 10 日

A 股盘前市场要闻速递 (2025-09-09)

2025 年 9 月 10 日

A 股盘前市场要闻速递 (2025-09-09)

2025 年 9 月 10 日

我国期货市场资金总量突破 1.9 万亿元

2025 年 9 月 10 日

每经热评︱减持以 「让渡市场参与机会」 同花顺董事长真的说错了吗?

2025 年 9 月 10 日
9月9日东方财富财经晚报(附新闻联播)

9 月 9 日东方财富财经晚报 (附新闻联播)

2025 年 9 月 10 日
苹果2025秋季发布会速览:iPhone 17起售价799美元 新款AirPods具备实时翻译功能

苹果 2025 秋季发布会速览:iPhone 17 起售价 799 美元 新款 AirPods 具备实时翻译功能

2025 年 9 月 10 日
美元崩盘至七周低位,黄金屡创历史新高!美联储降息风暴即将来袭?

美元崩盘至七周低位,黄金屡创历史新高!美联储降息风暴即将来袭?

2025 年 9 月 10 日
金桂财经
广告
2025 年 9 月 10 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

来自 金桂财经
2024 年 9 月 13 日
在 外汇
0


【金桂财经】9 月 13 日消息,据外媒报道,在今年 7 月份,也就是在 OpenAI 推出新一代旗舰大模型 GPT-4o 之后约两个月,国外有用户在社交媒体上爆料称自己在 ChatGPT 4o 上询问 9.11 和 9.9 哪一个大 (9.11and9.9—which is bigger?) 时, ChatGPT 4o 笃定的回答 9.11 比 9.9 大 (9.11 is bigger than 9.9),OpenAI 当时最强模型 GPT-4o 加持下的 ChatGPT 4o,在这一问题上给出如此离奇的回答也让外界震惊不已。 

YOU MAY ALSO LIKE

苹果推出 iPhone 17 系列

人民币对美元即期汇率盘中创 10 个月新高 为何走强?后续如何走?

而随后有用户的测试发现,不只是 GPT-4o 加持下的 ChatGPT 4o,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这两款国外知名的大模型在这一问题上也相继翻车,国内也有多家厂商的大模型未能幸免。

除了 9.11 和 9.9,也有相关媒体对其他的数字进行测试,比如 9.11 和 9.8,结果显示也有多家厂商的大模型翻车。

在 OpenAI 当地时间周四推出较以往的模型更注重推理,在奥数、编程竞赛中的表现都远强于 GPT-4o 的 OpenAI o1 系列大模型之后,也有好奇的用户再次对这一问题进行了测试。

但让人意外的是,号称有更强推理能力、数学和编程方面表现出色的 OpenAI o1,也未能避免翻车。

有测试显示,在询问 9.11 和 9.8 谁更大这一问题时,OpenAI o1 预览版在经过 14 秒的思考后,还是给出了 9.11 更大的结果,而给出的原因竟是因为 9.11 比 9.8 大。

就显示的内容来看,OpenAI o1 预览版在比较 9.11 和 9.8 谁更大时,进行了比较数值大小、对比数值大小、对比大小、比较两个数值这 4 个方面的思考,但除了对比数值大小、对比大小是 9.8 大于 9.11,另外两个方面都是 9.11 大于 9.8。不过在对比数值大小这一项中,显示的是 「蒙特认为 9.8 大于 9.11,9.8 显示出数学上的优越性。」(海蓝)



Search

没有结果
查看所有结果

一周热门

「十四五」时期重点领域、新兴领域有哪些立法措施?司法部:加强无人驾驶、人工智能等新技术新业态法规制度供给

「十四五」 时期重点领域、新兴领域有哪些立法措施?司法部:加强无人驾驶、人工智能等新技术新业态法规制度供给

2025 年 9 月 10 日
投资者押注美联储降息 美债收益率大幅下行!

投资者押注美联储降息 美债收益率大幅下行!

2025 年 9 月 10 日
投资者押注美联储降息 美债收益率大幅下行!

投资者押注美联储降息 美债收益率大幅下行!

2025 年 9 月 10 日
深圳核心资产拍卖或引发退市预警 皇庭国际能否成功「渡劫」?

深圳核心资产拍卖或引发退市预警 皇庭国际能否成功 「渡劫」?

2025 年 9 月 10 日

20cm 速递|2025 全球能源互联网大会今日在京举行,共同推动能源可持续发展

2025 年 9 月 10 日

A 股盘前市场要闻速递 (2025-09-09)

2025 年 9 月 10 日

A 股盘前市场要闻速递 (2025-09-09)

2025 年 9 月 10 日

我国期货市场资金总量突破 1.9 万亿元

2025 年 9 月 10 日

每经热评︱减持以 「让渡市场参与机会」 同花顺董事长真的说错了吗?

2025 年 9 月 10 日
9月9日东方财富财经晚报(附新闻联播)

9 月 9 日东方财富财经晚报 (附新闻联播)

2025 年 9 月 10 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 「十四五」 时期重点领域、新兴领域有哪些立法措施?司法部:加强无人驾驶、人工智能等新技术新业态法规制度供给
  • 投资者押注美联储降息 美债收益率大幅下行!
  • 投资者押注美联储降息 美债收益率大幅下行!
  • 深圳核心资产拍卖或引发退市预警 皇庭国际能否成功 「渡劫」?
  • 20cm 速递|2025 全球能源互联网大会今日在京举行,共同推动能源可持续发展
  • A 股盘前市场要闻速递 (2025-09-09)
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }