• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
「9.11和9.9谁大」难倒了国外三大旗舰模型,国内模型表现如何?

「9.11 和 9.9 谁大」 难倒了国外三大旗舰模型,国内模型表现如何?

2024 年 7 月 17 日

日本央行被曝密切关注日元汇率,1 月或按兵不动但加息紧迫感升温

2026 年 1 月 15 日
【财经分析】沪锡突破44万元/吨创历史新高 下游企业观望情绪浓厚

【财经分析】 沪锡突破 44 万元/吨创历史新高 下游企业观望情绪浓厚

2026 年 1 月 15 日

海南自贸港封关以来,日均 2.4 万人在琼免税购物;携程集团被立案调查丨消费早参

2026 年 1 月 15 日
广告
美股三大指数集体上涨 半导体板块走高 台积电涨超6% 创新高

美股三大指数集体上涨 半导体板块走高 台积电涨超 6% 创新高

2026 年 1 月 15 日

上期所强化锡期货风险管控,分析人士:市场参与者需保持理性

2026 年 1 月 15 日
黄金不动,白银乱跳,谁在操纵贵金属的神经?

黄金不动,白银乱跳,谁在操纵贵金属的神经?

2026 年 1 月 15 日

日本两大在野党决定 「合体」,阻击高市早苗大选胜算!

2026 年 1 月 15 日
美国宣布:加征25% 关税!纳指收跌1%,七巨头「全军覆没」!纽约期银大涨近8% 续创新高,美联储最新发布

美国宣布:加征 25% 关税!纳指收跌 1%,七巨头 「全军覆没」!纽约期银大涨近 8% 续创新高,美联储最新发布

2026 年 1 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

2026 年结构性货币政策工具 「加量降价」 市场预计政策利率存下调空间

2026 年 1 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

助力经济结构转型优化 央行出台 8 项政策举措

2026 年 1 月 15 日

央行将推出八项政策措施

2026 年 1 月 15 日
FileCompare (https://filecompare.org) 让数据差异一目了然!

FileCompare (https://filecompare.org) 让数据差异一目了然!

2026 年 1 月 15 日
金桂财经
广告
2026 年 1 月 15 日 星期四
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

「9.11 和 9.9 谁大」 难倒了国外三大旗舰模型,国内模型表现如何?

来自 金桂财经
2024 年 7 月 17 日
在 外汇
0


【TechWeb】7 月 17 日消息,一句 「9.11and9.9—which is bigger?」,问倒了国外三大旗舰大模型,同样问题问一遍国产旗舰大模型们,它们反应又如何呢?

YOU MAY ALSO LIKE

2026 年结构性货币政策工具 「加量降价」 市场预计政策利率存下调空间

伊朗最高战备!美国向中东调遣航母打击群 特朗普:「先观望局势发展」 不排除动武选项

近日,海外社交平台 X 上有人曝出了自己在 ChatGPT 4o 上询问 「9.11and9.9—which is bigger?」(9.11 和 9.9 哪个大?) 时,ChatGPT 4o 笃定的回答 「9.11 is bigger than 9.9.」(9.11 比 9.9 大)。能作文、能翻译、能读图……这么厉害的 GPT-4o 大模型居然被绊倒在这么简单的 「比大小」 问题上,这一下把大伙儿给整不会了。

于是,X 上大伙儿都开始各种测试,发现不仅 ChatGPT 4o 不行,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这些 SOTA 模型王者在这题上都翻车了!

这一波风也吹到了国内,网友们就好奇,用国内大模型来解这题,结果会是什么情况呢。

把百度文心一言、阿里通义、腾讯元宝、字节豆包、百川智能百小应、零一万物万知、智谱清言、月之暗面的 Kimi,好未来九章大模型 9 款大模型全拉来答题。

这一波问下了,发现大厂的大模型 C 端产品腾讯元宝、阿里通义、字节豆包、百度文心一言,还有好未来的数学大模型九章都答对了。

但是,几款创业公司的大模型 C 端产品百小应、智谱清言、Kimi、万知都认为 「9.11 大于 9.9」。

在 「9.11 和 9.9 谁大」 这题上 ,国内大厂模型完胜创业公司模型了,也完胜国外三大旗舰模型。

具体看看各家表现:

Kimi 回答翻车

智谱清言回答错误,给出的分析过程逻辑前后不一致。

百小应回答错误。

万知也给出了 「9.11 大于 9.9」 的离谱答案。

九章大模型回答正确,也给出正确的分析过程:

以下,文心一言、通义、元宝、豆包都答对了,并且分析过程正确:



Search

没有结果
查看所有结果

一周热门

日本央行被曝密切关注日元汇率,1 月或按兵不动但加息紧迫感升温

2026 年 1 月 15 日
【财经分析】沪锡突破44万元/吨创历史新高 下游企业观望情绪浓厚

【财经分析】 沪锡突破 44 万元/吨创历史新高 下游企业观望情绪浓厚

2026 年 1 月 15 日

海南自贸港封关以来,日均 2.4 万人在琼免税购物;携程集团被立案调查丨消费早参

2026 年 1 月 15 日
美股三大指数集体上涨 半导体板块走高 台积电涨超6% 创新高

美股三大指数集体上涨 半导体板块走高 台积电涨超 6% 创新高

2026 年 1 月 15 日

上期所强化锡期货风险管控,分析人士:市场参与者需保持理性

2026 年 1 月 15 日
黄金不动,白银乱跳,谁在操纵贵金属的神经?

黄金不动,白银乱跳,谁在操纵贵金属的神经?

2026 年 1 月 15 日

日本两大在野党决定 「合体」,阻击高市早苗大选胜算!

2026 年 1 月 15 日
美国宣布:加征25% 关税!纳指收跌1%,七巨头「全军覆没」!纽约期银大涨近8% 续创新高,美联储最新发布

美国宣布:加征 25% 关税!纳指收跌 1%,七巨头 「全军覆没」!纽约期银大涨近 8% 续创新高,美联储最新发布

2026 年 1 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

2026 年结构性货币政策工具 「加量降价」 市场预计政策利率存下调空间

2026 年 1 月 15 日
生猪价格跌至年内新低 行业面临不同程度亏损

助力经济结构转型优化 央行出台 8 项政策举措

2026 年 1 月 15 日
金桂财经

2026 年 1 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 12 月    

近期动态

  • 日本央行被曝密切关注日元汇率,1 月或按兵不动但加息紧迫感升温
  • 【财经分析】 沪锡突破 44 万元/吨创历史新高 下游企业观望情绪浓厚
  • 海南自贸港封关以来,日均 2.4 万人在琼免税购物;携程集团被立案调查丨消费早参
  • 美股三大指数集体上涨 半导体板块走高 台积电涨超 6% 创新高
  • 上期所强化锡期货风险管控,分析人士:市场参与者需保持理性
  • 黄金不动,白银乱跳,谁在操纵贵金属的神经?
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }