• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
「9.11和9.9谁大」难倒了国外三大旗舰模型,国内模型表现如何?

「9.11 和 9.9 谁大」 难倒了国外三大旗舰模型,国内模型表现如何?

2024 年 7 月 17 日
华尔街经典估值指标预警:美股10年负回报魔咒或再次显现!

华尔街经典估值指标预警:美股 10 年负回报魔咒或再次显现!

2025 年 11 月 6 日
机构关注风格切换 53只大盘价值股或被低估

机构关注风格切换 53 只大盘价值股或被低估

2025 年 11 月 6 日
欧盟最新报告,事关乌克兰入盟!俄乌激烈争夺,佩斯科夫称目前未向美方提供最新战场局势图,红军城战事为何持续胶着?

欧盟最新报告,事关乌克兰入盟!俄乌激烈争夺,佩斯科夫称目前未向美方提供最新战场局势图,红军城战事为何持续胶着?

2025 年 11 月 6 日
广告

从展品到商品 寻找全球大宗贸易的 「守护者」

2025 年 11 月 6 日
新华财经晚报:国务院关税税则委员会停止实施对原产于美国的部分进口商品加征关税措施

新华财经晚报:国务院关税税则委员会停止实施对原产于美国的部分进口商品加征关税措施

2025 年 11 月 6 日
美联储明晨大概率重启降息 年内将降息几次?

11 月 5 日晚间沪深上市公司重大事项公告最新快递

2025 年 11 月 6 日
美元走强抑制上行空间,黄金维持区间震荡

美元走强抑制上行空间,黄金维持区间震荡

2025 年 11 月 6 日

美国政府 「重开」 曙光初现?两党议员对结束停摆表示乐观

2025 年 11 月 6 日
安吉尔38年重构全屋净饮水市场  以长期主义引领技术、产品、渠道全面升维

安吉尔 38 年重构全屋净饮水市场 以长期主义引领技术、产品、渠道全面升维

2025 年 11 月 6 日

上市公司含 「科」 量进一步提高,关注 A500ETF 易方达 (159361)、科创板 50ETF(588080) 投资机会

2025 年 11 月 6 日

芝商所亚太区董事总经理拉塞尔·贝蒂:中国期货市场应加强与国际的互联互通

2025 年 11 月 6 日
何小鹏:明年目标规模量产高阶人形机器人!Robotaxi也要来了!

何小鹏:明年目标规模量产高阶人形机器人!Robotaxi 也要来了!

2025 年 11 月 6 日
金桂财经
广告
2025 年 11 月 6 日 星期四
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

「9.11 和 9.9 谁大」 难倒了国外三大旗舰模型,国内模型表现如何?

来自 金桂财经
2024 年 7 月 17 日
在 外汇
0


【TechWeb】7 月 17 日消息,一句 「9.11and9.9—which is bigger?」,问倒了国外三大旗舰大模型,同样问题问一遍国产旗舰大模型们,它们反应又如何呢?

YOU MAY ALSO LIKE

全球第四大加密货币发行商估值达到 400 亿美元

拨款法案再次 「闯关」 失败 美政府即将刷新 「停摆」 纪录

近日,海外社交平台 X 上有人曝出了自己在 ChatGPT 4o 上询问 「9.11and9.9—which is bigger?」(9.11 和 9.9 哪个大?) 时,ChatGPT 4o 笃定的回答 「9.11 is bigger than 9.9.」(9.11 比 9.9 大)。能作文、能翻译、能读图……这么厉害的 GPT-4o 大模型居然被绊倒在这么简单的 「比大小」 问题上,这一下把大伙儿给整不会了。

于是,X 上大伙儿都开始各种测试,发现不仅 ChatGPT 4o 不行,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这些 SOTA 模型王者在这题上都翻车了!

这一波风也吹到了国内,网友们就好奇,用国内大模型来解这题,结果会是什么情况呢。

把百度文心一言、阿里通义、腾讯元宝、字节豆包、百川智能百小应、零一万物万知、智谱清言、月之暗面的 Kimi,好未来九章大模型 9 款大模型全拉来答题。

这一波问下了,发现大厂的大模型 C 端产品腾讯元宝、阿里通义、字节豆包、百度文心一言,还有好未来的数学大模型九章都答对了。

但是,几款创业公司的大模型 C 端产品百小应、智谱清言、Kimi、万知都认为 「9.11 大于 9.9」。

在 「9.11 和 9.9 谁大」 这题上 ,国内大厂模型完胜创业公司模型了,也完胜国外三大旗舰模型。

具体看看各家表现:

Kimi 回答翻车

智谱清言回答错误,给出的分析过程逻辑前后不一致。

百小应回答错误。

万知也给出了 「9.11 大于 9.9」 的离谱答案。

九章大模型回答正确,也给出正确的分析过程:

以下,文心一言、通义、元宝、豆包都答对了,并且分析过程正确:



Search

没有结果
查看所有结果

一周热门

华尔街经典估值指标预警:美股10年负回报魔咒或再次显现!

华尔街经典估值指标预警:美股 10 年负回报魔咒或再次显现!

2025 年 11 月 6 日
机构关注风格切换 53只大盘价值股或被低估

机构关注风格切换 53 只大盘价值股或被低估

2025 年 11 月 6 日
欧盟最新报告,事关乌克兰入盟!俄乌激烈争夺,佩斯科夫称目前未向美方提供最新战场局势图,红军城战事为何持续胶着?

欧盟最新报告,事关乌克兰入盟!俄乌激烈争夺,佩斯科夫称目前未向美方提供最新战场局势图,红军城战事为何持续胶着?

2025 年 11 月 6 日

从展品到商品 寻找全球大宗贸易的 「守护者」

2025 年 11 月 6 日
新华财经晚报:国务院关税税则委员会停止实施对原产于美国的部分进口商品加征关税措施

新华财经晚报:国务院关税税则委员会停止实施对原产于美国的部分进口商品加征关税措施

2025 年 11 月 6 日
美联储明晨大概率重启降息 年内将降息几次?

11 月 5 日晚间沪深上市公司重大事项公告最新快递

2025 年 11 月 6 日
美元走强抑制上行空间,黄金维持区间震荡

美元走强抑制上行空间,黄金维持区间震荡

2025 年 11 月 6 日

美国政府 「重开」 曙光初现?两党议员对结束停摆表示乐观

2025 年 11 月 6 日
安吉尔38年重构全屋净饮水市场  以长期主义引领技术、产品、渠道全面升维

安吉尔 38 年重构全屋净饮水市场 以长期主义引领技术、产品、渠道全面升维

2025 年 11 月 6 日

上市公司含 「科」 量进一步提高,关注 A500ETF 易方达 (159361)、科创板 50ETF(588080) 投资机会

2025 年 11 月 6 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 华尔街经典估值指标预警:美股 10 年负回报魔咒或再次显现!
  • 机构关注风格切换 53 只大盘价值股或被低估
  • 欧盟最新报告,事关乌克兰入盟!俄乌激烈争夺,佩斯科夫称目前未向美方提供最新战场局势图,红军城战事为何持续胶着?
  • 从展品到商品 寻找全球大宗贸易的 「守护者」
  • 新华财经晚报:国务院关税税则委员会停止实施对原产于美国的部分进口商品加征关税措施
  • 11 月 5 日晚间沪深上市公司重大事项公告最新快递
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }