• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
答不上来「9.9和9.11谁大」, 周鸿祎解释大模型为什么不识数

答不上来 「9.9 和 9.11 谁大」, 周鸿祎解释大模型为什么不识数

2024 年 7 月 18 日
私募也加大配置ETF 高频重仓ETF浮出水面

私募也加大配置 ETF 高频重仓 ETF 浮出水面

2025 年 9 月 9 日
中国铁路10月1日起全面推行电子发票 不再提供纸质报销凭证

中国铁路 10 月 1 日起全面推行电子发票 不再提供纸质报销凭证

2025 年 9 月 9 日

上诉法院维持原判 特朗普需赔偿作家卡罗尔 8330 万美元

2025 年 9 月 9 日
广告

金融衍生品交易规模大增!期货市场最新数据来了

2025 年 9 月 9 日

Meta 重金挖 AI 天才,AI 泡沫卷土重来?

2025 年 9 月 9 日
港股1630 | 发生了什么?知名公司尾盘狂飙40%

港股 1630 | 发生了什么?知名公司尾盘狂飙 40%

2025 年 9 月 9 日

美联储降息 「箭在弦上」 全球大类资产将迎来价值重构

2025 年 9 月 9 日
创业板指下跌1.77% 全市场超4000股走低 贵金属、珠宝首饰走强

创业板指下跌 1.77% 全市场超 4000 股走低 贵金属、珠宝首饰走强

2025 年 9 月 9 日
难怪金价涨势不停!美国就业市场信心崩塌:劳动者陷入「抱住工作不放」的恐惧!

难怪金价涨势不停!美国就业市场信心崩塌:劳动者陷入 「抱住工作不放」 的恐惧!

2025 年 9 月 9 日
跨境支付,上演牌照暗战

跨境支付,上演牌照暗战

2025 年 9 月 9 日

商业航天进入 「快车道」,军工板块企稳回升,航空航天 ETF(159227) 连续 7 日净流入

2025 年 9 月 9 日

米莱政党选举失利 阿根廷市场遭遇股债汇三杀

2025 年 9 月 9 日
金桂财经
广告
2025 年 9 月 9 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

答不上来 「9.9 和 9.11 谁大」, 周鸿祎解释大模型为什么不识数

来自 金桂财经
2024 年 7 月 18 日
在 科技
0


【TechWeb】7 月 18 日消息,这两天又一件事吵得沸沸扬扬:包括 ChatGPT 4o、谷歌 Gemini Advanced、Claude 3.5 Sonnet 在内的很多 SOTA 大模型王者在回答 「9.9 和 9.11 谁更大」 的问题时纷纷翻车。这让大家大跌眼镜,人工智能还是人工智障的说法再次卷土重来。

YOU MAY ALSO LIKE

中国铁路 10 月 1 日起全面推行电子发票 不再提供纸质报销凭证

微信鸿蒙版功能再升级:从锁屏接听 到视频号进度条全面优化

360 创始人周鸿祎对该热门话题也发表了自己的观点,他认为:「不要低估大模型未来发展的潜力,但是不要高估大模型现在的实力 「,」 不要因为这个事就对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。」

同时,周鸿祎还解释了大模型为什么不识数、并给出了解决大模型不识数问题的解决方案。

大模型为什么不识数?

周鸿祎认为,大模型现在还是有很多的缺点,不认识 「9.11 和 9.9 谁大」,就是一个典型的例子。

「看了几个大模型输出的答案,差不多都在胡言乱语,为什么呢?」 周鸿祎简单解释了为什么大模型会认为 9.1 比 9.9 大。

他认为:第一个问题:「其实大模型的全称叫大语言模型,它首先解决的是对人类自然语言理解的问题。所以大模型把 9.9 和 9.11 并没有当成一个数字来看,而是把它们分成了两个 token。没有经过专门特别的提示和训练,大模型是不懂阿拉伯数字,也不懂数学,所以大模型是按照一个文字的逻辑来进行对比。所以 9 前面是一样大的,那么 11 比 9 要大,所以就得出来 9.11 比 9.9 要大。」

周鸿祎还举了个例子:这就好比你小时候上私塾只学了四书五经,一点数学算数都没学。那出一个这样的小数题你当然就不会了。

第二个问题就是对提示词的依赖。也就是说你跟人工智能提要求的时候,如果都是聊天机器人的界面,你的说法不一样,那大模型的反应是不一样的。就好像一个问题换了种问法,有时候大模型就很聪明,有时候大模型就很笨。这恰恰说明了通过自然语言跟大模型来交流交互,在有些情况下是一种非常不靠谱的方式。比如也有人说换一种问法大模型就会了,比如说把 9.9 和 9.11 放在前面,再问谁大谁小,而不是先问谁大谁小,然后把 9.11 和 9.9 放在后面。

怎么解决大模型不识数的问题?

「这也恰恰说明了光靠大模型是解决不了企业政府的很多实际的工作和生产上的问题,需要和其他技术相结合 「,周鸿祎认为,其实解决这个问题也很简单,有三种做法。

第一种方法,就是要教会大模型数学,就要把很多数学知识进行专门的训练。就像我们小学上了语文之后,还要学算数一样。有了这样专门的训这样的专业模型,就可以正确的回答这个问题。

第二个解决问题的方法,是像 360AI 搜索一样,就利用搜索和知识推理相结合。


 
 

周鸿祎称,刚才试看了一下 360 大模型的回答,实际上也是不准确的。但是跟 360AI 搜索结合在一起,通过全网搜索类似的答案,再加上大模型的理解,相当于是现找答案,然后现教大模型,那么答案就是对的。这也就是搜索增强或者知识对齐。

第三种方法实际上调用 API。比如说如果大模型能够识别这是一个数学题,但是它不会解。没关系,利用函数调用的方式去调比如说一个数学网站的 API,比如说有很多类似的这种数学网站,可以准确的告诉你 9.9 和 9.11 谁大谁小。

还有一种最简单的做法,为什么大模型现在都要学编程呢?因为编程就好比是大模型给了一个计算器,那你出了一道数学题,虽然我不会回答,但是如果我手上有个计算器,那我就能回答。所以有了大模型会懂得调 pythons 语言,用 pythons 来写一个程序,让 pythons 来比一下 9.11 和 9.9 谁大。当然了,编程的程序结果如果是对的那也会得出正确的答案。

最后,周鸿祎给出了三点总结:

第一,大模型对自然语言的理解是它的基础。很多数学物理化学的这些专业知识他并不了解,这个很正常。大家不要惊讶,要学习这些知识还需要专业的模型训练。

第二,利用搜索可以把人类拥有的解题的经验和知识的推理相结合,实际上是一种可以单独用大模型更有效的一种方法。

第三,大模型作为一个聊天机器人,实际上直接在业务和工作上直接用是不现实的,一定需要给他增加各种能力的补强。比如说它能调用其他的工具,能自己编程序来算。实际上人类也是这样,如果给了人类一个很复杂的一堆数据,让人类凭着自己的头脑去总结数据的规律,人类也往往回答不正确。但是人类如果会编程序,或者手边有一个什么计算软件,那么用这个计算软件和工具就可以帮助人类得到正确的答案。所以大模型也需要外部工具的帮助。

」 所以不要因为这个事儿对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。人今天之所以能做很多工作,人本身是得到了很多第三方工具的帮助,包括计算机,包括计算器。「周鸿祎强调,」 希望不要因为这个事儿丧失你对人工智能的信心。「
 



Search

没有结果
查看所有结果

一周热门

私募也加大配置ETF 高频重仓ETF浮出水面

私募也加大配置 ETF 高频重仓 ETF 浮出水面

2025 年 9 月 9 日
中国铁路10月1日起全面推行电子发票 不再提供纸质报销凭证

中国铁路 10 月 1 日起全面推行电子发票 不再提供纸质报销凭证

2025 年 9 月 9 日

上诉法院维持原判 特朗普需赔偿作家卡罗尔 8330 万美元

2025 年 9 月 9 日

金融衍生品交易规模大增!期货市场最新数据来了

2025 年 9 月 9 日

Meta 重金挖 AI 天才,AI 泡沫卷土重来?

2025 年 9 月 9 日
港股1630 | 发生了什么?知名公司尾盘狂飙40%

港股 1630 | 发生了什么?知名公司尾盘狂飙 40%

2025 年 9 月 9 日

美联储降息 「箭在弦上」 全球大类资产将迎来价值重构

2025 年 9 月 9 日
创业板指下跌1.77% 全市场超4000股走低 贵金属、珠宝首饰走强

创业板指下跌 1.77% 全市场超 4000 股走低 贵金属、珠宝首饰走强

2025 年 9 月 9 日
难怪金价涨势不停!美国就业市场信心崩塌:劳动者陷入「抱住工作不放」的恐惧!

难怪金价涨势不停!美国就业市场信心崩塌:劳动者陷入 「抱住工作不放」 的恐惧!

2025 年 9 月 9 日
跨境支付,上演牌照暗战

跨境支付,上演牌照暗战

2025 年 9 月 9 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 私募也加大配置 ETF 高频重仓 ETF 浮出水面
  • 中国铁路 10 月 1 日起全面推行电子发票 不再提供纸质报销凭证
  • 上诉法院维持原判 特朗普需赔偿作家卡罗尔 8330 万美元
  • 金融衍生品交易规模大增!期货市场最新数据来了
  • Meta 重金挖 AI 天才,AI 泡沫卷土重来?
  • 港股 1630 | 发生了什么?知名公司尾盘狂飙 40%
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }