【文章来源:金十数据】
AI 播客:换个方式听新闻 下载 mp3
OpenAI 于 2022 年 11 月 30 日推出 ChatGPT,这一事件被视为 AI 军备竞赛的起跑枪,推动了股市上涨,并释放了成千上万亿美元的投资。而如今,三年过去了,OpenAI 能否保持领先地位成为最大的悬念。
当年,ChatGPT 发布仅五天,就吸引了 100 万用户。三年后,最新版本的 ChatGPT 具备实时网络访问、增强推理能力、编程技能以及图像和视频生成能力,已经让最初的功能显得相当原始。今年 9 月,OpenAI 推出了 Sora 视频生成应用,同样在五天内达成 100 万用户。
然而,关于 OpenAI 的讨论热度已不及 ChatGPT 刚亮相时。谷歌和 Anthropic 的竞争模型因技术能力获得好评,而 OpenAI 的财务承诺开始让华尔街担忧。一些技术专家也质疑,大型语言模型是否能实现最前沿的 AI 愿景。
在某些方面,问题依旧存在。纽约大学荣誉教授、著名心理学家加里·马库斯 (Gary Marcus) 表示,他在 2022 年底就提出了 OpenAI 系统的问题,但至今未解决。他指出:「它们会出现 『幻觉』,推理能力也有问题。」
竞争格局方面,马库斯去年 12 月曾预测,如果到 2025 年底没有真正差异化的产品,OpenAI 可能会失去其护城河。他补充道,现在 OpenAI 面临的竞争对手推出了功能大致相当的产品,他指的是谷歌本月初发布的 Gemini 3 AI 模型。
宾夕法尼亚大学工程学院教授 Benjamin Lee 表示,过去几年 AI 领域 「活动如火如荼」,「我们看到大量实验和用户采纳。」Gemini 一度被认为已被放弃,但今年以来积极争夺市场份额。
本月,谷歌最新的 Gemini 3 和 Nano Banana Pro 更新再次令投资者和用户印象深刻。马库斯称:「谷歌曾落后很多,人们几乎已不看好,但其最新模型可以说领先于 GPT-5。」
Gemini 3 在大多数关键 AI 基准测试中优于 GPT-5,而 Anthropic 最新模型 Claude Opus 4.5 在代理编码基准上击败了 GPT-5 和 Gemini 3。Lee 表示,这种技术上的竞争非常健康且令人兴奋,但对 OpenAI 来说,这意味着不能仅靠先发优势。
市场方面,11 月关于 AI 泡沫的担忧升温,引发科技股抛售。OpenAI 因在复杂 AI 融资网络中的核心角色受到审视,公司已签订超过 1.4 万亿美元的 AI 基础设施交易,投资者质疑 AI 实验室如何履行这些承诺。
ChatGPT Pulse、Sora 及网页浏览器等新功能可能帮助业务扩张,但对谷歌而言,AI 盈利并非核心问题,其搜索、云计算、Android 和企业软件业务板块能促进 AI 产品分发和规模化。
谷歌的定制芯片业务也在 AI 竞赛中占优势,TPU 芯片不仅用于训练 Gemini 模型,也支撑搜索和 YouTube 算法。Anthropic 本月表示计划使用多达 100 万个谷歌 TPU 来扩大算力,这也是 OpenAI 面临的挑战,因为 AI 模型越来越大、越来越复杂。
大型语言模型 (LLM) 是否能通向通用 AI(AGI) 仍存疑问。随着聊天机器人竞争加剧,越来越多 AI 研究者质疑 LLM 是否会成为技术未来。毕竟,幻觉和推理漏洞并非 ChatGPT 独有。
华尔街也担心,缺乏完全自动化企业流程能力的聊天机器人,投资回报仍不明朗。LLM 通过预测序列中下一个单词或标记的概率工作,并不真正 「知道」 事实或理解逻辑。
马库斯指出:「它们并未真正抽象出对世界的稳定理解。」 他和其他专家认为,AI 的新前沿是 「世界模型」,即能够在脑内模拟现实世界的 AI。Axelar 联合创始人 Sergey Gorbunov 也认为,世界模型可能比 LLM 更接近通用 AI(AGI)。
与 LLM 不同,世界模型 「能与物理空间互动」,因此可以 「理解一些物理现象,而不仅仅是文本」。例如,它们能帮助提升自动驾驶能力,因为车辆可以预测几秒后其他车辆的行为。
Gorbunov 指出 LLM 存在两大根本限制:依赖已有数据,以及本质上只是概率分布。他称:「从模型数学原理或构建方式看,它们只是可预测的概率分布,根本不存在真正的 AI。」
三年过去,纽约大学斯特恩商学院教授、《与机器思维》 作者 Vasant Dhar 认为,AI 的根本变化在于,它在模拟理解方面更强,因此更易为人接受。Dhar 称,ChatGPT 三年的进步 「令人惊叹」,但其对商业和生活的实际价值仍待观察。
他强调,通用技术如电力和互联网的采用历来需要多年。Dhar 预计未来一年两年,ChatGPT 和 Gemini 将有看似渐进但实际上意义重大的改进,影响用户日常生活。
然而,Gorbunov 表示,世界模型仍远超当前 AI 行业水平。他预计未来几个月,用户通过 AI 驱动的网页浏览器 (如 OpenAI 的 Atlas 和 Perplexity 的 Comet) 与网络的交互将成为竞争焦点,谷歌也将在其中角逐,他认为:
「谁能在用户体验上胜出,就能捕获大量流量。」
【文章来源:金十数据】
AI 播客:换个方式听新闻 下载 mp3
OpenAI 于 2022 年 11 月 30 日推出 ChatGPT,这一事件被视为 AI 军备竞赛的起跑枪,推动了股市上涨,并释放了成千上万亿美元的投资。而如今,三年过去了,OpenAI 能否保持领先地位成为最大的悬念。
当年,ChatGPT 发布仅五天,就吸引了 100 万用户。三年后,最新版本的 ChatGPT 具备实时网络访问、增强推理能力、编程技能以及图像和视频生成能力,已经让最初的功能显得相当原始。今年 9 月,OpenAI 推出了 Sora 视频生成应用,同样在五天内达成 100 万用户。
然而,关于 OpenAI 的讨论热度已不及 ChatGPT 刚亮相时。谷歌和 Anthropic 的竞争模型因技术能力获得好评,而 OpenAI 的财务承诺开始让华尔街担忧。一些技术专家也质疑,大型语言模型是否能实现最前沿的 AI 愿景。
在某些方面,问题依旧存在。纽约大学荣誉教授、著名心理学家加里·马库斯 (Gary Marcus) 表示,他在 2022 年底就提出了 OpenAI 系统的问题,但至今未解决。他指出:「它们会出现 『幻觉』,推理能力也有问题。」
竞争格局方面,马库斯去年 12 月曾预测,如果到 2025 年底没有真正差异化的产品,OpenAI 可能会失去其护城河。他补充道,现在 OpenAI 面临的竞争对手推出了功能大致相当的产品,他指的是谷歌本月初发布的 Gemini 3 AI 模型。
宾夕法尼亚大学工程学院教授 Benjamin Lee 表示,过去几年 AI 领域 「活动如火如荼」,「我们看到大量实验和用户采纳。」Gemini 一度被认为已被放弃,但今年以来积极争夺市场份额。
本月,谷歌最新的 Gemini 3 和 Nano Banana Pro 更新再次令投资者和用户印象深刻。马库斯称:「谷歌曾落后很多,人们几乎已不看好,但其最新模型可以说领先于 GPT-5。」
Gemini 3 在大多数关键 AI 基准测试中优于 GPT-5,而 Anthropic 最新模型 Claude Opus 4.5 在代理编码基准上击败了 GPT-5 和 Gemini 3。Lee 表示,这种技术上的竞争非常健康且令人兴奋,但对 OpenAI 来说,这意味着不能仅靠先发优势。
市场方面,11 月关于 AI 泡沫的担忧升温,引发科技股抛售。OpenAI 因在复杂 AI 融资网络中的核心角色受到审视,公司已签订超过 1.4 万亿美元的 AI 基础设施交易,投资者质疑 AI 实验室如何履行这些承诺。
ChatGPT Pulse、Sora 及网页浏览器等新功能可能帮助业务扩张,但对谷歌而言,AI 盈利并非核心问题,其搜索、云计算、Android 和企业软件业务板块能促进 AI 产品分发和规模化。
谷歌的定制芯片业务也在 AI 竞赛中占优势,TPU 芯片不仅用于训练 Gemini 模型,也支撑搜索和 YouTube 算法。Anthropic 本月表示计划使用多达 100 万个谷歌 TPU 来扩大算力,这也是 OpenAI 面临的挑战,因为 AI 模型越来越大、越来越复杂。
大型语言模型 (LLM) 是否能通向通用 AI(AGI) 仍存疑问。随着聊天机器人竞争加剧,越来越多 AI 研究者质疑 LLM 是否会成为技术未来。毕竟,幻觉和推理漏洞并非 ChatGPT 独有。
华尔街也担心,缺乏完全自动化企业流程能力的聊天机器人,投资回报仍不明朗。LLM 通过预测序列中下一个单词或标记的概率工作,并不真正 「知道」 事实或理解逻辑。
马库斯指出:「它们并未真正抽象出对世界的稳定理解。」 他和其他专家认为,AI 的新前沿是 「世界模型」,即能够在脑内模拟现实世界的 AI。Axelar 联合创始人 Sergey Gorbunov 也认为,世界模型可能比 LLM 更接近通用 AI(AGI)。
与 LLM 不同,世界模型 「能与物理空间互动」,因此可以 「理解一些物理现象,而不仅仅是文本」。例如,它们能帮助提升自动驾驶能力,因为车辆可以预测几秒后其他车辆的行为。
Gorbunov 指出 LLM 存在两大根本限制:依赖已有数据,以及本质上只是概率分布。他称:「从模型数学原理或构建方式看,它们只是可预测的概率分布,根本不存在真正的 AI。」
三年过去,纽约大学斯特恩商学院教授、《与机器思维》 作者 Vasant Dhar 认为,AI 的根本变化在于,它在模拟理解方面更强,因此更易为人接受。Dhar 称,ChatGPT 三年的进步 「令人惊叹」,但其对商业和生活的实际价值仍待观察。
他强调,通用技术如电力和互联网的采用历来需要多年。Dhar 预计未来一年两年,ChatGPT 和 Gemini 将有看似渐进但实际上意义重大的改进,影响用户日常生活。
然而,Gorbunov 表示,世界模型仍远超当前 AI 行业水平。他预计未来几个月,用户通过 AI 驱动的网页浏览器 (如 OpenAI 的 Atlas 和 Perplexity 的 Comet) 与网络的交互将成为竞争焦点,谷歌也将在其中角逐,他认为:
「谁能在用户体验上胜出,就能捕获大量流量。」
【文章来源:金十数据】
AI 播客:换个方式听新闻 下载 mp3
OpenAI 于 2022 年 11 月 30 日推出 ChatGPT,这一事件被视为 AI 军备竞赛的起跑枪,推动了股市上涨,并释放了成千上万亿美元的投资。而如今,三年过去了,OpenAI 能否保持领先地位成为最大的悬念。
当年,ChatGPT 发布仅五天,就吸引了 100 万用户。三年后,最新版本的 ChatGPT 具备实时网络访问、增强推理能力、编程技能以及图像和视频生成能力,已经让最初的功能显得相当原始。今年 9 月,OpenAI 推出了 Sora 视频生成应用,同样在五天内达成 100 万用户。
然而,关于 OpenAI 的讨论热度已不及 ChatGPT 刚亮相时。谷歌和 Anthropic 的竞争模型因技术能力获得好评,而 OpenAI 的财务承诺开始让华尔街担忧。一些技术专家也质疑,大型语言模型是否能实现最前沿的 AI 愿景。
在某些方面,问题依旧存在。纽约大学荣誉教授、著名心理学家加里·马库斯 (Gary Marcus) 表示,他在 2022 年底就提出了 OpenAI 系统的问题,但至今未解决。他指出:「它们会出现 『幻觉』,推理能力也有问题。」
竞争格局方面,马库斯去年 12 月曾预测,如果到 2025 年底没有真正差异化的产品,OpenAI 可能会失去其护城河。他补充道,现在 OpenAI 面临的竞争对手推出了功能大致相当的产品,他指的是谷歌本月初发布的 Gemini 3 AI 模型。
宾夕法尼亚大学工程学院教授 Benjamin Lee 表示,过去几年 AI 领域 「活动如火如荼」,「我们看到大量实验和用户采纳。」Gemini 一度被认为已被放弃,但今年以来积极争夺市场份额。
本月,谷歌最新的 Gemini 3 和 Nano Banana Pro 更新再次令投资者和用户印象深刻。马库斯称:「谷歌曾落后很多,人们几乎已不看好,但其最新模型可以说领先于 GPT-5。」
Gemini 3 在大多数关键 AI 基准测试中优于 GPT-5,而 Anthropic 最新模型 Claude Opus 4.5 在代理编码基准上击败了 GPT-5 和 Gemini 3。Lee 表示,这种技术上的竞争非常健康且令人兴奋,但对 OpenAI 来说,这意味着不能仅靠先发优势。
市场方面,11 月关于 AI 泡沫的担忧升温,引发科技股抛售。OpenAI 因在复杂 AI 融资网络中的核心角色受到审视,公司已签订超过 1.4 万亿美元的 AI 基础设施交易,投资者质疑 AI 实验室如何履行这些承诺。
ChatGPT Pulse、Sora 及网页浏览器等新功能可能帮助业务扩张,但对谷歌而言,AI 盈利并非核心问题,其搜索、云计算、Android 和企业软件业务板块能促进 AI 产品分发和规模化。
谷歌的定制芯片业务也在 AI 竞赛中占优势,TPU 芯片不仅用于训练 Gemini 模型,也支撑搜索和 YouTube 算法。Anthropic 本月表示计划使用多达 100 万个谷歌 TPU 来扩大算力,这也是 OpenAI 面临的挑战,因为 AI 模型越来越大、越来越复杂。
大型语言模型 (LLM) 是否能通向通用 AI(AGI) 仍存疑问。随着聊天机器人竞争加剧,越来越多 AI 研究者质疑 LLM 是否会成为技术未来。毕竟,幻觉和推理漏洞并非 ChatGPT 独有。
华尔街也担心,缺乏完全自动化企业流程能力的聊天机器人,投资回报仍不明朗。LLM 通过预测序列中下一个单词或标记的概率工作,并不真正 「知道」 事实或理解逻辑。
马库斯指出:「它们并未真正抽象出对世界的稳定理解。」 他和其他专家认为,AI 的新前沿是 「世界模型」,即能够在脑内模拟现实世界的 AI。Axelar 联合创始人 Sergey Gorbunov 也认为,世界模型可能比 LLM 更接近通用 AI(AGI)。
与 LLM 不同,世界模型 「能与物理空间互动」,因此可以 「理解一些物理现象,而不仅仅是文本」。例如,它们能帮助提升自动驾驶能力,因为车辆可以预测几秒后其他车辆的行为。
Gorbunov 指出 LLM 存在两大根本限制:依赖已有数据,以及本质上只是概率分布。他称:「从模型数学原理或构建方式看,它们只是可预测的概率分布,根本不存在真正的 AI。」
三年过去,纽约大学斯特恩商学院教授、《与机器思维》 作者 Vasant Dhar 认为,AI 的根本变化在于,它在模拟理解方面更强,因此更易为人接受。Dhar 称,ChatGPT 三年的进步 「令人惊叹」,但其对商业和生活的实际价值仍待观察。
他强调,通用技术如电力和互联网的采用历来需要多年。Dhar 预计未来一年两年,ChatGPT 和 Gemini 将有看似渐进但实际上意义重大的改进,影响用户日常生活。
然而,Gorbunov 表示,世界模型仍远超当前 AI 行业水平。他预计未来几个月,用户通过 AI 驱动的网页浏览器 (如 OpenAI 的 Atlas 和 Perplexity 的 Comet) 与网络的交互将成为竞争焦点,谷歌也将在其中角逐,他认为:
「谁能在用户体验上胜出,就能捕获大量流量。」
【文章来源:金十数据】
AI 播客:换个方式听新闻 下载 mp3
OpenAI 于 2022 年 11 月 30 日推出 ChatGPT,这一事件被视为 AI 军备竞赛的起跑枪,推动了股市上涨,并释放了成千上万亿美元的投资。而如今,三年过去了,OpenAI 能否保持领先地位成为最大的悬念。
当年,ChatGPT 发布仅五天,就吸引了 100 万用户。三年后,最新版本的 ChatGPT 具备实时网络访问、增强推理能力、编程技能以及图像和视频生成能力,已经让最初的功能显得相当原始。今年 9 月,OpenAI 推出了 Sora 视频生成应用,同样在五天内达成 100 万用户。
然而,关于 OpenAI 的讨论热度已不及 ChatGPT 刚亮相时。谷歌和 Anthropic 的竞争模型因技术能力获得好评,而 OpenAI 的财务承诺开始让华尔街担忧。一些技术专家也质疑,大型语言模型是否能实现最前沿的 AI 愿景。
在某些方面,问题依旧存在。纽约大学荣誉教授、著名心理学家加里·马库斯 (Gary Marcus) 表示,他在 2022 年底就提出了 OpenAI 系统的问题,但至今未解决。他指出:「它们会出现 『幻觉』,推理能力也有问题。」
竞争格局方面,马库斯去年 12 月曾预测,如果到 2025 年底没有真正差异化的产品,OpenAI 可能会失去其护城河。他补充道,现在 OpenAI 面临的竞争对手推出了功能大致相当的产品,他指的是谷歌本月初发布的 Gemini 3 AI 模型。
宾夕法尼亚大学工程学院教授 Benjamin Lee 表示,过去几年 AI 领域 「活动如火如荼」,「我们看到大量实验和用户采纳。」Gemini 一度被认为已被放弃,但今年以来积极争夺市场份额。
本月,谷歌最新的 Gemini 3 和 Nano Banana Pro 更新再次令投资者和用户印象深刻。马库斯称:「谷歌曾落后很多,人们几乎已不看好,但其最新模型可以说领先于 GPT-5。」
Gemini 3 在大多数关键 AI 基准测试中优于 GPT-5,而 Anthropic 最新模型 Claude Opus 4.5 在代理编码基准上击败了 GPT-5 和 Gemini 3。Lee 表示,这种技术上的竞争非常健康且令人兴奋,但对 OpenAI 来说,这意味着不能仅靠先发优势。
市场方面,11 月关于 AI 泡沫的担忧升温,引发科技股抛售。OpenAI 因在复杂 AI 融资网络中的核心角色受到审视,公司已签订超过 1.4 万亿美元的 AI 基础设施交易,投资者质疑 AI 实验室如何履行这些承诺。
ChatGPT Pulse、Sora 及网页浏览器等新功能可能帮助业务扩张,但对谷歌而言,AI 盈利并非核心问题,其搜索、云计算、Android 和企业软件业务板块能促进 AI 产品分发和规模化。
谷歌的定制芯片业务也在 AI 竞赛中占优势,TPU 芯片不仅用于训练 Gemini 模型,也支撑搜索和 YouTube 算法。Anthropic 本月表示计划使用多达 100 万个谷歌 TPU 来扩大算力,这也是 OpenAI 面临的挑战,因为 AI 模型越来越大、越来越复杂。
大型语言模型 (LLM) 是否能通向通用 AI(AGI) 仍存疑问。随着聊天机器人竞争加剧,越来越多 AI 研究者质疑 LLM 是否会成为技术未来。毕竟,幻觉和推理漏洞并非 ChatGPT 独有。
华尔街也担心,缺乏完全自动化企业流程能力的聊天机器人,投资回报仍不明朗。LLM 通过预测序列中下一个单词或标记的概率工作,并不真正 「知道」 事实或理解逻辑。
马库斯指出:「它们并未真正抽象出对世界的稳定理解。」 他和其他专家认为,AI 的新前沿是 「世界模型」,即能够在脑内模拟现实世界的 AI。Axelar 联合创始人 Sergey Gorbunov 也认为,世界模型可能比 LLM 更接近通用 AI(AGI)。
与 LLM 不同,世界模型 「能与物理空间互动」,因此可以 「理解一些物理现象,而不仅仅是文本」。例如,它们能帮助提升自动驾驶能力,因为车辆可以预测几秒后其他车辆的行为。
Gorbunov 指出 LLM 存在两大根本限制:依赖已有数据,以及本质上只是概率分布。他称:「从模型数学原理或构建方式看,它们只是可预测的概率分布,根本不存在真正的 AI。」
三年过去,纽约大学斯特恩商学院教授、《与机器思维》 作者 Vasant Dhar 认为,AI 的根本变化在于,它在模拟理解方面更强,因此更易为人接受。Dhar 称,ChatGPT 三年的进步 「令人惊叹」,但其对商业和生活的实际价值仍待观察。
他强调,通用技术如电力和互联网的采用历来需要多年。Dhar 预计未来一年两年,ChatGPT 和 Gemini 将有看似渐进但实际上意义重大的改进,影响用户日常生活。
然而,Gorbunov 表示,世界模型仍远超当前 AI 行业水平。他预计未来几个月,用户通过 AI 驱动的网页浏览器 (如 OpenAI 的 Atlas 和 Perplexity 的 Comet) 与网络的交互将成为竞争焦点,谷歌也将在其中角逐,他认为:
「谁能在用户体验上胜出,就能捕获大量流量。」