• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
「稳增长」与「防风险」并重 央行明确下半年七方面工作重点

实测 GPT-5:写作 「AI 味」 浓 代码 「美而无用」 OpenAI 为何急于打响价格战

2025 年 8 月 10 日
「租金从高点降了近三分之一」「出租4年,最后只赚了个装修钱」……上海房东们的心态变了

为骗巨额保金推妻坠海,李某被执行死刑!他 211 名校毕业,在上海开餐馆,妻子系餐馆服务员,检方披露细节:「零口供」 定罪

2025 年 11 月 5 日

18 只银行主题被动基金,今天领涨全市场

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

追平史上最长 「停摆」 纪录后 美国联邦政府本周离重启越来越近了?

2025 年 11 月 5 日
广告

为期货做市交易业务健康发展奠定制度基础

2025 年 11 月 5 日
周末重磅!财政部出资5000亿元,四大银行融资方案公布

ST 岭南涉嫌串通投标罪被起诉;药易购收到税务事项通知书,需补缴企业所得税及滞纳金约 645.11 万元|公告精选

2025 年 11 月 5 日

美联储鹰鸽激辩!12 月降息悬念升级,官员们到底在吵什么?

2025 年 11 月 5 日
【环球财经】美国关键通胀数据因政府「停摆」推迟发布

【环球财经】 美联邦政府 「停摆」 时间平历史纪录 大量家庭陷多重困境

2025 年 11 月 5 日
A股三大指数收跌 创业板指跌近2% 银行股逆市走强

A 股三大指数收跌 创业板指跌近 2% 银行股逆市走强

2025 年 11 月 5 日

上期所、上期能源修订国债作为保证金业务指引

2025 年 11 月 5 日
美元坚挺、美联储前景谨慎,黄金持续承压

美元坚挺、美联储前景谨慎,黄金持续承压

2025 年 11 月 5 日
粤港澳大湾区全球招商大会在广州举办;香港数码竞争力排名升至全球第四丨大湾区财经早参

粤港澳大湾区全球招商大会在广州举办;香港数码竞争力排名升至全球第四丨大湾区财经早参

2025 年 11 月 5 日
【风口研报】微软直言电力短缺成算力新瓶颈   电网设备或迎内外需景气共振

【风口研报】 微软直言电力短缺成算力新瓶颈 电网设备或迎内外需景气共振

2025 年 11 月 5 日
金桂财经
广告
2025 年 11 月 5 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

实测 GPT-5:写作 「AI 味」 浓 代码 「美而无用」 OpenAI 为何急于打响价格战

来自 金桂财经
2025 年 8 月 10 日
在 24 小时
0

  在经历了无数次 「跳票」 后,市场翘首以盼的 GPT-5 终于登场,但迎接它的并非预想中的热烈掌声。

  《每日经济新闻》 记者 (以下简称 「每经记者」) 第一时间进行实测后发现,被寄予厚望的 GPT-5,其输出的文章 「AI 味」 似乎比以往更重了。与此同时,全球用户与行业专家的反馈也颇为尖锐:GPT-5 的写作能力被指出现 「倒退」,编写的代码被讽刺为 「美而无用」,甚至在被誉为通用人工智能(AGI) 终极测试的 Arc Prize 中,惨遭竞争对手马斯克旗下 Grok 4 的 「碾压」。

  然而,在这场略显平淡甚至令人失望的技术发布背后,一个更清晰的战略转向正在浮现:OpenAI 似乎不再痴迷于单纯的技术迭代本身,而是将目光更多地投向了公司的生存与商业扩张。

  在技术边际收益锐减、运营成本高企、核心人才流失等多重隐忧的夹缝之中,OpenAI 为 GPT-5 制定了向普通用户免费开放和远低于竞争对手的 API 定价策略。这表明,GPT-5 的角色,已不再是那个惊艳世人的 「技术奇迹」,而是 OpenAI 冲击 5000 亿美元估值、全力争夺 B 端 (企业) 与 G 端 (政府) 市场的关键商业筹码。

  「博士级专家」 的尴尬——「AI 味」 的文章与 「美而无用」 的代码

  在 8 月 7 日的发布会上,OpenAI 的 CEO 山姆·阿尔特曼曾用三个生动的身份,类比了公司三代旗舰模型的演进:GPT-3 像是偶有灵光闪现但常伴挫败感的高中生;GPT-4 则如同具备了真实智慧与实用价值的大学生;而最新的 GPT-5,则被誉为可以按需召唤的 「博士级专家」,能够随时助力用户达成各种复杂目标。

  OpenAI 声称,GPT-5 在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近 70% 的场景表现更优。此外,GPT-5 还与现有的 o 系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5 在代码生成和写作领域的准确率均高于 GPT-4 系列,部分内部测试中的错误率甚至下降了约 80%。

  为了减少备受诟病的 「幻觉」 问题,GPT-5 还引入了更严格的事实核查与内容过滤机制。具体来看,在联网搜索时,GPT-5 的事实错误概率比 GPT-4o 低约 45%;独立思考时,出错概率比 o3 模型低约 80%;在开放式事实性基准测试中,产生 「幻觉」 的数量更是比 o3 模型少了约六分之五。

  OpenAI 在发布会上特别强调了 GPT-5 在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。

  首先,在写作能力上,尽管 OpenAI 声称 GPT-5 的文笔更具 「人味儿」,但有用户在体验后直言,其写作能力甚至 「退化到和 GPT-3.5 差不多」。每经记者也要求 GPT-5 就本场发布会撰写一篇新闻报道,最直观的感受是:其输出的文章逻辑清晰,但遣词造句的模式化痕迹明显,「AI 味」 比以前更重了。

  其次,在编程方面,GPT-5 的优势也并不突出。在改进版的编程能力评估基准 SWE-bench Verified 测试中,GPT-5 并未与竞争对手 Anthropic 公司的 Claude 4.1 Opus 拉开显著差距。尽管 OpenAI 在发布会上展示了令人惊艳的编程演示,但在实际应用中的效果却备受质疑。

  Meta 公司的一位工程师体验 GPT-5 后在社交媒体上感叹道:「GPT-5 仅用一次调用就重构了我的整个代码库:25 个工具调用,3000 多行新代码,12 个全新的文件。」 但他随即话锋一转:「然而,这些代码都无效 (无法正常工作),虽然确实写得很漂亮。」

  另一位研究人员在经过一系列项目代码测试后,甚至给出了一个颠覆性的结论,他认为目前主流大模型的代码编写能力排名应该是:Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking。

  从第三方的基准测试数据来看,GPT-5 相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据 Artificial Analysis 的综合排名,GPT-5 目前虽然位列第一,但其综合得分仅比自家的老模型 o3 高出两分,比 Grok 4 仅高出一分。而在被誉为 AGI 终极测试的 Arc Prize 竞赛中,GPT-5 更是被 Grok 4 大幅超越。

  「GPT-5 不太可能 『超越一切预期』,因为大模型的边际收益正在迅速递减。」AI 营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出,「我们今天所看到的所谓 『进步』,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。」

  他认为,AI 的发展正面临两大物理限制:「我们必须清醒地认识到,『数据墙』 是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种 『大力出奇迹』 的暴力美学难以为继。」

  当技术光环褪色——OpenAI 被迫打响 「价格战」

  在 GPT-5 的技术表现未能完全征服市场的同时,OpenAI 为其制定的商业策略,却显露出了前所未有的 「杀气」。

  目前,无论是 Plus、Pro、团队版还是免费用户,均已陆续接入 GPT-5。对于广大的开发者和企业 API 用户,GPT-5 的定价策略极具竞争力:其标准版 API 的定价为每百万 token 输入 1.25 美元,输出 10 美元,这不仅低于上一代的 GPT-4o,更远低于其主要竞争对手 Claude Opus 4.1 和 Gemini 2.5 Pro。而其轻量级的 GPT-5-mini 版和 GPT-5-nano 版的价格则更为低廉。

  OpenAI 的这套定价策略显然直指广阔的 B 端市场:通过极具吸引力的超低 API 价格,将那些正在自研模型或使用竞争对手服务的企业客户,直接 「挖」 到自己的生态中来。在 GPT-5 发布会的后半场,OpenAI 也一反常态,将重点放在了分享企业应用案例上,详细展示了其模型如何帮助企业构建各种应用,并专门推出了服务于企业的 GPT-5-chat 模型。

  「OpenAI 面临着巨大的降价压力,主动降价是深思熟虑后的市场分层策略,旨在应对日益激烈的开源模型竞争。」 唐兴通向每经记者指出,「在技术上越来越难以 『一步登天』 的背景下,商业上的 『遍地开花』 才是当务之急。AI 的下半场,胜利将不再属于那个模型参数最高的玩家,而是将属于那个能率先为顶尖技术找到 『杀手级应用』 的玩家。」

  GPT-5 的目标,已不再是通过炫技来获得市场的掌声,而是要精准地瞄准企业客户口袋里的真金白银。GPT-5 并非一个颠覆性的代际跨越模型,而是 OpenAI 准备投入到残酷商业肉搏战中的关键筹码。

  IT 研究公司 Gartner 的分析师阿伦·钱德拉塞卡兰也认为,GPT-5 仍然只是一种 「渐进式优化」,而非颠覆性的、跨越式的提升。唐兴通则表示,GPT-5 的 「渐进式改进」,短期内可能会刺破资本市场的幻想泡沫,估值会承压,但对于其中长期的商业化进程,甚至可能是件好事。「关键已经不在于技术本身有多么性感,而在于如何将已经足够强大的技术,转化为能够解决现实世界问题的可靠产品。」

  「OpenAI 需要加速从一个伟大的实验室,进化为一个强大的商业帝国。」 唐兴通总结道。

  C 端增长见顶?——OpenAI 的 5000 亿美元估值野望

  GPT-5 的发布,或许还与 OpenAI 近期的资本运作密切相关。

  据媒体 8 月 7 日报道,OpenAI 正在与现有投资者展开初步谈判,商讨一次员工持有的股权出售事宜。如果这笔交易能够达成,OpenAI 的估值预计将从目前的 3000 亿美元,一举跃升至 5000 亿美元,这将超过埃隆·马斯克旗下 SpaceX 的 3500 亿美元,使其成为全球最具价值的未上市 AI 公司。

  唐兴通向每经记者指出,5000 亿美元的估值,反映的并非 OpenAI 当前的市场价值,而是资本市场对其在 AGI 时代的一种 「期权定价」。「支撑这个估值的核心逻辑是:谁掌握了通向 AGI 的最短路径,谁就拥有了重新定义整个世界的权力。」

  然而,现实的财务压力依然严峻。有媒体预计 OpenAI 今年的收入将达到 120 亿美元,但其居高不下的运营成本依旧是困扰其发展的一大难题。有分析指出,OpenAI 每创造 1 美元的收入,可能将伴随着 2.25 美元的成本。据此粗略估计,该公司今年的运营支出预计将超过 280 亿美元,这些支出主要与其使用的微软云计算服务、正在建设的 「星际之门」 数据中心项目,以及与算力提供商 CoreWeave 签订的 129 亿美元五年期协议有关。除了财务压力,OpenAI 还面临着核心人才流失的挑战,近期多名 AI 关键研究员的离职,可能在一定程度上削弱其技术领先优势,并增加其人力成本。

  「在 AI 这条赛道上,现金流为负并不是问题,失去技术领先地位才是真正的灾难。」 唐兴通认为,「当前的巨额投入,都是在为未来的潜在垄断地位买单。」 不过,他也指出,持续的融资可以暂时解决资金问题,但无法从根本上解决其盈利模式的难题。

  目前,OpenAI 的收入增长主要依赖于 ChatGPT 的订阅业务,该业务贡献了公司总收入的约 70%。最新数据显示,ChatGPT 每周约有 7 亿活跃用户。但在唐兴通看来,7 亿用户既是 OpenAI 的 「荣耀勋章」,在某种程度上也代表着其 「增长的边界」。

  「ChatGPT 的 C 端增长确实已接近饱和,但 OpenAI 真正的野心,在于广阔的 B 端 (企业) 和 G 端 (政府) 市场。」 他分析道。OpenAI 近期时隔六年再次开源部分模型,正是为了吸引那些对数据主权高度敏感的政企客户,这标志着其战略重心正在从 「消费互联网」 转向 「产业互联网」。

  OpenAI 的团队深知,其以 API 驱动的商业模式,在中低端市场迟早会被更便宜、更灵活的开源模型所侵蚀。与其被动地等待被其他人颠覆,不如主动求变。因此,OpenAI 正在从单纯的 「卖算力」,转向更为复杂的 「卖生态」,试图构建一个立体化的商业架构:开源模型是其吸引广大开发者的流量入口,高端 API 是其主要的利润中心,而企业级服务则是其未来最重要的增长引擎。

  为了快速切入政府市场,OpenAI 在 8 月 6 日宣布,未来一年将以象征性的 1 美元价格,向美国联邦政府机构提供其 ChatGPT Enterprise 产品,让政府雇员可以 「几乎免费」 地使用其最强大的 AI 服务。这种典型的 「供应商锁定 (Vendor Lock-in)」 策略,旨在以极低的成本快速渗透政府和大型机构市场,为未来的长期合作和高价值服务奠定坚实的基础。

  「OpenAI 正站在成为下一个微软的十字路口,」 唐兴通总结道,「其成败的关键,在于它能否在持续的技术突破、创新的商业模式以及严格的风险管控这三者之间,找到那个最佳的平衡点。」

(每日经济新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

追平史上最长 「停摆」 纪录后 美国联邦政府本周离重启越来越近了?

为期货做市交易业务健康发展奠定制度基础

Search

没有结果
查看所有结果

一周热门

「租金从高点降了近三分之一」「出租4年,最后只赚了个装修钱」……上海房东们的心态变了

为骗巨额保金推妻坠海,李某被执行死刑!他 211 名校毕业,在上海开餐馆,妻子系餐馆服务员,检方披露细节:「零口供」 定罪

2025 年 11 月 5 日

18 只银行主题被动基金,今天领涨全市场

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

追平史上最长 「停摆」 纪录后 美国联邦政府本周离重启越来越近了?

2025 年 11 月 5 日

为期货做市交易业务健康发展奠定制度基础

2025 年 11 月 5 日
周末重磅!财政部出资5000亿元,四大银行融资方案公布

ST 岭南涉嫌串通投标罪被起诉;药易购收到税务事项通知书,需补缴企业所得税及滞纳金约 645.11 万元|公告精选

2025 年 11 月 5 日

美联储鹰鸽激辩!12 月降息悬念升级,官员们到底在吵什么?

2025 年 11 月 5 日
【环球财经】美国关键通胀数据因政府「停摆」推迟发布

【环球财经】 美联邦政府 「停摆」 时间平历史纪录 大量家庭陷多重困境

2025 年 11 月 5 日
A股三大指数收跌 创业板指跌近2% 银行股逆市走强

A 股三大指数收跌 创业板指跌近 2% 银行股逆市走强

2025 年 11 月 5 日

上期所、上期能源修订国债作为保证金业务指引

2025 年 11 月 5 日
美元坚挺、美联储前景谨慎,黄金持续承压

美元坚挺、美联储前景谨慎,黄金持续承压

2025 年 11 月 5 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 为骗巨额保金推妻坠海,李某被执行死刑!他 211 名校毕业,在上海开餐馆,妻子系餐馆服务员,检方披露细节:「零口供」 定罪
  • 18 只银行主题被动基金,今天领涨全市场
  • 追平史上最长 「停摆」 纪录后 美国联邦政府本周离重启越来越近了?
  • 为期货做市交易业务健康发展奠定制度基础
  • ST 岭南涉嫌串通投标罪被起诉;药易购收到税务事项通知书,需补缴企业所得税及滞纳金约 645.11 万元|公告精选
  • 美联储鹰鸽激辩!12 月降息悬念升级,官员们到底在吵什么?
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }