• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
OpenAI发布最强推理模型o1,公司计划以1.07万亿估值进行新一轮融资|金桂财经AGI

OpenAI 发布最强推理模型 o1,公司计划以 1.07 万亿估值进行新一轮融资|金桂财经 AGI

2024 年 9 月 13 日

银河期货深耕上期所橡胶支农专项项目成效显著

2025 年 11 月 11 日
十四届全国人大常委会第十八次会议10月24日至28日将在京举行

单日延误航班过万!美国政府 「停摆」 加剧空管缺勤 特朗普急了:没请假的 建议每人发 1 万美元奖金

2025 年 11 月 11 日

港股有望稳健前行,恒生科技 ETF 易方达 (513010)、港股通互联网 ETF(513040) 上周合计 「吸金」 超 11 亿元

2025 年 11 月 11 日
广告

西贝回应关店潮:属于正常调整范畴

2025 年 11 月 11 日
美政府「停摆」有望结束?官员表示已有潜在协议;菲律宾全国超百万人撤离;最高法将对「开门杀」等问题作出规定;东航复航「中印航线」丨每经早参

美政府 「停摆」 有望结束?官员表示已有潜在协议;菲律宾全国超百万人撤离;最高法将对 「开门杀」 等问题作出规定;东航复航 「中印航线」 丨每经早参

2025 年 11 月 11 日
重大发现!全球3.3亿人的难题 被中国团队找到关键突破口

重大发现!全球 3.3 亿人的难题 被中国团队找到关键突破口

2025 年 11 月 11 日

定价权逐步提升!南向资金净买入额突破 5 万亿港元 机构:当前港股估值水平仍有吸引力

2025 年 11 月 11 日

参议院迈出关键一步,特朗普点头,美政府停摆或进入倒计时

2025 年 11 月 11 日
十四届全国人大常委会第十八次会议10月24日至28日将在京举行

风险资产普涨!美政府关门闹剧有望落幕 焦点将转向 「数据洪流」?

2025 年 11 月 11 日
Xu —— 为深度思考者打造的新型交流社区

Xu —— 为深度思考者打造的新型交流社区

2025 年 11 月 11 日
黄金交易提醒:避险需求与数据压力的激烈角力,政府停摆第36天,美最高法院给特朗普关税「判死刑」

黄金交易提醒:美国疲软数据加剧经济担忧,金价狂飙近 3% 收复 4100!后市剑指 5000?

2025 年 11 月 11 日
21个跌停板!*ST元成停牌!触及强制退市!

21 个跌停板!*ST 元成停牌!触及强制退市!

2025 年 11 月 11 日
金桂财经
广告
2025 年 11 月 11 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

OpenAI 发布最强推理模型 o1,公司计划以 1.07 万亿估值进行新一轮融资|金桂财经 AGI

来自 金桂财经
2024 年 9 月 13 日
在 24 小时
0

YOU MAY ALSO LIKE

银河期货深耕上期所橡胶支农专项项目成效显著

重大发现!全球 3.3 亿人的难题 被中国团队找到关键突破口


北京时间 9 月 13 日凌晨,美国 OpenAI 公司发布全新模型技术产品 o1,包括两种版本 o1-preview 和 o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。

这就是此前传言中高级推理能力强大模型的 「Strawberry」 项目。也有人分析称,o1 是 Orion 大模型简称。

OpenAI 表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为 1,给它一个有别于 「GPT-4」 系列的全新名号。同时,这也预示着,AI 时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

需要注意的是,o1 目前的聊天体验还比较基础。不同于其前身 GPT-4o,o1 目前无法浏览网页或处理文件分析功能。尽管它具备图像分析功能,但该功能暂时关闭,等待进一步测试。此外,o1 还有消息量限制——目前 o1-preview 每周限额 30 条、o1-mini 每周 50 条。

即日起,o1-preview 和 o1-mini 两个版本已经在 ChatGPT Plus/Team 和 API 接口渠道上线,企业和教育用户将于下周初获得优先访问权限。

OpenAI CEO 奥尔特曼 (Sam Altman) 表示,「这是我们迄今为止功能最强大、最一致的模型系列 o1,也是迄今为止我们最好的推理模型。虽然 o1 仍然存在缺陷并有限,但使用时的感觉依然更加令人印象深刻。」

具体来看,OpenAI o1 可以解决比以前 GPT 时期的科学、编码和数学模型更难的问题。

OpenAI 的研究负责人 Jerry Tworek 透露,o1 模型背后的训练与之前的产品有着根本性的区别。之前的 GPT 模型旨在模仿其训练数据中的模式,而 o1 的训练旨在让其独立解决问题。在强化学习的过程中,使用奖励和惩罚机制来 「教育」AI 使用 「思维链」 来处理问题,就像人类习得拆解、分析问题的方式一样。

o1 上线之后,现在 ChatGPT 可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错) 进化到了可使用系统 2 思维 (缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

所谓推理大模型,就是 AI 会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样,而非预测单词生成的序列。比如通过文字点开 AI 思考的过程,还会出现 AI 表示 「我在思考这个事情这么做行不行」、「啊时间不够了得尽快给出答案」 等。OpenAI 确认,这里展示的并不是原始的思维链,而是 「模型生成的摘要」,公司也坦率承认这里有保持 「竞争优势」 的因素。

根据测试,在国际数学奥林匹克 (IMO) 资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。而在编程能力比赛 Codeforces 中,o1 模型拿到 89% 百分位的成绩,而 GPT-4o 只有 11%。

OpenAI 发现,随着更多的强化学习 (训练时计算) 和更多的思考时间 (测试时计算),o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,OpenAI 也还在继续研究。

OpenAI 技术文件称,实验结果表明:o1 超越了人类专家的表现,性能接近理科博士水平,成为第一个在该基准测试中做到这一点的模型。而在下一个更新的版本中,AI 在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。

除了 OpenAI o1-preview 外,OpenAI 今晨也同步推出了 o1-mini 模型,更快、更便宜,定价也比 preview 版本降低了 80%,适用于需要推理但不需要广泛世界知识的场景。

很显然,尽管新的 OpenAI o1 还不具备更全面问题解决能力,但显著提升的推理能力使其在科学、编程、数学等专业领域具备了更大的用途,以及 AI Agent 相关技术的下限和上限被整体拉高,大幅提升科学研究和生产端的能力,对于消费端来说意义不算太大。

英伟达首席科学家 Jim Fan 表示,新的 o1 需要消耗更大的算力和数据,并且能够形成数据飞轮效应,正确的答案及其思考过程可以成为很好的训练数据。从而不断改进推理核心,类似 AlphaGo 的价值网络随着 MCTS 生成更多精炼数据而改进。

天风国际称,OpenAI o1 系列模型大幅增强推理能力,并宣布新的 Scaling 范式:通过 RL 解锁 Test time compute(推理时间)。

此外,9 月 11 日彭博社报道称,OpenAI 正在商谈以 1500 亿美元 (约合 10675.35 亿元,1.07 万亿元) 的估值进行新一轮融资,有望从投资者那里筹集 65 亿美元,投资方包括苹果、英伟达、微软等。同时,OpenAI 还在谈判以循环信贷安排的形式从银行借款 50 亿美元。

成立于 2015 年的 OpenAI,一直处于科技行业向 AI 快速转变的中心,其发布的聊天机器人产品 ChatGPT 于 2022 年首次亮相,引发全球 AI 投资热潮。OpenAI 首席财务官 Sarah Friar 近日在内部备忘录中表示,新一轮融资将支持公司对计算能力和其他运营费用的需求。她强调,该公司的目标是允许员工在今年晚些时候的收购要约中出售部分股份。

(金桂财经,作者|林志佳,编辑|胡润峰)

Search

没有结果
查看所有结果

一周热门

银河期货深耕上期所橡胶支农专项项目成效显著

2025 年 11 月 11 日
十四届全国人大常委会第十八次会议10月24日至28日将在京举行

单日延误航班过万!美国政府 「停摆」 加剧空管缺勤 特朗普急了:没请假的 建议每人发 1 万美元奖金

2025 年 11 月 11 日

港股有望稳健前行,恒生科技 ETF 易方达 (513010)、港股通互联网 ETF(513040) 上周合计 「吸金」 超 11 亿元

2025 年 11 月 11 日

西贝回应关店潮:属于正常调整范畴

2025 年 11 月 11 日
美政府「停摆」有望结束?官员表示已有潜在协议;菲律宾全国超百万人撤离;最高法将对「开门杀」等问题作出规定;东航复航「中印航线」丨每经早参

美政府 「停摆」 有望结束?官员表示已有潜在协议;菲律宾全国超百万人撤离;最高法将对 「开门杀」 等问题作出规定;东航复航 「中印航线」 丨每经早参

2025 年 11 月 11 日
重大发现!全球3.3亿人的难题 被中国团队找到关键突破口

重大发现!全球 3.3 亿人的难题 被中国团队找到关键突破口

2025 年 11 月 11 日

定价权逐步提升!南向资金净买入额突破 5 万亿港元 机构:当前港股估值水平仍有吸引力

2025 年 11 月 11 日

参议院迈出关键一步,特朗普点头,美政府停摆或进入倒计时

2025 年 11 月 11 日
十四届全国人大常委会第十八次会议10月24日至28日将在京举行

风险资产普涨!美政府关门闹剧有望落幕 焦点将转向 「数据洪流」?

2025 年 11 月 11 日
Xu —— 为深度思考者打造的新型交流社区

Xu —— 为深度思考者打造的新型交流社区

2025 年 11 月 11 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 银河期货深耕上期所橡胶支农专项项目成效显著
  • 单日延误航班过万!美国政府 「停摆」 加剧空管缺勤 特朗普急了:没请假的 建议每人发 1 万美元奖金
  • 港股有望稳健前行,恒生科技 ETF 易方达 (513010)、港股通互联网 ETF(513040) 上周合计 「吸金」 超 11 亿元
  • 西贝回应关店潮:属于正常调整范畴
  • 美政府 「停摆」 有望结束?官员表示已有潜在协议;菲律宾全国超百万人撤离;最高法将对 「开门杀」 等问题作出规定;东航复航 「中印航线」 丨每经早参
  • 重大发现!全球 3.3 亿人的难题 被中国团队找到关键突破口
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }