• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
DeepSeek V3.2正式发布:推理达GPT-5水平 智能体评测中开源模型最高水平

DeepSeek V3.2 正式发布:推理达 GPT-5 水平 智能体评测中开源模型最高水平

2025 年 12 月 2 日
【新华解读】我国基础设施REITs再迈关键一步 扩围至酒店、商业办公设施等领域

【新华解读】 我国基础设施 REITs 再迈关键一步 扩围至酒店、商业办公设施等领域

2025 年 12 月 2 日

瑞郎飙升央行却 「躺平」?瑞银:11 月恐才是 「真战场」

2025 年 12 月 2 日

助力实体企业筑牢风险管理防线

2025 年 12 月 2 日
广告
12月1日东方财富财经晚报(附新闻联播)

12 月 1 日东方财富财经晚报 (附新闻联播)

2025 年 12 月 2 日
宁德时代宣布涨薪?曾毓群回应:没错

宁德时代宣布涨薪?曾毓群回应:没错

2025 年 12 月 2 日

现金流 ETF(159399)10 日吸金近 6 亿元,连续 9 个月分红,年底政策窗口期,红利风格凸显

2025 年 12 月 2 日

我国单机容量最大效率最高燃机投产

2025 年 12 月 2 日

斯塔默力挺财政大臣,否认误导公众,誓言英国经济将重回正轨

2025 年 12 月 2 日

每日机构分析:12 月 1 日

2025 年 12 月 2 日
零跑销量再破7万辆,再夺新势力「销冠」!小米汽车超4万辆,「蔚小理」均超3万辆

零跑销量再破 7 万辆,再夺新势力 「销冠」!小米汽车超 4 万辆,「蔚小理」 均超 3 万辆

2025 年 12 月 2 日
利率要降、美元要跌、世界不太平:黄金的「完美风暴」真的来了吗?

利率要降、美元要跌、世界不太平:黄金的 「完美风暴」 真的来了吗?

2025 年 12 月 1 日

工信部再出手 「反内卷」:10 多家龙头企业参会 为何盯上电池?

2025 年 12 月 1 日
金桂财经
广告
2025 年 12 月 2 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

DeepSeek V3.2 正式发布:推理达 GPT-5 水平 智能体评测中开源模型最高水平

来自 金桂财经
2025 年 12 月 2 日
在 24 小时
0

来源:
澎湃新闻

  国产大模型风向标 DeepSeek 再发重磅新模型:重点强化智能体能力,并且融入思考和推理过程。

  12 月 1 日,DeepSeek 同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。

  DeepSeek-V3.2 表示,其目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent(智能体) 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少计算开销与用户等待时间。

  据 DeepSeek 方面介绍,DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,V3.2-Speciale 是 DeepSeek-V3.2 长思考增强版,同时结合 DeepSeek-Math-V2 定理证明能力。

  DeepSeek-V3.2 具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。

  不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是首个将思考融入工具使用的模型。同时支持思考模式与非思考模式的工具调用,目前提出一种大规模 Agent 训练数据合成方法,DeepSeek-V3.2 模型在智能体评测中达到当前开源模型的最高水平,大幅缩小开源模型与闭源模型的差距。

  值得说明的是,V3.2 并没有针对这些测试集的工具进行特殊训练,所以 V3.2 在真实应用场景中能够展现出较强的泛化性。

  在评测和成绩方面,DeepSeek-V3.2-Speciale 模型获得 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛) 及 IOI 2025(国际信息学奥林匹克) 金牌。其中,ICPC 与 IOI 成绩分别达到人类选手第二名与第十名的水平。

  值得注意的是,DeepSeek 指出,在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

  DeepSeek 是当之无愧的大模型风向标,一举一动都受到行业整体关注。最近网易有道词典发布 2025 年度词汇——「deepseek」 以 8672940 次年度搜索量成功当选。据有道词典负责人介绍,「deepseek」 在词典内部的搜索曲线呈现明显的爆发式特征,从年初因 「低成本」 突破算力封锁起,几乎每个重要进展都会带动搜索量上涨。

(澎湃新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

【新华解读】 我国基础设施 REITs 再迈关键一步 扩围至酒店、商业办公设施等领域

助力实体企业筑牢风险管理防线

Search

没有结果
查看所有结果

一周热门

【新华解读】我国基础设施REITs再迈关键一步 扩围至酒店、商业办公设施等领域

【新华解读】 我国基础设施 REITs 再迈关键一步 扩围至酒店、商业办公设施等领域

2025 年 12 月 2 日

瑞郎飙升央行却 「躺平」?瑞银:11 月恐才是 「真战场」

2025 年 12 月 2 日

助力实体企业筑牢风险管理防线

2025 年 12 月 2 日
12月1日东方财富财经晚报(附新闻联播)

12 月 1 日东方财富财经晚报 (附新闻联播)

2025 年 12 月 2 日
宁德时代宣布涨薪?曾毓群回应:没错

宁德时代宣布涨薪?曾毓群回应:没错

2025 年 12 月 2 日

现金流 ETF(159399)10 日吸金近 6 亿元,连续 9 个月分红,年底政策窗口期,红利风格凸显

2025 年 12 月 2 日
DeepSeek V3.2正式发布:推理达GPT-5水平 智能体评测中开源模型最高水平

DeepSeek V3.2 正式发布:推理达 GPT-5 水平 智能体评测中开源模型最高水平

2025 年 12 月 2 日

我国单机容量最大效率最高燃机投产

2025 年 12 月 2 日

斯塔默力挺财政大臣,否认误导公众,誓言英国经济将重回正轨

2025 年 12 月 2 日

每日机构分析:12 月 1 日

2025 年 12 月 2 日
金桂财经

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 11 月    

近期动态

  • 【新华解读】 我国基础设施 REITs 再迈关键一步 扩围至酒店、商业办公设施等领域
  • 瑞郎飙升央行却 「躺平」?瑞银:11 月恐才是 「真战场」
  • 助力实体企业筑牢风险管理防线
  • 12 月 1 日东方财富财经晚报 (附新闻联播)
  • 宁德时代宣布涨薪?曾毓群回应:没错
  • 现金流 ETF(159399)10 日吸金近 6 亿元,连续 9 个月分红,年底政策窗口期,红利风格凸显
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }