• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
DeepSeek R2有望8月下旬发布?内部人士:不属实

DeepSeek R2 有望 8 月下旬发布?内部人士:不属实

2025 年 8 月 13 日
消息称三星SDI获得特斯拉电池订单 但并不是用于电动汽车

消息称三星 SDI 获得特斯拉电池订单 但并不是用于电动汽车

2025 年 11 月 4 日

公募规模排位赛:谁在进位?谁在掉队?

2025 年 11 月 4 日

午评:创业板指半日跌 1.51% 福建本地股逆势上扬

2025 年 11 月 4 日
广告

11 月 3 日晚间央视新闻联播要闻集锦

2025 年 11 月 4 日
前10月地方政府借钱超9万亿 5000亿增量预计年底前落地

前 10 月地方政府借钱超 9 万亿 5000 亿增量预计年底前落地

2025 年 11 月 4 日

光伏电池技术取得新进展,光伏 ETF 易方达 (562970)、储能电池 ETF(159566) 等助力把握产业发展机遇

2025 年 11 月 4 日
工商银行重要公告:暂停受理!

工商银行重要公告:暂停受理!

2025 年 11 月 4 日
又撕破脸!马斯克与奥尔特曼的旧怨新火

又撕破脸!马斯克与奥尔特曼的旧怨新火

2025 年 11 月 4 日
员工砍福利,CEO涨薪资?上汽旗下享道出行IPO:三年半狂亏19亿

员工砍福利,CEO 涨薪资?上汽旗下享道出行 IPO:三年半狂亏 19 亿

2025 年 11 月 4 日

中国证监会副主席李明:将推出更多有力度的开放举措

2025 年 11 月 4 日
亚马逊与OpenAI签署380亿美元协议

亚马逊与 OpenAI 签署 380 亿美元协议

2025 年 11 月 4 日

午盘播报 11 月 4 日 周二

2025 年 11 月 4 日
金桂财经
广告
2025 年 11 月 4 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

DeepSeek R2 有望 8 月下旬发布?内部人士:不属实

来自 金桂财经
2025 年 8 月 13 日
在 24 小时
0

作者:
范佳来

K图 BK1188_0

  近日有市场传言称,国产大模型公司深度求索旗下 DeepSeek R2 有望在 8 月 15 日至 30 日期间发布。

  8 月 13 日,DeepSeek 内部人士向澎湃新闻记者表示,上述消息不属实。

  早在今年 4 月,就有传言称,深度求索可能将在 5 月推出下一代 AI 大模型 DeepSeek-R2。当时有报道称,DeepSeek-R2 大模型将会采用一种更先进的混合专家模型 (MoE),其结合更加智能的门控网络层 (Gating Network) 以优化高负载推理任务的性能。

  不过,上述内部人士曾向记者坦言,该传言真实度不高。

  此后,DeepSeek 官宣推出 R1 新版本,业内普遍认为这是取代了 R2 的发布。

  5 月 29 日,据 DeepSeek 公告,DeepSeek R1 模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启 「深度思考」 功能即可体验最新版本。API 也已同步更新,调用方式不变。

  公告指出,DeepSeek-R1-0528 使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

  相较于旧版 R1,新版模型在复杂推理任务中的表现有显著提升。例如在 AIME2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。这一进步得益于模型在推理过程中的思维深度增强:在 AIME2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

  大模型行业的内卷正在加剧。7 月 31 日,据国际开源社区 Hugging-Face 最新趋势热榜显示,前十名模型中,有 9 个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型 GLM-4.5,排名第二的是阿里旗下通义千问模型 Qwen3,而腾讯混元最新发布的 3D 模型则排行第三。

  但据排名数据显示,DeepSeek R1 在 Hugging-Face 趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1 收到了 1.25 万个赞 (like),远超其他国产大模型。

  在年初成为大模型产业王炸黑马后,DeepSeek 成为国内大模型厂商的集体竞标对手,包括 MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标 DeepSeek 的目标,且在更新迭代上进展迅速。作为中国开源大模型的 「风向标」,DeepSeek 正在面临更激烈竞争。

(澎湃新闻)

文章转载自东方财富

YOU MAY ALSO LIKE

午评:创业板指半日跌 1.51% 福建本地股逆势上扬

11 月 3 日晚间央视新闻联播要闻集锦

Search

没有结果
查看所有结果

一周热门

消息称三星SDI获得特斯拉电池订单 但并不是用于电动汽车

消息称三星 SDI 获得特斯拉电池订单 但并不是用于电动汽车

2025 年 11 月 4 日

公募规模排位赛:谁在进位?谁在掉队?

2025 年 11 月 4 日

午评:创业板指半日跌 1.51% 福建本地股逆势上扬

2025 年 11 月 4 日

11 月 3 日晚间央视新闻联播要闻集锦

2025 年 11 月 4 日
前10月地方政府借钱超9万亿 5000亿增量预计年底前落地

前 10 月地方政府借钱超 9 万亿 5000 亿增量预计年底前落地

2025 年 11 月 4 日

光伏电池技术取得新进展,光伏 ETF 易方达 (562970)、储能电池 ETF(159566) 等助力把握产业发展机遇

2025 年 11 月 4 日
工商银行重要公告:暂停受理!

工商银行重要公告:暂停受理!

2025 年 11 月 4 日
又撕破脸!马斯克与奥尔特曼的旧怨新火

又撕破脸!马斯克与奥尔特曼的旧怨新火

2025 年 11 月 4 日
员工砍福利,CEO涨薪资?上汽旗下享道出行IPO:三年半狂亏19亿

员工砍福利,CEO 涨薪资?上汽旗下享道出行 IPO:三年半狂亏 19 亿

2025 年 11 月 4 日

中国证监会副主席李明:将推出更多有力度的开放举措

2025 年 11 月 4 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 消息称三星 SDI 获得特斯拉电池订单 但并不是用于电动汽车
  • 公募规模排位赛:谁在进位?谁在掉队?
  • 午评:创业板指半日跌 1.51% 福建本地股逆势上扬
  • 11 月 3 日晚间央视新闻联播要闻集锦
  • 前 10 月地方政府借钱超 9 万亿 5000 亿增量预计年底前落地
  • 光伏电池技术取得新进展,光伏 ETF 易方达 (562970)、储能电池 ETF(159566) 等助力把握产业发展机遇
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }