• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
DeepSeek新模型曝光?「MODEL1」现身开源社区

DeepSeek 新模型曝光?「MODEL1」 现身开源社区

2026 年 1 月 22 日

黄仁勋驳斥 「AI 泡沫论」:基建还需数万亿美元投资 否则终将走向失败!

2026 年 1 月 22 日
IMF上调2026年中国经济增长预期

商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

2026 年 1 月 22 日

中国期货市场监控中心:期货交易者对我国宏观经济和股市持续保持乐观预期

2026 年 1 月 22 日
广告

平安基金翟森:AI 产业进入应用百花齐放阶段

2026 年 1 月 22 日
黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还得再砸几万亿

黄仁勋达沃斯实录:几千亿只是开胃菜,AI 基建还得再砸几万亿

2026 年 1 月 22 日
金银新高后共振下跌,神秘力量力挽狂澜

特朗普 「表演」 撕开秩序裂缝,4888 并非金价终点

2026 年 1 月 22 日

红旗全固态电池首台样车成功下线;特斯拉公布新使命 | 汽车早参

2026 年 1 月 22 日

美国正积极寻求年底前颠覆古巴政权,以委内瑞拉为蓝本施压 「做交易」

2026 年 1 月 22 日
东方财富财经早餐 1月22日周四

东方财富财经早餐 1 月 22 日周四

2026 年 1 月 22 日

供需重塑+政策赋能,石油板块迎周期机遇,石油 ETF(561360) 涨超 2%

2026 年 1 月 22 日
IMF上调2026年中国经济增长预期

「和平委员会」 签约仪式将举行 中方是否考虑加入?外交部回应

2026 年 1 月 22 日
追觅CEO回应与陈飞宇粉丝吵架

追觅 CEO 回应与陈飞宇粉丝吵架

2026 年 1 月 22 日
金桂财经
广告
2026 年 1 月 22 日 星期四
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

DeepSeek 新模型曝光?「MODEL1」 现身开源社区

来自 金桂财经
2026 年 1 月 22 日
在 24 小时
0

来源:
上海证券报

  恰逢 DeepSeek-R1 模型发布一周年,DeepSeek 新模型 「MODEL1」 现身开源社区。

  近日,DeepSeek 官方在 GitHub 更新了一系列 FlashMLA 代码,涉及的 114 个文件中,有数十处提到了此前未公开的 「MODEL1」 大模型标识符。

  2025 年 2 月,DeepSeek 启动 「开源周」,计划以每日解锁的形式逐步公开 5 个代码库,Flash MLA 为首个开源项目。公开资料显示,Flash MLA 通过优化 Hopper GPU 的内存访问和计算流程,显著提高可变长度序列的处理效率。其核心设计包括动态内存分配机制和并行解码策略,可减少冗余计算并提升吞吐量,尤其适用于大语言模型的推理任务。

  在某些文件中,「MODEL 1」 与已知的现有模型 「V32」(即 DeepSeek-V3.2) 并列提及。行业分析认为,「MODEL1」 或许代表一个不同于现有架构的新模型,可能正是 DeepSeek 还未对外发布的下一代模型 (R2 或者 V4)。

  此前有市场消息称,DeepSeek 计划在 2 月春节前后发布新一代 AI 模型 DeepSeek V4,但发布时间可能会视实际情况而变化。V4 模型是 DeepSeek 2024 年 12 月发布的 V3 模型的迭代版,具备强大的编程能力。DeepSeek 内部的初步测试显示,V4 在编程能力上超过了目前市场上的其他顶级模型,如 Anthropic 的 Claude 和 OpenAI 的 GPT 系列。

  2026 年 1 月以来,DeepSeek 动作不断,已陆续发布了两篇技术论文,分别介绍了名为 「优化残差连接 (mHC)」 的新训练方法,以及一种受生物学启发的 「AI 记忆模块 (Engram)」。

  1 月 12 日,DeepSeek 在 github 上发表新论文,文章由 DeepSeek 与北京大学合作完成,作者中有梁文锋署名。文章指出,Transformer 架构缺乏原生的知识查找机制,迫使它们通过计算低效地模拟检索。为此,DeepSeek 提出了条件记忆 (conditional memory),并给出了实现方案 Engram 模块。DeepSeek 称,该模块不仅有助于知识检索,同时在一般推理和代码/数学领域方面取得了更大的进步。

  在业内看来,梁文锋旗下私募幻方量化较高的收益率,为 DeepSeek 的研发提供了更多支持。公开资料显示,幻方量化 2025 年的收益均值达 56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以 73.51% 收益均值登顶的灵均投资。目前,幻方量化管理规模已超 700 亿元。

(上海证券报)

文章转载自东方财富

YOU MAY ALSO LIKE

黄仁勋驳斥 「AI 泡沫论」:基建还需数万亿美元投资 否则终将走向失败!

中国期货市场监控中心:期货交易者对我国宏观经济和股市持续保持乐观预期

Search

没有结果
查看所有结果

一周热门

黄仁勋驳斥 「AI 泡沫论」:基建还需数万亿美元投资 否则终将走向失败!

2026 年 1 月 22 日
IMF上调2026年中国经济增长预期

商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

2026 年 1 月 22 日

中国期货市场监控中心:期货交易者对我国宏观经济和股市持续保持乐观预期

2026 年 1 月 22 日

平安基金翟森:AI 产业进入应用百花齐放阶段

2026 年 1 月 22 日
黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还得再砸几万亿

黄仁勋达沃斯实录:几千亿只是开胃菜,AI 基建还得再砸几万亿

2026 年 1 月 22 日
金银新高后共振下跌,神秘力量力挽狂澜

特朗普 「表演」 撕开秩序裂缝,4888 并非金价终点

2026 年 1 月 22 日

红旗全固态电池首台样车成功下线;特斯拉公布新使命 | 汽车早参

2026 年 1 月 22 日

美国正积极寻求年底前颠覆古巴政权,以委内瑞拉为蓝本施压 「做交易」

2026 年 1 月 22 日
东方财富财经早餐 1月22日周四

东方财富财经早餐 1 月 22 日周四

2026 年 1 月 22 日

供需重塑+政策赋能,石油板块迎周期机遇,石油 ETF(561360) 涨超 2%

2026 年 1 月 22 日
金桂财经

2026 年 1 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 12 月    

近期动态

  • 黄仁勋驳斥 「AI 泡沫论」:基建还需数万亿美元投资 否则终将走向失败!
  • 商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求
  • 中国期货市场监控中心:期货交易者对我国宏观经济和股市持续保持乐观预期
  • 平安基金翟森:AI 产业进入应用百花齐放阶段
  • 黄仁勋达沃斯实录:几千亿只是开胃菜,AI 基建还得再砸几万亿
  • 特朗普 「表演」 撕开秩序裂缝,4888 并非金价终点
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }