DeepSeek 论文登上《自然》杂志首次披露训练 R1 成本

【文章来源：techweb】

【】9 月 18 日消息，据外媒报道，AI 初创公司 DeepSeek（深度求索）的论文登上《自然》杂志。

DeepSeek 表示其强大的 AI 模型 R1 的成功并非依赖于模仿其他大型语言模型（LLM）生成的示例进行训练，这一声明是随着 R1 模型的同行评审版本的发布而公布的。

论文描述了 DeepSeek 如何增强标准的大型语言模型以应对推理任务，其补充材料首次揭示了训练 R1 的成本：仅为 29.4 万美元。这不包括 DeepSeek 公司在开发 R1 所基于的基础 LLM 上花费的约 600 万美元，但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

DeepSeek 表示，R1 主要使用英伟达的 H800 芯片进行训练。

R1 被认为是第一个经过同行评审过程的主要 LLM。「这是一个非常受欢迎的先例」，Hugging Face 的机器学习工程师刘易斯·图恩斯特尔说，他审阅了《自然》杂志的论文。「如果我们没有公开分享这一过程的大部分内容，就很难评估这些系统是否构成风险。」

自 1 月发布以来，DeepSeek 因其与世界领先的 AI 应用相比，竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower 称，DeepSeek 推出的应用在最初的 18 天内获得了 1600 万次下载，几乎是 OpenAI 的 ChatGPT 首次发布时 900 万次下载量的两倍。

公开资料显示，DeepSeek 成立于 2023 年 7 月，由知名量化资管巨头幻方量化创立，专注于开发先进的大语言模型（LLM）和相关技术。幻方量化的掌门人梁文锋是 DeepSeek 的创始人。

【文章来源：techweb】

【】9 月 18 日消息，据外媒报道，AI 初创公司 DeepSeek（深度求索）的论文登上《自然》杂志。

DeepSeek 表示，R1 主要使用英伟达的 H800 芯片进行训练。

特斯拉授予朱晓彤 52 万股股票期权目前价值超过 16 亿

谷歌狠狠地给苹果「上了一课」

【文章来源：techweb】

【】9 月 18 日消息，据外媒报道，AI 初创公司 DeepSeek（深度求索）的论文登上《自然》杂志。

DeepSeek 表示，R1 主要使用英伟达的 H800 芯片进行训练。

【文章来源：techweb】

【】9 月 18 日消息，据外媒报道，AI 初创公司 DeepSeek（深度求索）的论文登上《自然》杂志。

DeepSeek 表示，R1 主要使用英伟达的 H800 芯片进行训练。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31