在周二举行的 Re:Invent 大会上,全球云计算龙头亚马逊发布了第二代 Nova 大模型。不过相较 4 款新模型,公司同步推出的大模型自主训练服务 Nova Forge 更加引人关注。
先简单介绍一下 4 款新 Nova 2 系列模型。其中 Nova 2 Lite 是着重于成本效益的日常工作负载推理模型,能够处理文本、图像和视频;Nova 2 Pro 是一款推理代理,旨在应对编程等 「高度复杂的任务」; Nova 2 Sonic 是一款用于对话的语音到语音模型;Nova 2 Omni 是一款多模态推理与生成模型,上下文窗口达到 75 万字、数小时音频、长视频或数百页文档。从公布的基准跑分来看,亚马逊模型与主流同类竞品大致相当。
与 AI 芯片一样,亚马逊也在新闻稿中强调,Nova 2 系列模型在推理、多模态处理、对话式 AI、代码生成和代理任务方面实现了行业领先的...... 性价比。

(Nova2 模型定价实例,来源:亚马逊)
顺便一提,AWS 本周宣布与竞争对手谷歌云达成云服务互联协议,方便共同客户迁移数据并开发可在两家云上运行的应用。AWS 还将在明年晚些时候与微软Azure 达成类似合作。有小道消息称,这一合作背后的原因之一,就是 Nova 模型的竞争力不足。许多 AWS 客户不得不迁移到谷歌或微软的云服务上,使用最新 Gemini 和 GPT 全系列模型。
相较于 Nova 模型,亚马逊周二推出的另一项服务 Nova Forge 引发了更大的兴趣——每年 「仅需」10 万美元,就能让云客户训练更贴合业务需求的前沿大模型。
作为背景,目前绝大多数云服务支持客户对完成训练的大语言模型进行微调,但 Nova Forge 允许企业访问预训练、中期训练或后期训练阶段,加入自己的专有数据进行训练。
AWS 首席执行官 Matt Garman 解释称:「模型越是被定制,越是往后期训练里加入大量数据,它们就越容易遗忘之前学到的一些有趣东西,尤其是核心推理能力。这有点像人类学习新语言。你在很小的时候开始学,其实很容易上手;但当你长大后再去学一门新语言,就会困难得多。模型训练也有点类似这种情况。」
据悉,使用这项服务的费用为每年 10 万美元,但如果要亚马逊工程师协助构建模型,还需要额外加钱。
AWS 强调,自己构建大模型的公司最终可能要花费数亿到数十亿美元不等,所以 Nova Forge 的性价比十足。
亚马逊通用人工智能首席科学家 Rohit Prasad 介绍称,公司内部的电商和 Alexa 团队正在使用这项服务构建大模型。外部客户方面,「美国贴吧」Reddit 试用这项服务制作了一个内容审核 AI 模型。Prasad 表示,工程师发现通过 Forge 输入 Reddit 数据增强的 Nova 模型,其表现优于市面上可商业使用的大型模型。
(财联社)
文章转载自 东方财富

