当地时间周一 (12 月 1 日),美国人工智能初创公司 Runway 推出 Gen-4.5——一款新视频模型,该模型在独立基准测试中表现优于谷歌和 OpenAI 同类产品。
Gen-4.5 能根据用户提供的文字提示,通过描述其中的运动与动作,生成高清的视频内容。Runway 表示,这款模型在理解物理规律、人体动作、镜头运动以及因果关系方面表现突出。
该模型在独立 AI 基准测试与分析公司 Artificial Analysis 的 Video Arena 排行榜上位居第一,而谷歌的 Veo 3 位列榜单第二,OpenAI 的 Sora 2 Pro 则排在第七。
该排行榜的文本生成视频模型排名是通过盲选方式得出:人们比较两个模型的输出视频,并投票选择更好的一个,投票时不会知道对应的是哪家公司。
Runway CEO Cristóbal Valenzuela 在接受采访时表示,「我们仅靠一百人的团队,就击败了万亿美元规模的公司。只要极度专注、勤奋,就能触及技术前沿。」

Runway 成立于 2018 年,公司从事 AI 研究,打造视频模型和世界模型,即在视频与观测数据上训练、以更真实反映物理世界运行方式的模型。
目前,Runway 的客户包括媒体机构、影视工作室、品牌方、设计师、创作者和学生,但公司的员工规模只有 120 人。
根据 PitchBook 数据,其估值已膨胀至 35.5 亿美元。投资者包括 General Atlantic、Baillie Gifford、英伟达、Salesforce Ventures 等。
Valenzuela 表示,Gen-4.5 的内部代号是 「David(大卫)」,象征着圣经中 「大卫战歌利亚」(以弱胜强) 的典故。他说,这个模型 「是一个可以一夜成名、却花了七年时间打造的产品」。
「现在确实是一个非常有趣的时间节点,一个讲究效率和研究的时代正在到来。」Valenzuela 说,「我们非常兴奋能确保 AI 不会被两三家公司垄断。」
Runway 表示,Gen-4.5 正在逐步上线,本周内将向所有客户开放。Valenzuela 表示,这是公司接下来发布的一系列重大更新中的第一个。
「它将通过 Runway 的平台、其应用程序接口 (API) 以及公司的一些合作伙伴渠道提供。」
(财联社)
文章转载自 东方财富




