时隔一年,Sora 2 凌晨 「炸场」。
当地时间 9 月 30 日,人工智能(AI) 巨头 OpenAI 正式发布最新旗舰视频与音频生成模型 Sora 2。在发布会的一开始,就播出了一段全部由 Sora 2 生成的视频,OpenAI CEO 山姆·奥特曼和 Sora 负责人比尔·皮布尔斯 (William Peebles,又名 Bill) 都被模型生成出来进行新功能的介绍。
据介绍,Sora 2 能够完成对于先前视频生成模型来说异常困难、甚至在某些情况下完全不可能做到的事情:奥运体操动作、在精确模拟浮力和刚性动力学的桨板上后空翻,以及一只猫拼命抓住不放时完成的三周半旋转。先前的视频模型过于 「乐观」,它们会扭曲物体、改变现实,以成功执行文本指令。例如,如果篮球运动员投篮不中,球可能会瞬间传送到篮筐。而在 Sora 2 中,如果篮球运动员投篮不中,球会从篮板上弹开。
同时,Sora 2 在可控性方面也迎来巨大提升,能够遵循跨越多个镜头的复杂指令,同时准确地保持世界状态的一致;能够创建复杂的背景音景、语音和音效,并具有高度的真实感;还可以直接将现实世界的元素注入 Sora 2。
OpenAI 表示,2024 年 2 月发布的初代 Sora 模型在许多方面可视为视频领域的 「GPT-1 时刻」,而 Sora 2 则直接迈入了视频领域的 「GPT-3.5 时刻」。
奥特曼则发文表示:「对我们许多人来说,这感觉像是 『创意领域的 ChatGPT 时刻』,新奇而有趣……创意领域可能即将经历一次 『寒武纪大爆发』,随之而来的是艺术和娱乐质量的急剧提升。」

山姆·奥特曼在社交平台 X 发文介绍 Sora 2
OpenAI 还同时推出了由 Sora 2 驱动的 Sora App。在应用中,用户可以创建音视频生成内容、还能在可定制的信息流中 「刷视频」,并通过 「客串」 功能将自己或朋友带入视频。
该 App 还自带防沉迷功能,默认对青少年每天在信息流中能看到的生成内容数量设置限制,并且对该群体的客串功能也设置了更严格的权限。OpenAI 表示,除了自动化安全防护栈之外,还正在扩大人工审核团队规模,以便在出现欺凌情况时快速审查。此外,App 还带有通过 ChatGPT 管理的家长控制功能。
同时,App 在包括防止他人滥用肖像进行深度伪造、防范令人不安或非法内容的保障、定期检查 Sora 对用户情绪和幸福感的影响等方面都设置了缓解措施。
目前,Sora 2 仅限受邀用户使用,iOS 端应用可下载,安卓端可访问网页使用,将在美国和加拿大进行初步推广,并扩展至更多国家。
Sora 2 初期将免费提供,并设有宽松的使用限制。ChatGPT Pro 用户能够使用实验性质的更高质量的 Sora 2 Pro 模型 (该模型后续将在 Sora App 中上线)。OpenAI 还计划在 API 中发布 Sora 2,Sora 1 Turbo 将继续可用,此前创建的内容将继续保留在库中。
值得注意的是,OpenAI 今年上半年业绩也被曝光。据外媒报道,OpenAI 上半年营收达 43 亿美元,较 2024 年全年营收增长 16%,月收入更是超过 10 亿美元,全年营收预计将增至 130 亿美元。
同时,OpenAI 同期消耗了 25 亿美元资金,主要原因是其人工智能研发以及 ChatGPT 运营成本,全年预计消耗 85 亿美元。截至报告期末,OpenAI 持有约 175 亿美元现金与证券。
此前,OpenAI 宣布与英伟达签署意向书并达成战略合作,OpenAI 将能够使用英伟达系统 (意味着数百万台 GPU) 构建和部署至少 10GW(千兆瓦) 的 AI 数据中心,用于训练和运行下一代模型,同时英伟达还计划逐步向 OpenAI 投资 1000 亿美元。
OpenAI 首席财务官萨拉·弗莱尔 (Sarah Friar) 曾公开表示,OpenAI 将考虑在未来某个时间点上市。目前,OpenAI 正推进员工股票二次出售,公司估值已达 5000 亿美元。
延伸阅读

(澎湃新闻)
文章转载自 东方财富