根据美国加州北区法院发布的判决书,美国人工智能初创企业 Anthropic 赢下首个有利于 AI 产业的开创性判决:法官 William Alsup 裁定公司对合法购买的书籍进行数字化,并用于 AI 模型的训练属于合理使用范畴。
但法官也表示,明明有合法购买途径,公司却通过互联网下载 「数百万本」 盗版书,这一过失仍需单独追究法律责任。
作为本案的背景,作家安德烈娅·巴茨、查尔斯·格雷伯和柯克·华莱士·约翰逊去年将 Anthropic 告上法庭,指控公司使用盗版材料训练 「克劳德」(Claude) 系列 AI 模型。作为一系列 AI 时代奠定规则的诉讼之一,本判决可能成为未来美国法官处理 AI 版权纠纷的裁量参考。

(来源:美国加州北区法院)
值得一提的是,本案法官正是当年甲骨文诉谷歌 Java 侵权案的一审法官。那起动员整个美国科技圈的官司最终由美国高院落锤裁定,谷歌对 Java API 的使用属于 「合理使用」 范畴。
买书用于训练 AI 合法,但 「偷书」 不行
作为关键争议点之一,Alsup 裁定,Anthropic 购买实体书籍、裁切页面、扫描并用于训练 AI 模型的行为合法。
法官表示,在版权法中,法院判定未经许可使用版权作品是否构成合理使用的主要标准之一,是审查该使用是否具有 「转化性」——即并非替代原作,而是创造出新内容。因此,Anthropic 对合法购买的实体书进行数字化属于合理使用范畴,而利用这些数字副本训练大语言模型具有足够的转化性,同样构成合理使用。
Alsup 在裁决书中写道:「原告的控诉无异于抱怨学校培养孩子写作会导致竞争作品激增…《版权法》 旨在推动原创作品发展,而非保护作者免受竞争。」

(来源:判决书)
法官也表示,Anthropic 将数百万本盗版书籍存储在训练模型的 「中央图书馆」 中,公司需要为这种行为接受惩罚。他在判决书强调:「本庭质疑任何被控侵权方如何能证明:从盗版网站下载本可以通过合法途径购买的书籍,对其后续构成合理使用确属合理必要。」
庭审文件显示,Anthropic 最早自 2021 年起就从一系列盗版网站下载了超过 700 万本书。
判决书裁定,法院后续将对 Anthropic 使用盗版图书的问题进行单独审理,并决定最终的赔偿金额。
据悉,在美国此类版权侵权官司的最低法定赔偿标准是每本书 750 美元,所以 Anthropic 后续仍有可能面临超过 50 亿美元的罚金。顺便一提,美国版权法对单部作品侵权赔偿上限为 3 万美元,若构成恶意侵权,罚金最高可达到 15 万美元/部作品。
在今年 3 月完成最新一轮融资时,Anthropic 的估值为 615 亿美元。
值得注意的是,本案并不涉及 AI 模型输出的内容是否侵犯版权,这恰恰是诸多其他案件的争议焦点。
(财联社)
文章转载自 东方财富