Anthropic 胜诉引爆AI版权革命:训练数据"合理使用"获美司法认可

当地时间2025年6月23日,美国地区法官威廉•阿尔苏普(William Alsup)裁定,人工智能初创公司Anthropic对其人工智能进行版权书籍训练的行为合法,该行为受到“合理使用”原则的保护,该原则允许在特定条件下未经授权使用受版权保护的材料,并且无需向作者支付报酬。

美国法官首次在人工智能版权诉讼中支持科技公司而非创意人员,开创了在人工智能版权纠纷中法院支持人工智能公司的先例。这家估值615亿美元、由亚马逊和Alphabet支持的公司Anthropic,也是美国第一家赢得此类诉讼的人工智能公司。在此之前的汤森路透诉Ross案中,法官裁定AI初创公司Ross使用汤森路透旗下法律研究公司Westlaw的材料进行培训“不构成合理使用”——该案已进入上诉法院审理阶段。

同一周里(6月25日),美国另一位地方法官文斯·查布里亚(Vince Chhabria)裁定,Meta在未经许可的情况下使用13位作者的书籍训练其人工智能工具,并未违反法律,因为原告没有提供足够的证据证明Meta对其书籍的使用是有害的。

结合之前美国版权局长否认人工智能训练版权内容“合理使用”后旋即被辞的事件,可以说,美国人工智能版权正在经历一个历史性的转折。其结果可能对接下来OpenAI、Meta、微软、谷歌、Anthropic和英伟达相关的版权诉讼产生巨大影响,并可能重塑信息生态系统和整个人工智能行业,进而影响到互联网上的几乎每个人。

这场裁决也伴随着巨大的争议。6月27日,数百名美国作家发出了一封公开信,呼吁图书出版商承诺限制使用人工智能工具,并言辞激烈地宣称,作家的作品被人工智能公司“窃取”了。

一、为什么是“合理使用”

“合理使用”原则是美国版权法中的一个概念,指允许未经版权所有者许可使用受版权保护的素材。《版权法》第107条规定:“对受版权保护作品的合理使用……用于批评、评论、新闻报道、教学(包括课堂使用的多份副本)、奖学金或研究等目的,不构成侵犯版权”。

然而,对人工智能大模型的训练,显然不符合这部最早制定于1790年、最近一次修订于2018年的《版权法》所列举的“合理使用”的传统情形。因此,这有赖于法官如何解释人工智能公司的行为,以及对“合理使用”的要素分析。

阿尔苏普法官首先区分了Anthropic公司的两种不同的行为:购买大量书籍以及从某网站下载盗版书籍对大模型进行训练——“Anthropic购买的图书馆书籍和盗版之间的法律问题不同,因此该裁决将依次处理它们。”

问题主要集中在前者,即对于Anthropic公司购买书籍、复制、训练大模型产品Claude,究竟是否经得起“合理使用”的分析。

1、训练大模型与人类阅读相似

首先,阿尔苏普法官认为人工智能大模型的训练,几乎等同于对“任何人阅读和写作一样”的训练,并且强调,Anthropic的大型语言模型Claude在训练过程中借鉴作品并非为了复制或取代它们,而是为了“另辟蹊径,创造出不同的东西”。书籍的作者不能理所当然地拒绝任何人使用他们的作品进行培训或学习,也就不应该拒绝其作品被用于训练大模型。

2、没有外部分享就属于合理使用

虽然Anthropic是一家商业机构,并能从这种复制书籍、训练大模型中得到商业利益,但是法官特别区分了这些书籍被使用的“内部性和外部性”,由于“它没有制作新的拷贝在外部分享或出售”,而只是用于内部大模型的训练,因此就属于“合理使用”

法官认为,购买的印刷版被Anthropic已经销毁,而数字替代品没有以其原本的内容向外重新分发,这就属于“合理使用”。

3、数百万本书对于大模型训练是“合理必要”的

原告作家们提出一个观点,认为Anthropic“复制整个作品”并使用数百万本书训练,这种量级对于“合理使用”来说,并非必要。

但阿尔苏普法官认为,“合理必要”并不意味着“严格必要”。或许,使用数十万本书也可以训练出一个给定的大模型,但这不意味着Anthropic不可以使用更多的数百万本书来训练Claude,因此训练内容中包含了原告作者的作品,甚至“使用任何一部作品来实际训练LLM都是合理的”。

4、AI的输出并非作家出版作品的“竞争性替代”

阿尔苏普法官认为,训练特定大型语言模型使用大量书籍,本身并且不会减少市场对作者作品的需求,即便有所减少,也不符合《版权法》所关注的那种竞争性或创造性的替代。

他进一步解释,《版权法》旨在促进原创作品的创作,而不是保护作者完全免受竞争。即,如果某位作家出版大量自己作品,并被一批读者全部买去阅读、研究,并成为与其形成竞争的作家,那么原来的作家也无权对此加以阻止或控制。

总的来说,法院判定未经许可使用受版权保护的作品是否构成合理使用,最主要的标准是审查该使用是否具有“变革性”,这意味着它并非是对原作品的替代,而是某种新事物。

二、训练大模型不能合理化“盗版”

然而,在购买图书之前,Anthropic曾下载了700多万本盗版图书,没有支付任何费用。虽然据称它已经决定不再使用这些盗版图书来训练人工智能,仍将这些盗版图书保存在其资料库种。Anthropic辩称,因为其中一些图书最终将被用于训练大模型,就可以将这一行为视为“合理使用”。

这家人工智能公司意图在于,无限制地拓宽“合理使用”的范围。Anthropic认为,因为这些书籍是“用于高度变革性的用途”,法律上就应当对其获得训练数据的任何途径进行正面评价。

但阿尔苏普法官表示,盗版本来就是不可挽回的侵权行为,即使盗版书籍立即被丢弃。所以,无论盗版书籍是仅仅用于建设一个数字图书馆,还是训练大模型的语料库,从法律性质上都与购买书籍的行为完全不同。法官在这个问题上打破了Anthropic提出的“AI即合理”的假设。

Anthropic复制并存储的超过700万本盗版书籍,侵犯了作者的版权,不构成合理使用。法官已下令于12月开庭审理,以确定Anthropic应承担的侵权赔偿金额。根据美国的《版权法》,故意侵犯版权可能会导致每部作品被处以最高15万美元的法定赔偿。


随着人工智能产业的扩张,美国法院正急于区分合法的变革性使用和超出创新范畴的纯粹抄袭。所以,尽管本案的裁决表明,从受版权保护的作品中学习可以被视为“合理使用”,但它也明确指出了一点:人工智能公司不能简单地从最容易获得的地方借用材料,因此必须谨慎地对待其抄袭的内容以及获取信息的方式


三、“合理使用”法院认定的巨大影响

这一判决对作家、艺术家和出版商来说无疑是一个巨大的打击,他们正在对OpenAI、Meta、Midjourney、谷歌等公司提起与本案相似的数十起诉讼。

图:美国的人工智能版权诉讼:原告与被告(统计截至2025年5月,来自WIRED)

这些创作者声称,人工智能公司使用他们的作品来训练利润丰厚且功能强大的人工智能模型,这种行为无异于“盗窃”;而人工智能公司经常依靠所谓的“合理使用”原则为自己辩护,认为构建人工智能工具应该被视为一种合法使用,而无需获得同意或向权利人支付报酬的情况。

就像Anthropic在本案中的辩词所声称的,如果必须向权利人支付报酬,那么交易成本将超过其获得的预期收益。人工智能公司只有两个选择:停止与任何权利持有人打交道,或者完全停止开发AI技术。因此,人工智能公司甚至不惜以盗版的方式试探法律的底线。

虽然这项裁决并不能保证其他法官也会效仿阿尔苏普法官的做法,但它为法院站在科技公司一边、而非创意人士的立场奠定了基础。值得注意的是,阿尔苏普在合理使用问题上的经验远超一般联邦法官,他曾主持谷歌诉甲骨文案(Google v. Oracle)的初审。

与此同时,美国版权局也在经历历史上最动荡的时刻。2025年5月,就在版权局发布了一份关于生成式人工智能训练和合理使用的报告几天后,美国版权局局长珀尔穆特突然被解雇。于是版权局“出于谨慎”立即暂停了版权登记证书的发放,影响了约2万份登记。5月29日美国版权局虽然恢复了工作,但现在发出的登记证书上,局长签名处却变成了空白,成为一份可被挑战的法律文件。版权局内部的现实是:实际上无人掌权。

或许,接下来人工智能公司将赢得大部分诉讼,并获得美国政府的各种支持和版权局的认可。


相关阅读


英国AI版权“立法实验室”启示录:创新松绑vs创作者权益,中国如何借鉴?

生成式AI重写创意产业规则,仅靠版权无法保护创意作品的未来

OpenAI 吉卜力滤镜狂欢背后:AI正在重塑艺术创作的“法律边疆”——超越版权法?

OpenAI 要求破除版权障碍训练AI:“国家安全”名义下的盗版,还是AI发展的必然?

人机协同时代的版权困局:人工智能版权治理与创新研讨会深度解析

从中美司法实践剖析与比较AIGC的可版权性






作者:《互联网法律评论》


【免责声明】本文撰写所需的信息采集自合法公开的渠道,我们无法对信息的真实性、完整性和准确性提供任何形式的保证。本文仅为分享、交流信息之目的,不构成对任何企业、组织和个人的决策依据。


《互联网法律评论》提供业界解决方案

互联网法律国际监管动态研究

互联网产业投资和政策监管研究

互联网企业:极端地缘政治冲突中的公关战略研究

合作联系

zhangying@cggthinktank.com


互联网法律评论

《互联网法律评论》是一个全新的法律自媒体平台,持续关注中国及全球互联网科技发展、产业发展和法律监管合规问题,尤其是数据安全与个人隐私保护、知识产权、反垄断等政策监管主题。

该公号运营团队包括:国际国内互联网政策和法律研究、财经媒体资深主编、互联网企业公关战略和品牌运营等不同的专业人士,致力于打造一个持续输出政策法律前瞻信息研究、且具有传播优势的精品平台。







展开阅读全文

更新时间:2025-07-03

标签:科技   司法   版权   数据   人工智能   美国   模型   公司   书籍   法律   法官   作品   版权法

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top