据Torrentfreak报道,Meta等科技公司曾通过BitTorrent协议从安娜档案库这类盗版资源网站下载受版权保护的书籍,以支持人工智能模型训练。

为了构建更强大的语言模型,在没有获得版权所有者许可的情况下,多家技术企业使用了大量受版权保护的内容作为训练数据。
Facebook和Instagram的母公司Meta成为了这场集体诉讼中的被告之一。知名作家如理查德·卡德雷、萨拉·西尔弗曼及克里斯托弗·戈登等人在2023年对该公司提起法律行动。
去年夏天,法院根据Meta提交的证据认定其使用盗版书籍训练Llama语言模型的行为属于合理使用。然而,这场胜利并不完全乐观,因为Meta仍需为其通过BitTorrent下载和分享书籍的行为承担责任。
在下载这些受版权保护的文件时,Meta依赖于BitTorrent协议传输数据,该协议在下载内容的同时也会向其他用户上传数据。原告方认为这意味着Meta实施了大规模直接侵犯版权的行为。
近几个月来,在证据开示程序中收集更多材料后,双方继续审理案件。然而,直到最近为止,Meta将采取何种辩护策略一直不明朗。
上周,Meta向加州联邦法院提交了一份补充质询答复,为其辩护开辟了新的方向。该公司首次提出在BitTorrent下载过程中向其他用户上传盗版书籍的行为也属于合理使用。
Meta的论点非常直接:任何使用BitTorrent传输文件的人在技术上都会自动地上传内容,这是协议本身固有的特性。换句话说,这种上传行为不是主动选择的结果,而是技术运行的必然结果。
该公司还指出,通过BitTorrent分享是获取这些有价值的(虽然非法)数据集的必要手段。例如,在安娜档案库中,该网站的数据只能通过BitTorrent批量下载,这使得使用BitTorrent成为唯一可行的方法。
“Meta选择使用BitTorrent是因为这是获取所需数据集更高效且可靠的方式;而在安娜档案库这类平台上,这些数据仅能通过BitTorrent进行批量下载。”该公司律师在文件中写道,“因此,即便原告能够提供证据证明其作品或部分内容在网络上传输过程中被‘提供’给其他人,这仅仅是实现合理使用目标的一部分。”
概括来说,要获取数百万本图书以支持大语言模型的训练并实现合理使用目的,就必须直接下载这些资料。
原告方对Meta上周深夜提交的新辩护文件表示强烈不满。周一上午,他们向文斯·查布里亚法官致函指出,这是规避证据开示截止日期的不当做法。
信中提到,在今年11月已经知晓相关指控的情况下,Meta从未提出过这一合理使用抗辩论点,并且即使法院询问时也未提及该主张。
函件明确表示,《联邦民事诉讼规则》第26(e)条要求持续补充证据开示,但这并不允许一方在截止日期后新增抗辩理由以逃避责任。
“Meta从未表明会针对上传相关指控提出合理使用抗辩,即便是在去年11月法院询问之后也没有这样做。”原告律师写道。
次日,Meta的法律团队反击了这一指责,并向查布里亚法官提交了一份函件解释称其提出的论点并非新主张。
Meta引用双方于2025年共同提交的案件管理声明文件中明确标注的合理使用抗辩,并指出原告律师在几天后的庭审中已对此作出回应。
“简而言之,原告声称Meta从未提出过合理的抗辩论点,这种说法与事实不符。”Meta律师写道。
该公司还引用了作家们的证词来支持其合理使用主张。这些陈述进一步强化了他们的辩护立场。
具名的作家们承认没有发现任何证据表明Meta模型复制了他们书籍中的文字内容。当被问及如果未生成书中内容是否重要时,萨拉·西尔弗曼表示:“一点也不重要。”
Meta认为这些陈述削弱了关于市场损害的说法依据。这种情况下,诉讼的核心可能不再是保护版权作品本身,而是质疑已被法院认定为合理使用的训练过程。
这些证词是去年夏天Meta胜诉的关键依据,在剩余的BitTorrent传播纠纷中它们是否同样有效还有待观察。
Meta还在质询答复中强调其在人工智能领域的投入帮助美国在全球竞争中保持领先地位,这是非常宝贵的资产。
随着案件进展,查布里亚法官将裁定Meta的技术必要性下的合理使用抗辩是否成立。这一裁决对本案及其他涉及盗版资源网站使用的相关法律诉讼至关重要。
目前,BitTorrent传播相关的指控是这起自2023年提起的诉讼中仅存的主要争议点。查布里亚法官是否会允许Meta的新论点成立还有待观察。
