出版商起诉Meta侵权训练Llama模型
「五家出版商与作者起诉Meta及CEO扎克伯格,指控其未经授权使用数百万部受版权保护的作品训练Llama AI模型,涉嫌侵权。」
近日,五家知名出版公司与畅销书作家Scott Turow联合对Meta及其首席执行官马克·扎克伯格提起集体诉讼,指控该公司非法使用数百万部受版权保护的作品来训练其AI语言系统Llama。这起诉讼在纽约曼哈顿联邦法院提起,标志着图书界与AI开发者之间持续斗争的新篇章。
原告在诉状中称,Meta和扎克伯格遵循其著名的座右铭“快速行动,打破常规”,通过非法获取大量书籍和期刊文章用于Llama的训练。诉状部分内容指出:“被告未经许可复制和分发数百万部受版权保护的作品,未向作者或出版商提供任何补偿,且完全知晓其行为违反了版权法。扎克伯格本人亲自授权并积极鼓励了这种侵权行为。”
提起诉讼的出版公司包括Elsevier、Cengage、Hachette Book Group、Macmillan和McGraw Hill,这些公司出版的作者包括James Patterson、Donna Tartt、前总统乔·拜登,以及最近获得普利策奖的Yiyun Li和Amanda Vaill。原告方认为,Meta的行为不仅侵犯了版权,还损害了作者和出版商的合法权益。
Meta在周一发表声明,誓言“积极应对这场诉讼”。声明部分内容称:“AI正在为个人和企业带来变革性的创新、生产力和创造力,法院已经正确认定,在受版权保护的材料上训练AI可以构成合理使用。”这一立场与原告方的观点形成鲜明对立。
近年来,多位作者对AI公司提起法律诉讼。2025年,Anthropic同意支付15亿美元,以和解由惊悚小说作家Andrea Bartz和非虚构作家Charles Graeber及Kirk Wallace Johnson发起的集体诉讼。该和解协议的最终批准听证会定于下周举行。这些案例表明,AI训练数据的版权问题已成为业界关注的焦点。
从技术角度看,Llama是Meta开发的大型语言模型,其训练需要海量文本数据。版权法的核心在于平衡创新与原创者权益,而AI训练中“合理使用”的界定一直存在争议。Meta主张其行为属于合理使用,但出版商认为,未经授权大规模复制作品超出了这一范畴。
此案的结果可能对AI行业的未来发展产生深远影响。如果法院裁定Meta侵权,将迫使AI公司在训练模型时更加注重数据来源的合法性,可能推动建立更透明的版权许可机制。反之,如果Meta胜诉,则可能强化“合理使用”原则在AI领域的应用,加速技术迭代。
值得注意的是,扎克伯格被直接点名“亲自授权”侵权行为,这增加了诉讼的戏剧性。作为Meta的决策者,他的个人参与可能使公司面临更高的法律风险。同时,这也反映出AI开发过程中高层管理者的责任问题。
随着AI技术的普及,版权纠纷预计将更加频繁。出版商和作者希望通过法律途径保护自身权益,而科技公司则寻求在创新与合规之间找到平衡。这起诉讼不仅关乎Meta和Llama,更将为整个AI行业的数据使用规范树立标杆。
目前,案件刚刚进入法律程序,双方将围绕“合理使用”的定义、侵权行为的性质以及赔偿金额展开激烈辩论。无论结果如何,这都将成为AI与版权领域的重要判例。
对于开发者而言,此案提醒我们,在构建AI系统时,数据来源的合法性是不可忽视的环节。未来,开源模型或使用明确授权的数据集可能成为更稳妥的选择。同时,行业也需要更清晰的指导原则,以促进AI技术的健康发展。
来源:Heooo AI工具导航