集体诉讼指控：苹果用盗版图书训练 AI 模型，涉嫌大规模侵权

by aogo 发布： 2025年 10月 16日

作者： aogo 发布： 2025年 10月 16日 0 评论 0 分 read

两位美国神经科学家兼作家 Susana Martinez-Conde 与 Stephen Macknik，近日在加利福尼亚北区联邦法院对苹果公司提起集体诉讼，指控苹果在开发人工智能平台 Apple Intelligence 时，未经许可使用盗版图书作为训练数据，侵犯著作权。

诉状称，苹果使用的数据集包含名为 Books3 的资料库，该库收录约 19.6 万本盗版图书，来源于私人追踪网站 Bibliotik，并被纳入苹果的开源模型 OpenELM 的预训练阶段。

原告指出，苹果的相关技术文件与代码库均提及使用 Pile 与 RedPajama 等数据集，而这两者均含有 Books3 内容。

诉状认为，苹果虽在部分阶段获得合法授权，但在“模型核心训练”阶段仍依赖盗版文本，仅在后续微调阶段才引入许可数据。
原告要求法院判令苹果：

该案延续了早前 Bartz诉Anthropic 等案件的争议，即：

“将作品用于AI训练是否属于合理使用？”

无论结果如何，此案预计将影响全球AI企业在数据来源与版权合规上的标准。
对于内容创作者而言，也可能成为维护自身权益的新契机。

AI时代的版权边界正在重新划定。训练数据从“可得”到“可用”，差的不是技术，而是合法性。

信息来源 |

编辑：甬江知道团队微信： yongjiangzhidao

人称老高，在知识产权领域深耕10余年。为人正直，和善，乐于为中国知识产权贡献微薄力量！