37


两位美国神经科学家兼作家 Susana Martinez-Conde 与 Stephen Macknik,近日在加利福尼亚北区联邦法院对苹果公司提起集体诉讼,指控苹果在开发人工智能平台 Apple Intelligence 时,未经许可使用盗版图书作为训练数据,侵犯著作权。
诉状称,苹果使用的数据集包含名为 Books3 的资料库,该库收录约 19.6 万本盗版图书,来源于私人追踪网站 Bibliotik,并被纳入苹果的开源模型 OpenELM 的预训练阶段。
原告指出,苹果的相关技术文件与代码库均提及使用 Pile 与 RedPajama 等数据集,而这两者均含有 Books3 内容。
诉状认为,苹果虽在部分阶段获得合法授权,但在“模型核心训练”阶段仍依赖盗版文本,仅在后续微调阶段才引入许可数据。
原告要求法院判令苹果:
- 停止使用涉嫌侵权的数据;
- 拆除相关AI模型;
- 进行法定赔偿并销毁侵权副本。
该案延续了早前 Bartz诉Anthropic 等案件的争议,即:
“将作品用于AI训练是否属于合理使用?”
无论结果如何,此案预计将影响全球AI企业在数据来源与版权合规上的标准。
对于内容创作者而言,也可能成为维护自身权益的新契机。
AI时代的版权边界正在重新划定。训练数据从“可得”到“可用”,差的不是技术,而是合法性。
信息来源 |
编辑:甬江知道团队 微信: yongjiangzhidao
