10月23日星一名前OpenAI员工在其个人网站上发表了一篇文章,指出OpenAI正在违反美国版权法。该前员工苏奇尔·巴拉吉(Suchir Balaji)在发布这篇试图揭露ChatGPT在使用版权材料进行训练后,其输出中出现了多少版权材料的博文后,接受了《纽约时报》的采访。
在巴拉吉的分析中,这位前OpenAI员工表示:
虽然生成模型很少产生与其任何训练输入实质上相似的输出,但训练生成模型的过程涉及对版权数据进行复制。如果这些复制是未经授权的,那么根据模型的具体使用是否构成“合理使用”,这可能被视为版权侵权。由于合理使用是根据每个案例的具体情况来确定的,因此无法就生成式人工智能何时符合合理使用作出广义的论断。不过,我将为ChatGPT使用其训练数据提供具体分析,而同样的基本模板也适用于许多其他生成式人工智能产品。
ChatGPT与合理使用
1976年《版权法》第107条对合理使用进行了定义,我将在下文逐字引用:
“尽管有第106条和第106A条的规定,但对版权作品的合理使用,包括通过复制品或录音制品或该条规定的任何其他方式进行的复制,如用于批评、评论、新闻报道、教学(包括课堂使用的多份复制品)、学术或研究等目的,并不构成对版权的侵犯。在判断任何特定情况下对作品的使用是否为合理使用时,应考虑的因素包括:
- 使用的目的和性质,包括这种使用是否具有商业性质或是为了非营利的教育目的;
- 版权作品的性质;
- 使用的部分与版权作品整体相比的数量和重要性;以及
- 使用对版权作品潜在市场或价值的影响。
作品未发表这一事实本身,如果考虑到所有上述因素后作出合理使用的认定,则不应妨碍该认定的成立。
合理使用是一个平衡测试,需要权衡所有这四个因素。在实践中,因素(4)和(1)往往最为重要,因此我将首先讨论它们。因素(2)往往最不重要,我将在之后简要讨论。因素(3)在完全普遍性的情况下回答起来有些技术性,因此我将最后讨论它。”
信息来源 |
编辑:甬江知道团队 微信: yongjiangzhidao