据国外**报道,ChatGPT开发商OpenAI近日表示,在开发ChatGPT等人工智能工具时,会使用受版权保护的信息。 如果没有版权保护,这些工具将“不可能”增加价值。 该声明还表示,OpenAI在提交给英国上议院通信和数字大型语言模型特别委员会的文件中做出了具体声明。
《纽约时报》提起版权诉讼,要求 OpenAI 删除所有 GPT 实例
ChatGPT 和图像生成器 Dall-E 等 AI 模型从培训课程中获得功能,其中一些是在未经版权所有者许可的情况下从公共互联网上抓取的大量内容提供的。 OpenAI认为,在其具体应用场景中,部分训练内容是经过授权的。 长期以来,这种自由捕获的方法一直是机器学习领域学术研究的常规做法,但由于最近深度学习和人工智能模型的商业化,它受到了审查。
OpenAI在上议院的一份文件中写道:“由于今天的版权几乎涵盖了所有人类表达方式——包括博客文章、论坛帖子、软件片段和文件——如果不使用受版权保护的材料,就不可能训练出像今天这样尖端的人工智能模型。 ”
此外,OpenAI写道,将训练数据限制在“一个多世纪前创建”的公共领域的书籍和图画中,不会提供“满足当今公民需求”的人工智能系统。
上个月,《纽约时报》对OpenAI和OpenAI的重要投资者Microsoft提起诉讼,指控其在各自的产品中非法使用NYT内容。 OpenAI周一在其**上回应了这起诉讼,称该诉讼缺乏法律依据,并重申其对新闻业以及与新闻机构合作的支持。
OpenAI 的论点是,创建 AI 模型是合理和合法的,并且法律允许在特定情况下未经所有者许可有限地使用受版权保护的内容。 该公司声称,版权法并不禁止使用此类材料来训练人工智能模型。
“使用公开的互联网材料来训练人工智能模型是合理使用,得到了一个长期存在且被广泛接受的先例的支持,”OpenAI周一在一篇博客文章中写道。 “我们相信这一原则对创作者是公平的,对创新者是必要的,对提高人工智能的竞争力至关重要。 ”
OpenAI 驳斥了版权诉讼的主张,称 ChatGPT 的每一个回应都是衍生作品
这不是OpenAI第一次声称合理使用其AI训练数据。 今年 8 月,我们在 ** 报告中也发现了类似的情况,OpenAI 为喜剧演员莎拉·西尔弗曼 (Sarah Silverman) 使用公开可用的材料作为合理使用进行辩护,以回应版权诉讼。
OpenAI声称,该诉讼的作者“误解了版权的范围,没有考虑到限制和例外,包括合理使用,这些限制和例外为人工智能前沿的大型语言模型等创新留下了适当的空间。 ”
原文链接: