温申翔, 赵飞宇, 吴洪健.龙年春节期间,科技行业最大的新闻莫过于SORA了。
OpenAI发布的SORA在**这一代的表现令人惊叹,无需赘述。 我们需要知道的是,SORA标志着AIGC天花板的又一次突破。 这不仅是科技界的事情,也影响着影视、广告等领域的广大从业者。 就像之前 AI 映射对艺术家社区的影响一样。
技术将我们带入了一个“新世界”。 在这一点上,旧的规则已经磨损,还有许多模糊的地方等待着在远处画出来。 比如说,如果我用一个知名导演或者摄影师的风格来生成**,那么这个**的版权应该属于谁呢? 是我? 还是AIGC平台? 还是导演也应该分一杯羹?
各行各业也面临着“旧模式受到影响”的问题——《纽约时报》起诉OpenAI和Microsoft涉嫌使用数百万篇《纽约时报》文章来训练人工智能; 版权图库**Getty Images 指出,Stability AI 已从其图库以及相关标题和元数据中复制了超过 1200 万张图像; 好莱坞编剧罢工,以限制人工智能技术在编剧创作过程中的使用。 这些都是由技术变革引发的**。
然而,工业革命和互联网浪潮带来的变化充分表明,技术变革是不可逆转的。 与其进行残酷的“抵制”,不如划分权力和责任,制定新的规则。 围绕以下三个关键问题,Deep Echo与相关法律专业人士进行了**会议
谁拥有用户使用AIGC平台制作的内容的版权?
版权问题争议的焦点是什么?
利益相关者如何应对变化? 行业生态系统将如何发展?
谁拥有版权必须根据具体情况进行分析AIGC带来了很多便利,即使用户不是专业的画家或摄影师,只要有一定的提示词技术,他就可以“站在巨人的肩膀上”创作专业的内容。 这就提出了一个问题:人工智能生成的内容的版权应该属于谁? 如果发生争议,谁将承担责任?
也有关于类似问题的法律案例。 根据中国“AI文生图1号案”的判决书,原告李云凯出于兴趣学习AI绘画,并于2022年11月开始在社交媒体上发布AI生成的**。 部分自**账号未经许可擅自使用相关**,且无签名**。 李云凯将其中一位自导自强的师傅告上法庭。
作为一名律师,李云凯希望通过司法判决来探索AIGC的边界:用户用AI创作的内容是否“有效”,版权是否属于用户?
判决认为,李云凯使用开源模型Stable Diffusion生成的**是艺术品,李云凯是著作权人,被告擅自使用**并去除**水印,侵犯了李云凯的信息网络传播权和著作权,必须赔偿其500元并发表道歉声明。
必须指出的是,这些先例不能直接适用于所有情况。 晋城通达尼尔律师事务所合伙人米新磊告诉申翔,判断版权归属的依据是人工智能生成内容全过程中人类的智慧和原创性比例,用户的训练越准确,选择性越强,最终获得生成内容版权的可能性就越大。
另一种容易发生侵权纠纷的情况是,当用户使用AI生成某种程式化的**(例如,用宫崎骏风格的模型画一只猫)。 我从法律界人士那里了解到,著作权法不保护风格,在很多法庭判决中,模仿风格并不一定算侵权,所以用户“用宫崎骏风格的模特画猫”一般不构成侵权。
但是,如果用户直接向AI“喂”宫崎骏的图片,并告诉AI以这种方式生成**,则构成侵权。 这是因为用户无权使用宫崎骏的作品。
AIGC平台和用户之间也存在版权所有权问题。 然而,这种冲突只存在于“理论”上,而在实践中,AIGC平台更感兴趣的是“扩大用户规模,赚取更多的会员费”,而不是版权归属问题。 为此,他们甚至愿意为用户支付潜在的诉讼费用。
Microsoft、谷歌、OpenAI等多家公司均承诺,如果用户因使用AIGC产品或其提供的服务而面临第三方侵权索赔,公司同意承担相应的赔偿责任。 以Microsoft为例,2023 年 9 月 7 日,Microsoft出具了 Copilot 版权承诺书,声明如果商业用户因使用 Copilot 或其生成的输出而被第三方起诉侵犯版权,Microsoft将同意为用户辩护并支付由此产生的赔偿。 但是,前提是用户已使用产品内置的防护装置和内容过滤器并遵守其他条款。
平台通过用户协议明确权利和责任的归属,这是减少潜在冲突的一种方式。 OpenAI在其服务条款中明确表示,其补偿条款仅适用于付费用户,包括API用户和ChatGPT企业用户,其余数亿免费用户将不受补偿条款的保护。
争议在于平台和数据源之间在版权纠纷中,用户方的行为往往受到更多的关注,但更核心的冲突其实发生在AIGC平台和数据源之间。
众所周知,AIGC的实施需要经历三个阶段:一是数据收集; 2、模型训练; 3.关键词输入。 数据收集和模型训练是平台开发人员的先行步骤,而内容输入则由用户完成。
如果没有足够的数据来训练和调试模型,就很难构建一个足够智能的生成式 AI 平台。 米新磊告诉申翔,“对于AICG来说,收集大量数据并用它来训练和调试模型是最核心的阶段。 ”
理想情况下,AI模型应该与拥有数据资源的**签订许可协议,向对方支付足够的费用,然后使用对方提供的接口来捕获数据。 但事实是,目前的AI技术发展迅速,但其数据**往往处于“黑匣子”状态,难以判断其合法性。
这就是法律纠纷出现的地方。 像Getty Images这样的画廊,通过出售版权产生**。 如果AIGC平台直接抓取数据,则威胁到版权公司的利益。 同样,新闻**、图书出版商和影视公司的商业模式也建立在版权之上。 对于企业而言,有效管理和利用版权资源可以促进内容变现,提升核心竞争力。 然而,AIGC技术的出现打破了传统版权模式的框架。
问题的核心在于,各方需要想方设法确保AI模型训练数据的合法性,避免侵犯版权或个人隐私。 这有待于《数据安全法》、《个人信息保护法》、《反不正当竞争法》等法律的完善。
在一切都弄清楚之前,从业者可能仍然会因为平台数据源的不确定性而陷入困境。
例如,在商业应用中,一些品牌会尝试用自己的资产来训练专有模型。 原则上,只要品牌培训模型的素材版权属于品牌,专有模型制作的内容就不构成侵权。 然而,在实践中,专有模型是在大模型的基础上训练的,外界很难知道大模型的数据是否合规。
这些问题的解决需要通过法律来完善。 在这个过程中,数据源和AIGC平台将继续发挥作用,新的行业规则也将产生。
诉讼不是最终的,合作是最终的目前,我们已经看到版权模式的受益人与AIGC平台之间的冲突,相关诉讼将不断出现。 但这场冲突与其说是新旧势力之间的激烈对抗,不如说是通往行业新秩序的道路。
AIGC浪潮汹涌澎湃,传统巨头和科技新贵纷纷打官司,更多的是为自己争取一个谈判席位,以“定义行业的未来”。 米心磊认为,随着AIGC的发展,行业各个环节都会形成新的生态,诉讼将促进新的合作。 总体来看,AIGC行业的新规则和合作边界将在发展过程中得到明确。
目前,国内AIGC领域的发展仍处于起步阶段,许多问题尚未完全显现。 相关法律纠纷仍处于公益阶段。 相比之下,由于美国存在较为成熟的AIGC产品,产业生态内部的博弈得到了更多的呈现。
在米看来,Getty Images与《纽约时报》之间的诉讼可能是一场“促谈之战”,目的并不完全是为了在法庭上输赢,而是通过法律行动,让双方在版权使用、数据许可等问题上达成协议,促进平台与内容生产者之间的合作。
这种做法在内容行业并不少见。 一个典型的例子是国内短**平台与长**平台之间的博弈,与其说是长**平台是为了禁止抖音、B站等平台粉丝的“二次创作”行为,不如说是要与短**平台建立合作关系。
在AIGC的法律规定方面,米心磊认为,每个国家的方向依然是“持续优化”,对AIGC的使用提出了一些建议和指导,或者进行了局部调整。 总的来说,AIGC行业的发展仍然受到鼓励。 从业人员应关注数据使用的合法性、个人信息保护、版权问题以及遵守 AIGC 特定的监管要求。 这些区域通常是法律隐患最集中的地方,也是相关部门监管的底层逻辑。
以下为申翔与金诚通达律师事务所合伙人米新磊的部分对话记录:
问:作为一名法律从业者,看这些人工智能生成的内容和普通人关注的问题有什么区别? 您想到的法律风险是什么?
答:我研究版权法已经很久了,我一直在关注这个领域,所以我的第一反应是关于版权内容的合理使用。 因为它的原理是三步走,第一步是做数据采集,收集完数据后,再进行模型训练,根据用户的需求进行训练差不多,然后用户用自己的一个关键词输入,通过关键词不断的调整和优化,最终生成一个产品。
第一步是核心,如果数据在未经(对方)同意的情况下被抓取和收集,那么其实有点灰色地带,因为你的数据比较大,收集的比较广泛,然后揉在一起,如何防止他的侵权?
问:平台开发人员如何确保他们用于训练 AI 模型的数据获得合法授权? 是否有明确的法律规定来保护这种权利和利益?
答:数据是一种非常重要的资产,一般情况下,你应该得到他(对方**)的授权,和他签订授权协议,然后向他支付授权费,然后他可能会给你一个接口,然后让你抓取数据。 但在未公开的情况下,您必须强行获取,或者您必须通过非法手段获取,这可能违反《数据安全法》、《个人信息保护法》或《反不正当竞争法》,以及《民法典》合同部分的相关规定。 所以在这个层面上,其实有一系列的法律法规是可以规范的。 问:未来,随着AIGC的蓬勃发展,每个国家是否会出台法律法规,明确规定你要披露你的数据**? 答:不一定,目前从行业发展的角度来看,AIGC行业的发展普遍受到鼓励,因为它可能是一项革命性的技术。 从各国现行的法律法规来看,我认为他们正在不断优化,或者对一些使用方法提出一些建议和指导,或者进行一些局部调整。 但就总体趋势而言,他没有基本的阻止策略,例如,将数据库限制为开源和数据库披露。 在信息革命时代,数据是核心资产,是战场,不太可能全部进入自由的公共领域。
Q:用户在使用AIGC时应如何保护其版权? 用户是否必须接受它可能因此被其他人传播和使用?
答:如果你把文章放到网上,并不意味着别人可以直接使用,其实现在很多都是在网上发表的,包括一些**也在网上发表的,你不能说是在网上发表的,然后公开别人用它不侵权。 虽然平台会有类似的免责条款,但从法律角度来看,最终还是侵权。 对于用户,我使用其中一些 AIGC 平台来生成相关内容并将其上传到在线,这也是受版权保护的。 问:平台和AIGC用户之间有感兴趣的游戏吗? 例如,谁拥有生成产品的版权? 谁应该为违法行为负责?
答:理论上是可以的,但从实际的角度来看,我认为情况并非如此。
对于平台,他做了一个AIGC工具,是供用户使用的,其目的是商业化的,要么我获得流量,要么我获得用户,然后获得更多的投入,所以他是一个面向服务的机构。 事实上,他并不擅长与用户争夺用户生成产品的版权,这对他来说毫无意义。 从这个角度来看,它们不是对立的,这应该可以明确划分,只要在用户协议中明确,根据你(用户)的调校和培训,最终产品的版权归你所有,如果有任何责任,也是用户的责任。 对于平台来说,更重要的是希望更多的用户使用我的(应用程序),这是从中赚钱,而不是通过生成东西来卖钱。
特别是openai甚至认为,如果用户面临诉讼,我们(平台方)会付钱给你,甚至推出这样的产品,这样用户就不用担心了。 而且,他(平台)也一定想把这种情况降到最低,他们其实在不断优化,以降低最终结果的侵权风险。
问:在人工智能领域,你有没有接触过这样的案例? 答:虽然目前AI在行业中比较流行,但实际上涉及的案例并不多,在国内可能只有三四个左右。 第一起案件是由北京某律师事务所起诉的,而今年开庭审理的“艾文生图第一案”的原告其实是一名律师,所以两起案件都具有几分公益诉讼性质,他们希望通过塑造经典法律案件的形式,在行业规则中起到方向性作用。
如果国外产业的发展比我们领先一点,那么它就会比我们暴露更多的问题。 例如,在国外的一些案件中,原告声称被告抓取数据以训练自己的模型以牟利,同时其生产的产品与原作高度相似,此时起诉的人有两种,第一类是被抓取数据的一方, 例如,2023 年 6 月,大量消费者向旧金山联邦法院提交了一份近 160 页的起诉书,起诉 OpenAI 最受欢迎的 ChatGPT 和 Dall-E 窃取私人信息。被盗信息来自数以亿计的互联网用户,包括儿童,未经用户许可;与此同时,Microsoft Corp.向OpenAI投资了100亿美元)也被列为被告。
第二种是作品的版权,比如作家协会和《纽约时报》,他们直接制作内容,如果他们在这个(AIGC)过程中直接使用了作者书中的一些东西,那么它实际上有点手稿清洗,新闻报道也是如此。 此外,还有美国最大的制片人Getty Images,他们从他那里购买互联网上的文章和新闻报道。 如果能免费抢到现在的AI,然后揉搓给你生成一个新的**,就相当于直接动了它的兴趣。
同时,美国的版权局在审查版权登记方面也应该更加严格,他会问你是怎么生成的,如果你说是AI生成的,就不会注册,这是美国行政层面的态度。
因此,美国的这些诉讼更接近于当前的产业生态博弈。 因为它真的触及了巨头的利益。 美国还将通过案件判决给予司法态度。
从国外的经验来看,他们打官司的目的可能就是为了促成谈判,目的不是说这场官司一定要打,而是说通过打官司,如果你得到我的授权,就相当于你付了我一笔许可费,最后我们建立合作关系。 这有点像前两年国内短**平台和长**平台之争,抖音和B站有很多up主利用电影资源做二次创作,这其实是侵权,所以爱奇艺的长期**平台,包括一些内容制作人和一些老电影公司, 是联合发声,想要起诉或者要求他们支付版权费,其实他们也想在短**平台和长**平台之间建立合作关系。问:未来AIGC相关法律可能的发展趋势是什么?
答:在立法计划中,《人工智能法》草案其实正在起草中,但何时实施尚不明朗。 事实上,立法存在一定滞后,行业仍处于发展过程中,还有很多问题尚未显现。 当行业的未来不明朗时,仓促立法未必是一件好事。
虽然AIGC与人工智能有关,但其本质产生的一些争议是版权、知识产权、数据安全、个人信息保护等。 针对这些,在现有法律框架下,我们也有以前的法律法规,如著作权法、个人信息保护**和数据安全法。 处理它就足够了,但它还没有准备好推出。
我们需要对这些新案件保持谨慎,但这并不意味着我们必须立法以适当的方式构建它们,这将抑制技术的发展。 Q:对于AIGC领域的从业者来说,有哪些相关的法律经验建议可以帮助从业者尽可能规避法律隐患?
答:事实上,较大的风险集中在平台端。
第一个建议是密切关注国内监管部门的政策,尤其是与生成式人工智能相关的法规,这些法规是由六七个部门共同发布的,强度比较大,涉及的监管部门也很多。 一旦监管加强,就不能合规,很容易出现问题。
二是关注合规问题,目前对AIGC有一些具体要求。 比如要求识别AI生成的内容,而且要让大家知道这是AI生成的东西,比如数字人主播等,没有任何提醒,抖音B站等平台上已经有,所以要注意合规风险。 主要关注的是数据方面、个人信息方面和版权方面,这些构成了行业的底层监管逻辑。