随着《生成式人工智能服务管理暂行办法》(下称《办法》)的正式施行,有关生成式人工智能(AIGC)训练数据来源的合规性问题,正从业界延申至公共领域。

近日,因旗下AI绘画产品所生成图片与平台用户原创作品高度相似,小红书遭多位画师发文质疑。8月15日,《办法》施行当天,微博话题#小红书偷用户作品炼自家AI模型#阅读量破880万。

画师们发布停更声明。来源|当事人社交账号

九派财经注意到,目前已有多名画师在该平台声明停更,并表示已发布的内容暂不删除,后续将作为维权证据。

今年以来,AIGC热潮持续在国内外火爆,众多互联网平台纷纷涌入该赛道。然而,在企业、平台众相布局AIGC业务的同时,关于数据采集和应用的规范性问题,却并未引起足够的重视。知识产权如何界定、用户隐私如何保护……《生成式人工智能服务管理暂行办法》的出台,从规则上对AIGC的发展提供了规范和指引,但人工智能领域秩序的建立,却才刚刚起步。

此次画师群起指控画作疑被平台用来“炼丹”,揭示了AIGC发展过程中的问题,也引发了广泛的关注和讨论。

【1】质问:平台偷用户作品炼自家AI模型

8月1日,插画师雪鱼喊话小红书:“你们用我的图喂AI喂得开心吗?”其反映,同样以“夸父追日”为主题进行创作,该平台旗下AI绘画产品Trik生成图片,在色调、元素、风格上,与其原创作品高度相似,细节上却难以推敲创作意图。

雪鱼举例称,为了表现夸父对追逐太阳的执着,自己把恐惧、疲劳等负面情绪具像化成野兽形象,被夸父甩在身后;而Trik生成图片出现了相似的野兽形象,但与夸父站在了一起,缺乏作画逻辑,稍显突兀。“这跟拆分重组有什么区别?”雪鱼质问。

紧随其后,“画画的云淡风轻”“正版青团子”“RedMatcha”等画师,也纷纷晒出自己的原创作品与Trik生成图片的对比图,不论是色调、构图,还是风格、元素都高度相似。“心血!被剽窃了”,怀疑自己被侵犯权益的画师们,纷纷表达自己的愤怒和质疑。

九派财经了解道,Trik为小红书在今年4月推出的AI绘画产品,系该平台布局AIGC的一环。今年7月,Trik开始限时内测,号称专注于中国风图像创作。

针对画师们反映的情况,8月16日,九派财经多次联系小红书询问详情,截至发稿,未获有效回复。

而记者也看见,Trik官方账号“Trik AI”以及同名话题下,目前仍有大量用户抵制的内容,曾被专业作品集网站ArtStation用于反对AI生成图片的口号,充斥平台。一位用户留言道:“没有版权保护和规范行为的AI素材提取,本质就是剽窃,只不过披上了新兴技术的外皮。”

雪鱼认为,目前的AI绘画还只是把大量现有的画作打碎了重新拼接,并不是能够真正自主学习的人工智能,生成的图片存在不合常理或者逻辑错误的地方。雪鱼告诉记者,自己已经联系律师,准备通过法律途径维权。

【2】疑惑:格式条款还是霸王条款

各互联网平台争相入局AIGC,现有大量的用户内容成为训练模型的数据来源。记者翻阅了多个国内头部互联网平台的用户服务协议,对用户上传至平台的内容,不约而同地拿出了类似的格式条款。

例如,此次事件中,被指“霸王条款”的平台《用户服务协议》4.2条规定,“……您授予公司免费的、不可撤销的、非排他的、无地域限制的许可使用,包括:存储、使用、传播、复制、修订、改编、汇编、出版、展示、翻译、表演用户内容或制作派生作品,以已知或日后开发的形式、媒体或技术将内容纳入其它作品……”

在画师们看来,上述条款成为了平台肆意使用其原创作品训练AI的“霸王条款”。

无独有偶。今年3月,网易旗下图片社区LOFTER推出的AI绘画功能因遭用户抵制而下线,彼时关于该功能的争议焦点同样在于,使用用户数据训练AI、侵犯画师知识产权。

那么,平台用户协议足以支撑其无授权使用用户数据训练AI吗?

“实践中,通过用户协议划定权责界限也是行业惯例,但是用户协议的格式条款如何合理规定双方权利义务还存在争议。”北京理工大学法学院助理教授、网络空间国际治理研究基地副研究员裴轶认为,本案例中用户协议的相关条款,可以理解为平台意图获得用户内容的著作权独占性许可,同时平台还通过该格式条款意图获得转授权的权利,并对该转授权限定了“永久、不可撤销”等时间性要求。

裴轶表示,就法律性质而言,用户协议属于格式条款,格式条款需符合《民法典》第四百九十六、四百九十七条的规定。判断互联网平台用户协议的条款内容时,应将条款内容与上述规定进行对应,还要考虑条款是否违反了法律的强制性规定。

“生成式人工智能产品,不仅涉及到版权问题,可能还涉及到个人信息权益。不过,是否会构成对用户权利的不当限制,难以一以概之,还需要进行个案判断。 ”裴轶说。

【3】讨论:AIGC训练数据来源的界限在哪

一边是AIGC的发展,一边是用户内容的保护。训练数据来源的合规性问题,是AIGC发展过程中绕不开的命题。

8月15日正式施行的《生成式人工智能服务管理暂行办法》明确规定,AIGC服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权。

但是,“著作权人相较于平台往往面临全盘接受或全盘放弃的用户规则,这有可能会涉及到著作权人是否实现了契约自由;同时其往往是免费授权的,其著作权的财产性权利也会面临冲击。”裴轶说。

在她看来,企业建立AI训练数据库时,需确定数据的所有权和许可使用权,保证透明的数据收集和处理,明确告知数据主体数据收集和处理的目的,并获取必要的同意或授权。同时,还应实施适当的数据安全和隐私保护措施,确保数据的机密性和完整性。

具体到司法实践中,裴轶建议,需充分依据现有的相关法律规定,在具体案件中结合个案事实,合理界定双方权利、义务,坚持“科技伦理”以及“国家安全”两个不容让渡的底线。在底线范围内,可以尽量给与产业宽容的发展空间,兼顾算法的创新和推动技术的发展,同时保护公众利益、尊重隐私权和维护道德和伦理原则。

九派财经记者 黄依婷

编辑 郭梓昊

【来源:九派新闻】

声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注