董慧娟 魏荣豪 | 论人工智能风格迁移输出物的法律属性及其归属——以吉卜力风格为例


董慧娟 | 厦门大学知识产权研究院教授、博士生导师
魏荣豪 | 厦门大学知识产权研究院硕士生
目次
一、问题的提出
二、风格迁移的定义、特性以及输出物的分类
三、风格迁移过程中的用户行为及其法律评价
四、确定输出物相关权益归属的正当性与可能性
五、结语
“摘要:以吉卜力为代表的风格迁移类AI模型风靡一时,其“一键生成”的输出物属于人工智能生成内容(AIGC)。鉴于AIGC的可版权问题素有争议,有必要加强对输出物法律属性及归属的探讨。模型用户的操作因缺乏创作空间且未能直接控制或影响表达要素,一般不宜定性为“创作”。吉卜力等风格迁移模型输出物并非“作品”,难以凭借赋权逻辑由模型用户享有版权,但这并不意味着社会公众能任意、无偿使用他人利用模型输出之物。AI输出物作为可能具有某种经济价值与效用之物,法律应对其属性及归属作出妥善安排。具体适用上,应按以下规则依次安排:首先应遵循约定优先原则,输出物的归属可依约定;其次在无约定或约定不明时,对于有可识别的强映射关系的输出物,可视为衍生品,一般由素材相关权利人享有,模型用户须获得授权后才有权对输出物进行使用、收益; 对不具有可识别的映射关系的,输出物的使用、收益权等原则上由用户享有。关键词:风格迁移;输出物;版权
一问题的提出
近年来,Open AI在其产品ChatGPT中上线风格迁移功能,即用户上传的图片能被转化为特定风格的新图片,如将图片转化为日本吉卜力工作室画风的图片。相关数据显示,ChatGPT模型更新当周,其应用下载量、活跃用户数和应用内订阅收入均达到了历史新高。[1]在上海温哥华电影学院专家徐一然看来,AI吉卜力画风是对吉卜力创作的一种“致敬”,AI的加入对动画创作而言有积极意义,“它指出了日漫画风的一种新的创作方式——用绿幕进行真人拍摄,然后用AI制作滤镜和背景合成,相信很快就会有人做出工具。”[2]可见,风格迁移技术将会深刻变革动漫产业以及有关内容产业的生产模式,相关法律问题值得关注。
事实上,风格迁移模型与抖音公司的“变身动漫特效模型”产品有一定的相似之处,均为“图生图”AI模型,且该类“图生图”AI模型的技术机理与一般“文生图”AI模型有所不同。前者表现为风格迁移模型在用户投入的素材(如图片)的基础上生成新图片,后者是用户通过向AI模型输入提示词等方式从无到有地生成图片,相关素材(输入物)并不由用户提供、而是完全依赖于模型本身。尽管两者在素材来源方面存在差异,但究其本质,风格迁移模型生成的输出物仍然可归入一类AIGC,随着相关AI工具应用的普及,如何妥善安排其权益归属,亟待思考与解决。
风格迁移输出物尽管具有“作品”的外观,且呈现出与写实照片不同的吉卜力风格特点,但若干关键问题仍存疑,如使用模型产品(如app软件)的用户是否应被认定为版权法意义上的“作者”?用户是否实施了创作或表达行为?风格迁移输出物是否应被认定为新作品,其与输入物(图片或照片)之间是何关系?
对AIGC是否应被认定为作品、提供版权保护这一问题,学界素有分歧,主要可分为肯定说、否定说与折中说三种观点:肯定说试图从结果主义或外观主义的立场,认为只要“人机协同”创作物的外观与传统人类作品一样,便可获得版权保护[3];否定说坚持所有“人机协同”创作物都只是机器运行算法的产物,人类输入提示词(指令)、修改参数、选择模型等行为并非“创作”,更无版权保护的必要[4];折中说则认为应当以AIGC中蕴含的人类贡献为标准对“人机协同”创作物进行区分保护。[5]
笔者认为,应采折中说立场,对AIGC实行有条件的“区分保护”和“有限保护”。这是因为,AI生成物的可版权性问题不应一概而论,不同模型、不同算法、不同的人机共生场景下生成的AIGC中蕴含的人类贡献的质与量可能存在较大差异。
以吉卜力风格模型为例,其直接生成的输出物是一种特殊的AIGC,一般不宜被认定为新作品,用户也并非输出物的作者;当然,若用户对直接生成的输出物作了实质性修改,即对输出物的表达要素施加重要影响,且修改能被人类轻易识别,可能会构成对用户已施加控制或影响的“表达”赋予有限保护这一例外情形。一方面,风格迁移过程类似于“文生图”中的“单回合”生成模式,是模型自动生成的过程,模型并未为用户就最终生成物的表达要素(尤其是个性化、关键性或独特性表达要素)预留直接控制、决定或影响的“创作空间”;另一方面,用户的简单操作步骤在性质上也并非“创作”,不属于版权法所应当保护或提供激励机制的人类智力劳动,而是普通的机械式劳动。在风格迁移瞬间生成输出物的过程中,用户无需付出实质性的智力劳动,也无需实施决定或影响最终具体表达要素的“创作”行为,仅需事先简易操作、设置好参数,甚至也可直接使用默认参数、无须设置或修改。
那么,在确立上述一般规则与例外规则的前提下,风格迁移输出物能否被公众免费使用呢?用户是否应享有某种权益,如使用权、收益权呢?笔者认为,除非用户授权同意,风格迁移输出物一般不能被他人直接免费使用,用户可能享有对该成果的使用、收益等权益,毕竟是用户将素材输入了模型并生成了吉卜力风格的图片(输出物)。如果输出物受市场青睐、经济价值高且能带来经济收益,如现实中风景画或人物肖像的输出物,若不赋予用户从相关劳动成果中获益的权利、反而允许他人免费使用该输入物,将有悖于“劳有所得”的朴素观念,也不利于促进AI产业技术研发与应用。当然,若输入的素材本身是不受版权法保护的免费公共资源,或许应另当别论。
也许有学者认为,因风格迁移操作十分简单,少量投入便可产生海量的风格迁移输出物,故无需法律的激励或保护。但美国著名法官霍姆斯法曾指出,由那些只受过法律训练的人来判断美术作品的价值是危险的[6],风格迁移输出物的价值应当交由市场判断,法律的任务是前瞻性安排其归属以避免产生纠纷或者提供纠纷解决规则与机制,即对输出物可能的潜在收益权等权益之归属确立明确的规则,为后续正常交易扫清障碍。
为便于展开讨论,首先需说明本文讨论的前提在于,模型的用户已经合法取得了素材(即输入物,如明星照片等)的所有权、版权或者从事特定行为(如使用、收益等)的授权,不涉及任何素材来源非法的情形。当用户利用合法取得的素材进行风格迁移操作时,用户的劳动及其成果之上的相关权益,是否应获得某 种保护呢?同时,风格迁移过程建立于素材的基础之上,用户并不当然凭借其操作(劳动)而享有对输出物的相关权益,因为其他权利人也可能基于其对素材的版权或肖像权等主张自己对输出物的权益。那么,究竟谁应享有对输出物的相关权益呢?当模型输出物作为有经济价值和美感的数字产品而上市交易时,需要有明确的相关规则。
二 风格迁移的定义、特性以及输出物的分类
(一)风格迁移的定义
从技术原理看,风格迁移并非简单的滤镜叠加,而是一种基于深度学习的图像迁移方法,利用卷积神经网络将图像的内容抽象特征表示和风格抽象特征表示进行分离,并通过独立处理这些高层抽象特征表示,有效地实现图像风格迁移,因而能获得非常可观的艺术效果。[7]具言之,模型通过卷积神经网络的边缘检测能力,提取用户输入图像的边缘轮廓特征后,使此类特征与提取的风格特征——吉卜力画风的笔触方向、色彩分布规律、纹理颗粒度等——进行重构,进而生成一幅以原有图像结构为基础、但又融合了新风格的新图像(见图1)。

图1-吉卜力风格迁移对照图
来源:笔者利用ChatGPT自带的风格迁移功能生成
(左图为原图,右图为对照图)
图1为笔者利用ChatGPT自带的风格迁移模型,将爱因斯坦的照片进行吉卜力风格重绘,生成了一幅经吉卜力风格迁移处理的对照图。在风格迁移过程中,模型首先提取了原照片中的结构特征,如外貌轮廓、发型纹理、衣着形状、色彩分布、画面整体构图等,再将上述特征转化为吉卜力风格的卡通化特征,例如将真实的皱纹、皮肤质感变成手绘感的线条与色块,将眼睛从写实形态转变为吉卜力风格的独具标志性的圆润感和带有故事感的卡通眼。
(二)风格迁移模型与生成过程的特点
风格迁移的“图生图”模型不同于传统的“文生图”模型,后者是根据用户提示词随机生成一幅图像,前者是将用户上传的图片根据特定风格进行视觉重构,既保留了原图的核心轮廓与内容骨架,又让特定风格的特有笔触纹理、色彩或光影自然渗透进画面的肌理。
可见,在生成逻辑上,“图生图”模型与“文生图”模型相比,除输入物形态不同外,其特殊性还在于输出物与输入素材之间的承继性映射关系与统一风格化。风格迁移模型将对用户输入的素材,依循特定算法进行风格迁移的变换,因此素材的表达(线条、结构等)将对输出物的表达产生约束与影响,使素材相关权利人具有了参与输出物相关权益分配的正当性与可能性。这种关系也使得输出物生成过程并不太受模型用户具体操作的掌控及其影响,因为用户可调整的空间非常有限,更多地会将其归因于且也应当归因于模型算法的自动生成及导出。
(三)风格迁移输出物的分类
风格迁移技术以“保留结构、重塑风格”为核心机理,意味着它并非脱离原始素材凭空生成具有特定风格的图片,而是先精准捕捉并提取输入物中构成整体框架、关键特征的结构信息,再将其映射至输出物中。正因如此,风格迁移技术决定了输出物与输入物之间存在某种映射关系,若风格迁移的算法不同,具体映射关系也将不同。同时,如果不同风格迁移模型的应用场景不同,权重、参数等不同,对输入物结构特征的捕捉精准度等也将有所不同,从而使输出物与输入物之间的映射关系呈现出或大或小的差异。
这种差异,结合自然人肖像权中“可识别性”因素的核心判断逻辑与标准,即某形象能否令社会一般公众产生联想进而将其与特定对象关联起来,可将输出物分为以下两类:
第一类是输出物与输入物在图片结构上具有客观可识别的映射或对应关系。这类输出物的模型的应用场景要求在保留原作精髓的基础上赋予其新风格,因此需要细致地提取出输入物中的人物面部轮廓、五官比例、肢体动作,甚至背景中标志性物体的位置等结构信息,并将其稳定、精确地映射至输出物中。此时,输出物虽经油画、漫画等不同艺术风格的重绘,但社会公众一般仍能通过被精确映射至输出物上的结构,识别出输入物与输出物之间的客观内在联系。如在数字绘画创作中,设计师使用这类模型将写真风格的人像转化为油画风格时,模型会确保人物的眉眼间距、发型轮廓、佩戴的独特饰品等关键结构或表达性要素不被风格重绘所掩盖,即便输出物有厚重的油彩质感,公众也能一眼认出,它是由原始写真转化而来的。图2便是精确保留输入物结构、构图后生成的输出物。对输入物而言,输出物的具体表达在总体感觉上与输入物明显有对应或依赖关系,因为输入物的影子、轮廓、痕迹、总体结构等已深深嵌入输出物中,可将输出物视为由模型变换而来的、输入物的一种衍生品。

图2 具有可识别性映射关系风格迁移对比图
第二类是输出物与输入物之间在整体构图等方面不具有客观上可识别的映射或对应关系。这类输出物更多是由面向大众娱乐、快速生成的风格迁移模型生成的,其应用场景更强调风格的趣味性与创新性,对保留输入物构图方面的需求较低,一般不要求对输入物的结构等予以保留或建立对应关系,而是提炼输入物的整体氛围、情感基调等抽象元素(风格),因此素材中被映射到输出物中的构图等元素已所剩无几,二者仅存有较抽象、模糊的关联性。此时,社会公众难以通过输出物本身识别出其与输入物之间的关联。例如,当用户将一幅自己在樱花树下的照片输入至这类模型中,欲生成“水彩写意风”作品时,模型可能仅借鉴照片中“人与花树共存”的意境,而输出物中的人物可能被虚化了,樱花树也将化为几抹粉色色块,公众很难从输出物中辨识出其与原素材相类似或相对应的结构、构图等表达性要素或特征。
图3所呈现的即是利用一款名为IP-Adater模型进行风格迁移操作所生成的这类输出物和输入物之间的关系。其生成过程为:在输入《蒙娜丽莎的微笑》和《星空》这两幅经典画作后,模型仅是大致上提取《蒙娜丽莎的微笑》中的人物构图要素,并参考《星空》的风格要素,最终形成图3 右侧的输出物。从图3可看出,输出物所呈现的人像与输入物中的人像无法形成一种映射关系,不具有可识别性。由此可见,当素材本身涉及人物肖像时,若输出物缺乏人类可识别的、与素材对应的构图方面的映射关系,社会公众将很难从输出物中识别出该人物的形象,这种可识别性的缺失导致其通常不会被视为原素材中肖像的再现,而更可能被视为与素材无依存或对应关系的独立性表达。
从本质上看,不同风格迁移模型在输入与输出的映射关系上的差异,是技术服务于不同场景需求的结果。但究竟是哪种映射关系或输出类型,判断关键仍在于“普通社会公众的识别能力”。这一差异可能直接影响对输出物性质的判定。对具有可识别性的输出物而言,从外观和直观视觉感受上能识别输入物与输出物之间的勾连与承继关系,故很可能被认定为是对原素材的演绎或改编之结果;反之,不具有可识别性、对应关系的输出物,则很难作如此认定。
图3 不具有可识别性映射关系风格迁移对比图[8]
三 风格迁移过程中的用户行为及其法律评价
(一)事实层面的用户行为
法律评价的目光往往流转于“事实”与“规范”之间,而在具体的规范适用过程中,首先需要判断用户实施了何种客观行为,嗣后才能判断其能否被规范所涵摄。用户在风格迁移过程中需要进行法律评价的行为,实际上是用户在风格迁移过程中投入的、将影响最终输出结果的“劳动”,可体现为以下三方面:内容图像和风格图像的提供、模型的选择、构图与风格权重参数及权重类型的调整。
1.内容图像和风格图像的提供
在风格迁移过程中,提供内容图像和风格图像的行为,与“文生图”模型生成图像过程中输入提示词的行为类似,都将对输出内容产生影响,但二者在效果上存在区别。在控制程度上,内容图像和风格图像对输出物的控制程度,一般要比提示词控制程度更大;以图1中的爱因斯坦人物为例,在未改动其他参数的情况下,输出物中的人物在画面中的位置、人物与整体画面的比例、人物轮廓、背景环境等各结构要素,与输入物中的相关结构要素呈现出一定的相似性、对应性或关联性。
2.模型的选择
模型的选择也是由用户作出的,而且是影响输出物呈现的又一重要因素。例如,腾讯发布的IP-Adater模型共有17个,各模型之间的区别在于,有的模型输出结果更注重对脸部特征的参考,因此身体或背景部分很可能与内容图像中相应部分的结构不一致,而有的模型参考的是整幅图片或照片。因此,用户往往会根据自己需要的应用场景选择更能匹配场景需求的模型,而不同选择又将影响输出物的最终呈现效果。
3.构图与风格权重参数及权重类型的调整
仍以IP-Adapter模型为例,用户可以调整模型中的各种权重参数,这些权重、参数的不同也会导致最终输出图像的不同。以对输出结果影响最大的构图和风格权重(weight)为例,该权重数值越大,作为输出结果的融合图像(输出物)与参考图像(输入物)之间的相似度就越大,AI随机发挥的空间和可能就越小,反之,AI随机发挥的空间越大。当该权重(weight)数值设为0.1时,IP-Adapter模型的输出结果与输入的参考图像在内容和风格上差异极大;而当该权重(weight)数值设置为1或接近1时,输出结果与输入的参考图像将呈现出高度的一致性。
事实上,模型用户除了能通过构图、风格权重、参数等对输入物与输出物的相似或对应程度施加控制或影响外,还可以通过调整特定类型的权重来控制、影响输出物在生成过程中构图、风格权重的数值是否变化,以及呈现何种变化趋势,例如,Linear(线性)权重类型表示整个生成过程中构图和风格权重不变;Ease In(渐强)权重类型表示整个生成过程中构图和风格权重由低到高;Ease Out(缓出)权重类型表示开始时输入物的风格与构图具有很强的影响力,但会逐渐减弱。此外,还存在对应其他效果的权重类型,囿于篇幅,在此不一一列举。
(二)用户行为的性质与法律评价
用户的行为一般不属于严格意义上的“创作”。尽管用户对内容图像及风格图像等输入物的选择、模型选择、参数及权重选择都将对输出结果产生影响,但这并非“创作”行为,不是版权法上的创造性智力活动。
首先,用户的操作不具有创作的空间。有学者认为,“一种劳动要产生作品,该劳动过程必须给劳动者留下智力创作空间,否则,由此获得的结果不可能符合独创性的要求。”[9]若劳动过程中创作空间有限,意味着人类难以将自身意志(包括创作意图)通过施加控制融入输出成果的具体表达中,创作者的个性无法得到张扬,相反,创作者不得不令自己的意志屈从于既定的算法执行过程。例如,最高人民法院认为,“根据客观数据通过使用WPS制表工具制作完成的曲线图符合独立完成的要件,但该结果的表现形式有限,缺少差异性,通常被排除在独创性之外,不构成著作权意义上的作品。”[10]因此,预留一定的创作空间,供人类创作者施加控制,是创作行为的前提条件。
在风格迁移过程中,不同用户向同一个风格迁移模型输入相同素材,在参数特定(不变)的情况下很有可能生成相同或相似的输出物。在直接生成的过程中,除用户的参数设定行为外,几乎难以找到能体现人类创作空间或创作意图的动作,也难觅通过人类影响成果中具体表达要素的踪迹或证据。从司法实践来看,在我国首例涉及特效模型的典型案件“抖音诉B612特效模型案”[11]中,B612模型即是一种能将用户拍摄的画面转化为特定动漫风格的风格迁移模型,法院认为,模型从输入物到输出物的生成过程并非人类创作行为,“著作权法意义下的创作行为既不能是单纯积累素材、数据、创造生成工具的行为,也不能是按照既定的规则机械地完成一种工作,缺乏创作空间的行为。用户启动变身漫画特效并拍摄的行为属于为生成过程提供被转化内容的活动,变身漫画成像生成阶段真人与成像效果存在唯一或有限的对应性,无法体现自然人的思想、情感和个性。”
其次,用户行为缺乏创作所要求的对表达性要素的决定与控制力。尽管与单回合的“文生图”工作流程(“指令-生成”,不涉及之后可能发生的多次人类修改)相比,风格迁移“图生图”工作流程中用户控制性似乎有所提升,但二者并无本质区别,用户与AI的关系为:用户通过“文字”(提示词)或“图片”(提示词)向AI传递人类的“思想”,或输入素材(如吉卜力风格迁移中),AI再通过算法将思想具象化为某种“表达”,或者将素材进行风格迁移的转化。AI接收“思想”后输出“表达”,与输入素材后直接输出指定风格的图片,都不是版权法上的人类“创作”——“直接产生文学、艺术和科学作品的智力活动”,因为创作应当是人类的行为,在法律视野中上述AI直接输出行为,理应被评价为类似于机器被投入物料后自动运转输出成品的生产过程。用户单纯的、单回合地输入“文字”或“图片”(提示词)的行为,可以被视为提供素材或“定制信息”,但离“创作”尚有不小距离;毕竟,我国著作权法规定,“为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作”等都不属于创作。[12]
当然,应当承认可能有例外——特定情况下有赋予模型用户一定范围内、有限的版权保护的可能性与正当性。例如,当输入物为美术或摄影作品时,用户在一键生成后若对输出物作出能对具体表达要素产生实质性影响的修改,包括但不限于对输出物的局部修改,或对整体构图或要素布局、结构的修改等,此时用户很可能应获得一定范围内的版权保护。不过,经由人类控制的修改后形成的成果,已经不再是所谓的模型直接输出物了。
四 确定输出物相关权益归属的正当性与可能性
用户将素材导入模型后直接生成输出物的行为,一般不宜被认定为人类的 “创作”行为,这意味着风格迁移后直接生成的输出物并非用户的“作品”。那么,这是否意味着,用户在导入或输入素材后得到的输出物即属于公共领域的免费物体,任何人均可免费使用呢?当我们将目光从版权法移开,放眼更广阔的领域时,不难发现,答案似乎是“未必”。
尽管用户不享有版权,但是并不意味着其他社会公众可以任意无偿使用输出物。作为有可能具有经济价值与效用的物,输出物相关权益归属有必要在法律上作出妥善安排。在具体适用方面,应充分考虑素材的来源是否合法、是否涉及肖像权或版权等原始权利人的权益。
首先,原则上应遵循约定优先原则,输出物的归属可依约定;其次,在无约定或约定不明时,可依素材与输出物之间关系的不同分为两类进行判定:对于有“可识别性”映射关系的输出物,可视为素材(输入物)的衍生品或派生物,一般应由素材(输入物)的相关权利人享有,模型用户在获得该权利人授权后有权对输出物进行使用等行为,但取决并受限于其授权范围;反之,不具有“可识别性”映射关系的,输出物相关权益(如使用、收益权等)原则上可由风格迁移模型(即AI工具)的用户享有,由其对该劳动成果享有相关权益.
应当承认,风格迁移输出物在客观上通常具有“作品”的外观,但版权法对人类“创作”的要求成为一道门槛,将此类生成物排除在可版权的“作品”之外。然而,生成物若具有潜在市场价值,法律需明确此类特殊物相关权益的归属,这显然已落入“民事财产关系”的调整范围,但法律对该问题的沉默构成一种典型的“开放漏洞”[13]。拉伦茨指出,“当而且只当法律对其规整范围中的特定案件类型缺乏适当的规则,换言之,对此保持‘沉默’时,才有法律漏洞可言”[14],法律漏洞是一种法律“违反计划的不圆满性”,因此法律漏洞的填补需以“法律规整的计划”为基础,当某一社会关系未被特定法律部门明确规制,但属于法律“应调整的范围”时,若能找到相近的法律规范,即可通过类推完成续造。
而对风格迁移输出物而言,我们似乎可以从民法典中寻找能类推适用的法律规范。具体表现在两方面:其一,用户的操作不属于“创作”,版权法无法为输出物的归属提供规则或规范指引;其二,风格迁移输出物不一定应进入公有领域,任由社会公众免费、自由使用。
1.版权法无法为风格迁移输出物提供版权保护
首先,版权法无法为风格迁移输出物提供版权保护。AI生成物能给人们带来经济利益,因此意图将其拨归私有的财产化倾向或许不可避免(即使不是版权,也可能会是其他权益),需要考虑的不是能否赋权、而是为何以及如何赋权。[15]作为一类特殊的人工智能生成物,风格迁移输出物的财产化倾向,恰是版权法未明确规整但需法律回应的“不圆满状态”。版权法是现有实定法体系内调整作品这一特定无形物的版权人与使用者之间社会关系的法律,风格迁移输出物作为一类具备经济价值和作品外观的无形物,本应由版权法调整相关社会关系,但风格迁移输出物只在客观上满足作品的独创性要件,而不满足“智力成果”要件[16],即风格迁移输出物并非人类付出创造性智力劳动后直接得到的作品。这意味着风格迁移输出物无法凭借“作者—创作—作品”的赋权逻辑,经由版权法的强制性定分规范[17]将其版权归属于相关用户。
其次,风格迁移输出物不宜进入公有领域。也许有人认为,即使风格迁移输出物不是作品也无需保护,应任由其进入公有领域。但是,基于以下理由,风格迁移输出物可能不宜进入公有领域:其一,洛克的劳动赋权论将财产拨归私有的正当性建立在劳动者所投入的劳动上,“劳动使它们同公共的东西有所区别,劳动在万物之母的自然所已完成的作业上面加上了一些东西,这样,它们就成为他的私有的权利了。”[18]风格迁移输出物凝聚着用户的劳动,因此用户对其享有收益权具有正当性,若将其直接归入公有领域,可能造成对用户及输入物(素材的)版权人的不公平结果。其二,从产业发展角度讲,风格迁移作为一种能有效赋能内容生产的技术手段,其输出物若进入公有领域,可能会打击产业内相关主体经由有偿授权获得相关物料(素材、输入物)的积极性,从而阻碍产业发展。
财产权法律制度的发展逻辑表明,人们在哪里能够从文学艺术作品中获得享受和价值,就应当把财产权扩展到哪里,若不对此赋予财产权就会剥夺生产者获得关于消费者偏好的信号。[19]以动漫产业为例,当动漫企业投入人力、物力,利用风格迁移技术对输入物进行加工,得到符合市场需求的风格化输出物后,若这些输出物被归入公有领域后、其他人被允许随意使用,那么该企业前期的投入就难以通过输出物的商业利用获得回报。长此以往,动漫企业自然会减少在风格迁移上的投入,这不仅会让动漫产业失去高效的内容生产手段,还可能挫伤其利用AI技术赋能内容生产的积极性与主动性。
2.不同情景下风格迁移输出物的归属
在设计风格迁移输出物相关权益归属的制度时,首先应遵循约定优先原则。具体到风格迁移的场景下,素材提供者有可能是素材的所有权人、版权人、抑或是肖像权人,构成了有可能能对输出物主张使用或收益权的当然主体,而另一方当事人则是模型的用户,即指利用风格迁移模型进行操作或劳动的用户。
(1)情景一:风格迁移输出物相关权益归属于素材的权利人
素材权利人可能基于以下几种理由取得对风格迁移输出物的使用、收益等物权。此种权利人很可能是素材中的人物自己,故其享有肖像权,同时还有可能是素材的版权人。 首先,若素材权利人与风格迁移模型的用户事先有签订合同,约定由素材权利人享有对风格迁移输出物的权利时,素材权利人根据合同取得对风格迁移输出物的权利。其次,当素材权利人与风格迁移模型的用户事先未签订合同,若风格迁移输出物具有可识别性的“映射关系”,此时也由素材的权利人享有对输出物的权利。理由如下:在无合同约定时,原则上应当由素材的权利人取得生成的输出物的相关权益(含使用权等)。对具有可识别映射关系的输出物而言,其保留了输入物的基本结构表达,而输入物的结构表达源于输入物版权人的贡献。我们再看用户的贡献,用户主要是通过风格迁移模型实施了例如风格图片、结构图片选择以及参数调整等行为。这虽然改变了输入物的风格,为输出物增加了新的价值,但是输出物的价值大部分仍然是由输出物所保留的输入物的元素所决定。此时输出物中大部分贡献来自于输入物本身,故应当受制于输入物的版权人;倘若从输出物中能轻松识别,该输出物使用了人物肖像素材、且与输入物之间存在映射关系、有可识别性,则输出物相关权益行使需要取得的授权,这是用户有权对输出物进行使用、收益的前提。可见,由素材的权利人来支配输出物的使用权、收益权等,是具有充分正当性的。此外,我国著作权法虽规定演绎作品著作权归实施演绎行为的人享有,但也尊重保留在演绎作品中的原作品权利人的智力劳动,规定演绎作品的权利人“行使著作权时不得侵犯原作品的著作权”[20]。同理,在具有可识别的映射关系的输出物中,由于延续了素材(输入物)版权人的创造性智力劳动,作为“演绎性”衍生品而存在的输出物,在用户就输出物进行使用或收益时,原作品版权人的权益也应当受到尊重;否则,若完全否定素材的版权人对输出物使用、收益等相关权益的控制或话语权,显然是不符合公平理念的。
(2)情景二:风格迁移模型的用户享有对风格迁移输出物的使用、收益等相关权益
风格迁移模型的用户可能基于以下几种理由取得对风格迁移输出物的使用、收益等权益。
首先,若素材相关权利人与风格迁移模型的用户事先已签订合同,由风格迁移模型的用户享有对输出物的权利时,风格迁移模型的用户根据合同取得对风格迁移输出物的使用、收益权等。
其次,若素材相关权利人与风格迁移模型的用户事先并未签订合同,而且属于不具有可识别性映射关系的输出物,则此时应由风格迁移模型的用户享有对输出物的使用、收益等权益。因为,素材相关权利人主张对不具有可识别性映射关系的风格迁移输出物的控制权,显然在正当性基础上是欠缺的。此时,输出物与输入物之间并不存在可识别性的映射关系,风格迁移过程中输出物并未承继输入物的结构表达,而是一种对输入物“思想”层面的借鉴。因此,社会一般公众已然无法在输出物中识别来自于输入物的表达性元素,这意味着输出物体现的审美价值绝大部分来源于风格迁移过程。换言之,“不具有可识别性的输出物”作为新的输出物,其价值绝大部分来源于作为人类用户的贡献,而非输入物版权人的贡献。用户的贡献构成输出物价值核心,理应由用户取得对风格迁移输出物的使用、收益权等。
最后,还有一种特殊情况——当素材相关权利人与风格迁移模型用户发生主体混同(同一)时,素材权利人(也即用户)利用风格迁移模型改变素材的风格,此时,无论输入物输出物之间是否具有可识别的映射关系,都由用户取得对风格迁移输出物的使用、收益权。
五 结语
在历史发展的长河中,新兴技术的发展往往会催生法律制定时未能预见的社会现象或新生事物,但法律往往具有滞后性,不会立刻启动修法程序以应对。相反,应当在明确技术原理的前提下,透过法律的滤镜剖析技术实现过程,将技术事实转化为法律事实,之后在法律体系内寻求适配的法律规范,作出法律评价以及权利、义务、责任等方面的安排。本文探讨的风格迁移输出物的法律定位与定性问题,便是在探究风格迁移技术原理的基础上,对模型用户的事实行为进行分析,以著作权法对“创作”行为的标准观之,可得出结论,直接输出物一般不宜被视为构成著作权法意义上的“作品”。对输出物的使用、收益权,原则上可根据民法典中相关法律制度与规则,如约定优先、在先权益保护等,优先并妥善适用类推制度,作出适当的法律安排。
*注:本文部分图片来源于版权人,仅用于学术研究目的。在此特向所有被引用文献或被使用图片的版权人致谢!为便于阅读,所有脚注已省略。请见谅!*拟载于《西南交通大学学报(社会科学版)》2026年(刊期待定),中国知网2026年1月12日网络首发
参考文献(上下滑动阅览)
【1】沈钦韩:《AI“吉卜力风”狂欢的背后》,载《文汇报》,2025年4月7日,https://www.toutiao.com/article/7490373249415954970/?upstream_biz=doubao&source=m_redirect。
【2】钟菡、张熠:《AI生成吉卜力画风,算不算侵权?》,载《解放日报》,2025年4月1日,第7版。
【3】徐小奔:《论人工智能生成内容的著作权法平等保护》,载《中国法学》2024年第1期,第166-185页。
【4】丛立先:《人工智能生成内容的可版权性与版权归属》,载《中国出版》2019年第1期,第13页。
【5】黄汇、黄杰:《人工智能生成物被视为作品保护的合理性》,载《江西社会科学》2019年第2期,第33-42+254页。
【6】王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学(西北政法大学学报)》2017年第5期,第150页。
【7】丁文杰:《通用人工智能视野下著作权法的逻辑回归——从“工具论”到“贡献论”》,载《东方法学》2023年第5期,第99-101页。
【8】冯晓青、李可:《人工智能生成内容在著作权法中的定位》,载《中国版权》2024年第3期,第22-23页。
【9】陈淑環、韦玉科等:《基于深度学习的图像风格迁移研究综述》,载《计算机应用研究》2019年第8期,第2250-2255页。
【10】王迁:《知识产权法教程(第七版)》,中国人民大学出版社2021年版,第68页。
【11】【德】拉伦茨:《法学方法论》,陈爱娥译,商务印书馆2003年版,第249页。
【12】孔祥俊、魏奕荧:《产业和公共利益维度下的生成式人工智能版权问题研究》,载《中国编辑》2024年第9期,第34-43页。
【13】张玲:《法哲学作品观视阈下AIGC的作品定性再分析》,载《知识产权》2025年第3期,第3-23页。
【14】【英】洛克:《政府论(下篇)》,商务印书馆1964年版,第18-19页。
【15】【美】保罗戈斯汀:《著作权法之道——从印刷机到数字云》,金海军译,商务印书馆2023年版,第186页。
作者:董慧娟 魏荣豪
编辑:Sharon



