李陶 | 欧盟《人工智能法》对我国著作权制度创新的启示
本文转载自“版权理论与实务杂志”公众号,原文刊载于《版权理论与实务》2024年第5期,原标题为《欧盟〈人工智能法〉对我国著作权制度创新的启示》,作者李陶,中央财经大学法学院副教授、德国慕尼黑大学法学博士。
【内容提要】
欧盟《人工智能法》以《欧盟宪章》基本权利为价值标准,采用分级分类建立规制机制的方式,为欧盟人工智能产业全链条发展编制了一张保障运行的安全网。立法说明与法律文本从责任主体、许可与例外、域外适用、证据规则、行政监管等方面明确了通用人工智能模型提供者所应承担的著作权合规义务。该合规义务的明示引发了相关主体对著作权制度完善和制度运行的讨论。这些讨论可从著作权的权利保护规则、限制例外规则、授权许可规则、权利救济规则等方面,为我国未来著作权制度的创新与完善提供启示。
【关键词】
欧盟《人工智能法》;通用人工智能模型提供者责任;著作权合规义务;文本和数据挖掘;著作权集体管理
本文系国家社科基金一般项目“新发展格局下我国著作权集体管理领域的反垄断规制研究”(21BFX202)的阶段性研究成果。
一、欧盟《人工智能法》概述
人工智能作为一项快速发展的通用集成技术,有助于为整个市场和社会带来广泛的经济和社会效益。通过改进预测、优化运营、提高效率,人工智能系统可以为不同使用者提供个性化的服务和务实的解决方案。总体上看,人工智能系统的运用不但可以为经营者提供关键性竞争优势,而且可以对社会和环境创造有益的总体福利。但在不同场景下,人工智能系统的应用也可能产生诸多风险,并损害受欧盟法律保护的公共利益和基本权利。这种损害既可能是物质的,也可能是非物质的,包括身体、心理、社会或经济上的损害。[1]为了让人工智能系统的应用在满足《欧盟宪章》权利保障需求和价值评价标准下发展,欧盟立法者在2021年公布了《人工智能法案》。2024年3月13日,欧洲议会议员以523票赞成,46票反对,49票弃权批准了具有里程碑意义的《人工智能法》。[2]
从立法背景上看,为了规范人工智能系统的开发与运用,某些成员国已经开始探索通过国家立法,确保人工智能在可信和安全的前提下进行开发和利用。但不同的国家规则将导致内部市场的割裂,并降低内部市场主体在开发、进口与使用人工智能系统适用法律的确定性。因此,为了确保在整个欧盟范围内提供一致和高水平的保护,实现可信赖人工智能系统的建立与应用,欧盟立法者希望通过统一的制度安排为欧盟市场创造统一、安定、高效的法治框架。同时,欧盟立法者希望为人工智能产业链的主体提供明确统一的义务与指引,防止阻碍人工智能系统及相关产品和服务在内部市场内自由流通、创新、部署的行为出现。[3]
从立法目的上看,欧盟《人工智能法》的立法目的是改善欧盟内部市场的运作,特别是为欧盟符合《欧盟宪章》基本价值观的人工智能系统在开发、投放市场和使用过程中,制定统一的法律框架,促进以人为本和值得信赖的人工智能之应用,同时确保人工智能技术对健康、安全和《欧盟宪章》所规定的各项基本权利的保护,包括民主的实现、法治的运行以及环境的保护,防止人工智能系统在欧盟成员国产生有害的影响,并且支持创新。[4]
从立法模式上看,欧盟《人工智能法》采用的是分级分类建立规制机制的方法。具体可从横向和纵向两个维度理解。从横向维度上看,《人工智能法》明确了可运用人工智能系统的多个行业和场景,包括医疗保健、农业、食品安全、教育和培训、媒体、体育、文化、基础设施管理、能源、运输和物流、公共服务、安全、司法、资源和能源效率、环境监测等;从纵向维度上看,《人工智能法》以禁止的人工智能应用、高风险的人工智能应用、低风险的人工智能应用、最小风险的人工智能应用为标准,明确了具体应用场景下,人工智能系统的开发者、训练者、提供者、部署者、销售者、使用者等全链条主体所需要承担的信息公开、申报、合规等义务。政府和自治组织则承担着建立监督执法评估机构,建立自治性评估、测试、优化机制的责任。通过上述横向的应用行业和场景,以及纵向的在分级分类基础上的自治、监管、执法措施,欧盟立法者以《欧盟宪章》基本权利为指导,编制了一张保障人工智能系统开发与应用的安全网。
二、欧盟《人工智能法》有关著作权制度运行的规定
由于欧盟《人工智能法》采用的是分级分类建立规制机制的立法模式,所以在横轴(应用场景)和纵轴(规制机制)的交织下,就是具体到各个部门法所调整的范围。欧盟《人工智能法》对于著作权问题规定的切入点是人工智能产业链中的主体责任。该法在有关的立法说明和条款中明确,在人工智能系统开发、训练、检索、分析、提供等领域出现著作权问题应当在欧盟著作权制度的框架下解决,著作权责任主体是“通用人工智能模型的提供者”(Providers of general-purpose AI models, Providers of GPAI)。具体在欧盟《人工智能法》第53条第1款(c)项规定:“通用人工智能模型的提供者应制定遵守欧盟版权法的方案,特别是通过运用最先进的技术,识别出根据《数据单一市场中的版权指令》(EU)2019/790第4条第3款明确的权利保留的内容。”通过系统分析《人工智能法》立法说明和正文,可以从责任主体、许可与例外、域外适用、证据规则、行政监管五个方面理解《人工智能法》对著作权制度适用的有关规定。
第一,责任主体方面,通用人工智能模型的提供者(Provider of general-purpose AI model)是著作权责任承担的主要主体。从通用人工智能模型概念的角度看,“通用人工智能模型”与“人工智能系统”是两个不同概念。[5]根据欧盟《人工智能法》第3条第(63)项的规定:“通用人工智能模型(general-purpose AI model)是指人工智能模型,包括使用大规模自我监督、使用大量数据训练的人工智能模型,该模型具有显著的通用性,并且能够胜任执行各种不同的任务,无论该模型以何种方式投放市场,并且可以集成到各种下游系统或应用程序中,在投放市场之前用于研究、开发或原型设计活动的人工智能模型除外。”欧盟立法者认为,尽管人工智能模型是人工智能系统的重要组成部分,但其本身并不构成人工智能系统。人工智能模型需要添加其他组件(如用户界面),才能成为人工智能系统。人工智能模型也因此通常需要集成到人工智能系统并构成人工智能系统的一部分。[6]从定义方式上看,欧盟《人工智能法》有关通用人工智能模型的定义是基于其关键功能特征进行的,特别是将通用性和胜任执行各种不同任务的能力作为重要的判断标准,这些模型通常通过各种方法对大量数据进行训练。大型生成式人工智能模型是通用人工智能模型的典型例子,因为它们允许灵活地生成内容,例如文本、音频、图像或视频等形式,这些内容可以很容易地适应各种独特的任务。[7]
通用人工智能模型可以通过各种方式投放市场,包括通过应用程序编程接口(API)、直接下载或复制副本。一旦通用人工智能模型投放市场,通用人工智能模型提供者的义务就应该适用(《人工智能法》第51-56条)。[8]对此,鉴于通用人工智能模型的提供者在人工智能价值链中所具有的特殊作用,他们承担的责任与义务是全面和基础的,因为他们提供的模型可能构成一系列下游系统的基础,下游系统的使用者需要对模型及其功能有很好的了解,才能够将此类模型集成到其产品中并履行欧盟《人工智能法》或其他欧盟法律框架规定的义务。因此,欧盟《人工智能法》要求通用人工智能模型提供者应制定相应的透明度报告,包括起草和更新说明文件,提供有关通用人工智能模型的信息(包括合规信息)供下游提供商使用,以及向人工智能办公室和其他国家主管部门提供。[9]此类文件中所应包括最低限度的内容载于《人工智能法》的附件中。[10]
第二,许可与例外方面,通用人工智能模型的提供者在开发、训练模型的过程中,对著作权法保护客体的任何使用,都需要取得授权,除非这些使用属于欧盟著作权制度权利限制规则中的内容。欧盟《人工智能法》认为,通用人工智能模型,特别是能够生成文本、图像和其他内容的大型生成模型,为艺术家、作者和其他创作者及其创意内容的创作、分发、使用和消费方式带来了独特的创新机会,但也带来了挑战。此类模型的开发和训练需要访问大量文本、图像、视频和其他数据。在这种情况下,文本和数据挖掘技术可广泛地用于检索和分析这些受著作权和相关权保护的内容。如果不存在适用相关著作权例外和限制的情形,其对受著作权制度保护内容的使用都需要取得相关权利人的授权。[11]对此,欧盟《数字单一市场中的版权指令》(EU)2019/790第3条与第4条引入了有关文本和数据挖掘应用的例外与限制,允许在某些条件下使用者出于文本和数据挖掘的目的复制和摘录作品或其他客体,权利人可以选择保留对其作品或其他客体的权利,以防止使用者进行文本和数据挖掘(《数字单一市场版权指令》第4条),除非这是出于科学研究的目的(《数字单一市场版权指令》第3条)。易言之,除了那些以适当方式(机器可读)明确保留选择退出权的情况,通用人工智能模型的提供者如果(出于非科学研究目的)想对此类作品进行文本和数据挖掘,都需要获得权利人的单独的授权(欧盟《人工智能法》第53条第1款c项)。
第三,域外适用方面,应确保将通用人工智能模型投放到欧盟市场的提供商都遵守《人工智能法》的相关著作权合规义务。具体而言,无论支持这些通用人工智能模型训练的著作权相关行为发生在哪个司法管辖区,通用人工智能模型的提供者都必须制定明确的著作权合规审查规则,并遵守欧盟著作权规则的相关要求。对此《人工智能法》认为,相关规则的域外适用对于确保通用人工智能模型提供商之间公平的竞争环境是必要的,因为在这种竞争环境中,任何提供商都不允许通过借助低于欧盟著作权相关标准来在欧盟市场上获得竞争优势。[12]这种在效果原则基础上形成的域外适用规则将对计划进入欧盟市场的经营者提出极大的著作权合规挑战,因为欧盟著作权法和人工智能法将从研发和训练阶段就对欧盟境外的人工智能模型训练者产生影响。而欧盟的著作权制度的保护水平在全球范围内都相对较高。例如,在与著作权有关的多边国际条约制定中,常常存在制度的保留规则,即缔约国可以根据本国的立法需求自由地选择是否不将这些规则在国内法中进行规定。而欧盟和成员国在签订相关国际公约中多没有对条约中的这些条款进行保留。此外,出于统一欧盟内部市场,创造高水平的法治环境的考量,欧盟在很多著作权的立法问题上都多有创新举措,如对于临时复制、文本和数据挖掘、具有延伸效果的集体管理、报刊出版者邻接权等。[13]
第四,证据规则方面,通用人工智能模型的提供者需要起草并公开提供用于训练通用模型的内容的足够详细的摘要,摘要包括受版权法保护的文本和数据的来源。具体而言,在适当考虑保护商业秘密和机密商业信息需要的同时,摘要的范围应总体上全面,而不是技术上的详细,以方便具有合法利益的各方(包括著作权人)行使和执行其根据欧盟法律享有的权利。例如,义务主体应当列出用于训练模型的主要数据集合,或者大型私人或公共数据库或数据档案,并提供有关所使用其他数据源的叙述性解释。人工智能办公室应该为摘要提供一个模板,该模板应该简单、有效,并允许提供者以叙述形式提供所需的摘要。[14]这种有关著作权合规的陈述和著作权保护客体溯源的摘要,有助于权利人了解自己受著作权制度保护的客体是否被人工智能模型的开发者使用,进而为他们维护自己的权利实现创造便利。
第五,行政监管方面,人工智能办公室应监督通用人工智能模型的提供者是否履行了其应当履行的有关于摘要与信息公开义务(《人工智能法》附件11-13),而无需核实和对培训数据进行逐项著作权合规的实质性评估。具体而言,虽然《人工智能法》明确了人工智能模型的提供者需要承担著作权合规义务,但是人工智能办公室对于合规义务的审查,仅限于对摘要内容的形式审查,即人工智能办公室仅审查通用人工智能模型的提供者是否按照人工智能办公室所提供的模板,陈述了有关训练数据的来源和版权是否合规,而不用从实质上逐一确认通用人工智能模型的提供者是否真的履行了其所陈述的所有内容。与此同时,人工智能办公室的形式审查,也并不影响欧盟版权规则在具体实质审查和适用。[15]此外,欧盟《人工智能法》要求遵守适用于通用人工智能模型提供者的义务应与模型提供者的类型相称,具体而言,在不损害欧盟著作权制度的情况下,遵守这些义务应适当考虑到提供者的规模,并允许包括初创企业在内的中小企业简化合规方式。[16]
三、欧盟《人工智能法》对我国著作权制度创新的启示
欧盟《人工智能法》虽然属区域性法律,但是其包含了严格的域外适用原则。[17]为了确保欧盟内部市场公平的竞争环境,即使人工智能模型的训练与开发在欧盟以外的第三国进行,其若是想要进入欧盟市场,就需要不但满足《人工智能法》中的各项规则,而且也需要满足有关欧盟著作权的合规和信息公开要求。此外,在人工智能产业发展需要尊重在先知识产权的这一基本共识下,[18]我国人工智能产业中的相关主体如何将保护知识产权这一抽象义务落到实处,也需要通过知识产权部门法的制度创新完成。对此,可以从著作权的权利保护规则、限制例外规则、授权许可规则与权利救济规则方面,对我国《著作权法》未来制度创新进行讨论。
第一,从著作权的保护规则看,我国的著作权制度有必要细化复制权的调整范围,明确被允许使用的“临时复制”的构成要件。如前所述,通用人工智能模型的提供者依据欧盟《人工智能法》需承担著作权合规的义务。以ChatGPT和Gemini为代表的生成式人工智能模型属于承担著作权合规义务的主体。具体而言,在模型的训练开发过程中,其需要确保相关行为在著作权制度的框架下合法地展开。对于著作权法保护客体在机器人学习和系统训练中的使用,涉及权利人的复制权。对此,全球范围内已经出现了多个权利人依据复制权侵权维权的案件,[19]并已经有国家对相关的使用行为作出了生效判决。[20]例如,《纽约时报》在针对OpenAI的起诉书中认为,聊天机器人向用户提供了《纽约时报》文章的近乎逐字摘录,否则这些文章需要付费订阅才能查看;之所以OpenAI和Microsoft特别强调使用《纽约时报》新闻来训练他们的人工智能程序,因为这些材料被认为是可靠和准确的。[21]
为了转化欧盟《信息社会中的著作权法指令》2001/29/EG第5条的规定,德国于2003年修订《著作权法》增加第44a条,对临时复制行为进行了定义。[22]德国通说认为,临时复制行为的成立需要同时具备(1)复制行为的暂时性,(2)复制行为的短暂或偶然性,(3)复制行为必须构成技术过程的一个组成部分,(4)该过程的唯一目的必须是使受保护作品或其他客体的中间人或合法使用在第三方之间的网络中传播,(5)复制行为不得具有独立的经济意义。[23]根据欧盟法院2012年在“Infopaq II”案中的裁决,新闻监测提供者扫描新闻文章以从中生成不受著作权法保护的摘要的行为被认为是允许的,因为其对受著作权保护客体的复制是暂时的,并且服务于合法目的。[24]如果这一裁决标准适用于人工智能领域,它可能将使在人工智能应用程序的帮助下于互联网上抓取或上传文本,对源文本进行了充分修改后以创建摘要或其他输出的行为具有合法性。如果这一思路被沿用,在权利人看来将会形成法律保护上的漏洞。[25]建议我国在《著作权法实施条例》中对临时复制行为进行必要的界定,以完成技术发展和立法目的之间的适配。具体在立法中需要严格界定临时复制各个构成要件的内涵,为权利人和作为使用者的人工智能模型提供者创造可预期的法律依据。
第二,从著作权的限制规则看,我国《著作权法》有必要增添有关保障通用人工智能模型提供者开展人工智能训练的合理使用和法定许可规则。《人工智能法》明确了通用人工智能模型的提供者可以使用开源的著作权保护客体以及在欧盟文本和数据挖掘例外制度的适用下进行系统的开发和训练。但是欧盟现有的这一不需要取得授权和支付报酬的机制存在一定的缺陷:其一,开源内容的有限性难以满足通用人工智能模型提供者开发高质量、可信赖人工系统的需求;其二,文本和数据挖掘的制度内涵存在不确定性,难以为通用人工智能模型提供者创造安全可靠的适用著作权保护客体的制度依据;其三,对于非科学研究目的的文本和数据挖掘,权利人可以作出适用保留的声明,作出权利保留声明的权利人可以向非科学研究目的实施文本与数据挖掘的主体要求支付报酬,而这种支付报酬的请求权因集体管理机制的缺失存在大规模维权诉讼之风险。就文本和数据挖掘而言,欧盟立法者在2019年《数字单一市场版权指令》(EU)2019/790第3条和第4条规定了文本和数据挖掘的著作权限制规则。该规则出现的原因在于,欧盟此前的著作权限制规则,难以为文本和数据挖掘的应用找到明确的著作权限制的解释依据,即这一行为属于对复制权的侵犯。[26]为了给科学研究目的的主体创造在基于复制和保存副本基础上的文本和数据挖掘行为提供明确的法律依据,欧盟立法者于2019年设立了这项制度。[27]同时,欧盟立法者也考虑到了其他市场主体对运用文本和数据挖掘技术的使用需求,因而在权利人没有实施适用保留的情况下,其他非科学研究目的主体实施文本和数据挖掘行为也被允许。[28]而对于此类非科学研究为目的实施文本和数据挖掘的主体而言,其需要向保留了文本和数据挖掘的主体取得授权并支付报酬。[29]
根据欧盟2019年《数字单一市场版权指令》(EU)2019/790第2条第1款第2项,“文本和数据挖掘”是指一种以数字形式自动分析文本和数据的技术,可用于获取有关但不限于模式、趋势和相关性的信息。有学者认为,从目的上理解文本和数据挖掘制度的内涵,并不能得出“获得模式、趋势和相关信息”的行为目的与通用人工智能模型目前所实施的训练目的相匹配,因为通用人工智能模型的目的是输出和形成具有对传统创作行为进行替代的内容并以此获得收益。[30]鉴于此,为了平衡权利人和使用者之间的利益,可以考虑创设一种基于法定许可的新获酬权,以便让创作者向通用人工智能模型的提供者主张适当合理的报酬。[31]对此,我国首先应当尽快通过《著作权法》修订增添有关文本和数据挖掘的合理使用制度,以便让相关主体(特别是以科学研究为目的的主体)能够享受到技术带来的开发利用著作权法保护客体的便利。但通过概念扩张完全免除以营利为目的的相关主体的付费义务,会背离文本和数据挖掘原本产生的立法意图。因此,也可以在引入有关文本和数据挖掘合理使用规则的同时,考虑引入新的法定许可机制,以求保障创作者能够针对人工智能系统对其著作权法保护客体的开发与利用获得适当合理的报酬。
第三,从著作权的授权许可规则看,我国应尽快完善已有的著作权集体管理制度,特别是完善集体管理组织的内部治理、外部监管规则,确立并建立对非会员权利的集体管理制度。高质量、可信赖的人工智能系统需要通过高质量的数据集完成训练,这些数据集中包含了著作权法所保护的客体。从域外经验上看,为了在合法的框架下利用高质量数据集进行训练,OpenAI已经和包括美联社(The Associated Press)、阿克塞尔·斯普林格(Axel Springer)在内的多家新闻出版集团达成了使用其著作权法保护客体的协议。例如,根据双方的协议,阿克塞尔·斯普林格将允许OpenAI访问其旗下出版集团的新闻档案,并允许其在ChatGPT等应用程序中使用新发表的文章。[32]2023年12月,由于谷歌未能履行其此前与新闻机构和出版商之间就使用著作权法保护客体进行谈判所承诺履行的义务,而被法国市场监管部门进行了处罚。[33]
事实上,如果人工智能模型的提供者需要承担著作权合规的义务,必将出现从以出版商为代表的个体授权向以著作权集体管理组织为代表的集体授权机制进行过渡的现象。在欧盟《人工智能法》通过之后,国际和欧洲范围内的创意和文化领域的集体组织,包括音乐、视觉、视听和文学作者,报纸、杂志和专业出版物、书籍、音乐、学术、新闻的出版商,录制的音乐、电影和视听制作人,在线和离线电影与视听内容的出版商等18家集体组织,发表了联合声明,希望相关使用者将《人工智能法》中所规定的著作权合规义务落到实处,并呼吁欧盟立法者完善现有的著作权制度,以便创作者和权利人的权益得到实现。[34]从保障人工智能相关产业发展的角度看,全面取得每一个个体的授权具有现实上的不可操作性,因此有学者提出,可在这一使用场景下赋予权利人以一项新型获酬权的法定许可,从而为使用者开发利用著作权保护客体创造便利,而这项获酬权也将通过著作权集体管理组织行使。[35]对此,为了让权利人获得适当的报酬,瑞士和德国的著作权集体管理组织已经发表了针对人工智能模型训练的文本和数据发掘的适用保留,并启动了相应的授权谈判。[36]德国文字著作权集体管理协会(VGWort)已经在2023年建立了与人工智能利用著作权保护客体的工作部门。[37]以获酬权的方式明确权利人可以从通用人工智能模型的提供者处获得合理的报酬,不但能够实现权利人的权利,而且能够为作为下游商业使用者的通用人工智能模型的提供者提供足够的交易安全与海量的训练集合。为了应对未来将要出现的通过著作权集体管理组织进行授权的权利取得模式,我国需要以《著作权集体管理条例》的修订为契机,加快著作权集体管理组织有关的制度建设,优化内部治理,强化外部监管,建立对非会员权利的管理和对相关费率的转付机制。
第四,从著作权的救济规则看,为了充分保障权利人的权利,我国在制定人工智能相关的法律时,应当在明确责任主体的同时,要求其承担训练数据的来源说明义务(标识义务)。《人工智能法案》要求特定主体为所承担的信息提供义务,有利于权利人展开维权。权利人只有知悉其权利被用于数据训练后,才能据此要求责任主体承担具体的侵权责任。从义务主体上看,欧盟《人工智能法》将著作权合规义务的主体设定为“通用人工智能模型的提供者”,并要求其制定著作权合规规则以及公开训练数据合法来源。对于我国而言,责任主体的确定可以通过人工智能一般性法规完成,也可以通过《著作权法》或者与著作权有关的实施条例完成。但需要注意在不同法律规范的规定中,应当尽可能地保持责任主体概念表述的统一,并对其进行概念上的界定。如《人工智能法(学者建议稿)》第24条将数据合理使用的主体明确为“人工智能开发者”,并区分了其与“人工智能提供者”不同的责任。[38]在《人工智能示范法2.0(专家建议稿)》中,责任义务章节的主体为“人工智能研发者”与“人工智能提供者”。[39]
从义务的内容上看,欧盟《人工智能法》要求义务主体在著作权合规和信息公开层面应当列出用于训练模型的主要数据集合与大型私人或公共数据库、数据档案,并提供有关所使用的其他数据源的叙述性解释。我国《人工智能法(学者建议稿)》明确了人工智能开发者和人工智能提供者需要承担标识和信息溯源义务,其可以理解为与著作权有关的信息提供义务。这种举证责任的分配能够提高权利人维权的效率,并降低权利人维权的难度。从比例性的角度看,我国在制定相应规则时,也应当明确信息提供和信息公开的义务并不用具体到每一个具体的作品,只需要说明数据集的权利来源即可。对于不提供有关数据来源信息的责任主体,需要承担相应的责任。