李芳芳 | 426世界知识产权日——数据权与知识产权的边界、冲突及融合


李芳芳 | 上海正策律师事务所 律师、专利代理师
引言Introduce
2026年3月30日,世界数据组织于北京正式成立,该组织系全球首个聚焦数据发展与治理实践的专业性国际组织,以“弥合数据鸿沟、释放数据价值、繁荣数字经济”为宗旨,核心职能在于推动数据资源的高效流通与创新应用。2026年4月3日,国家数据局发布《数据产权登记工作指引(试行)》征求意见稿,该举措标志着全球首个全国统一、互认通用、可司法采信的数据产权登记制度正式面向社会公开,为数据的规范化保护奠定基础。根据国际数据公司(IDC)预测,2026年全球数据规模预计达220ZB(泽字节),至2029年预计实现规模翻倍,中国数据目前约占全球数据总量的23%。数据作为新型生产要素,正深刻推动全球经济结构重构,而中国正积极拥抱这一产业变革,并发挥引领作用。
但在数据价值加速释放的进程中,一个根本性法律问题亟待明确:数据应当通过何种法律路径获得保护?当前,全球数据立法进程持续加速,欧盟已通过《通用数据保护条例》和《数据法案》,而我国目前尚无数据保护的专门立法,主要依托《个人信息保护法》《数据安全法》等相关法律,结合《数据二十条》等政策文件、部门规章及相关试点实践,实现多元协同的保护模式。
数据权与个人信息权益、知识产权、不正当竞争等法律范畴存在交叉重叠,鉴于此,本文仅聚焦数据权与部分知识产权的保护边界,结合司法裁判案例及行政决定实践,梳理数据权益保护的裁判规则与行政规制逻辑,为数据保护提供实务参考。
数据权与著作权
数据本身不构成作品,《著作权法》第三条将作品定义为“具有独创性并能以一定形式表现的智力成果”。而原始数据作为客观事实记录,缺乏人类创造性表达的必要条件。但当数据经过选择、编排形成具有独创性的集合时,便可通过汇编作品的形式获得著作权的保护。
白某商标数据库案情简介及裁判观点:在济南白某公司与佛山鼎某公司著作权权属、侵权纠纷案中,原告白某公司利用国家知识产权局的商标公告资料汇编了一个商标信息数据库,并开发相应查询软件有偿供用户使用。被告鼎某公司未经许可复制其数据库,原告提起诉讼。一审法院在判决中指出,白某公司对商标总局每一期《商标公告》里面的每条公告信息,进行拆分和人工识别,按照相应规则人工编排、录入,形成商标信息数据库,该数据库符合汇编作品特性,属于《著作权法》保护的范畴,二审法院维持了一审判决。该案的核心意义在于确认了公开数据在独创性编排后可获得汇编作品著作权的保护路径,并已成为中国当前数据著作权保护领域的代表性案例。
相比而言,美国通过著名的“Feist案”与“CCC案”,同样明确了数据经独创性编排后的司法立场。
Feist案情简介及裁判观点:美国Feist公司未经许可,复制了美国 Rural 公司按字母顺序排列的电话号码簿中的数千条用户信息,Rural 公司遂起诉其侵犯版权。美国联邦最高法院一致判决认定:电话号码本身是客观事实,不受版权保护;汇编作品受保护的前提是其在材料的选择、编排上体现了独创性。而按字母顺序排列是一种古老且常规的方法,缺乏最低限度的创造性,因此 Rural 公司的电话簿不构成汇编作品。该案留下一句著名的判词:“Sweat on the brow”(额头上的汗水),意思为:仅仅基于额头流汗辛苦工作所得,却不包含原创性的作品,不受版权保护。该案对全球数据汇编作品的保护产生了深远影响。
CCC案情简介及裁判观点:原告Maclean Hunter一直收集二手车相关信息,并基于收集的信息对二手车价格作出专业预测,相关预测价格汇编在“红皮书”(Red Book)的纸质期刊中,被告CCC Information公司大量使用原告红皮书中的数据,将该数据整合在自己的数据库中并进行商业化使用。美国地区法院基于Feist案精神,认为红皮书是对事实(二手车价格)或者事实解释的选择和编排,并不包括任何原创性,且红皮书中的车辆价格属于思想范畴,而非表达,故认为被告不侵权。然而,美国巡回上诉法院终审推翻了地区法院的判决,上诉法院认为:红皮书中的二手车价格并非既存事实,而是包含了预测、判断、专业分析和主观取舍,体现了作者的智力创造,并指出,版权中的原创满足“最低限度的原创性”即可。该案与 Feist 案形成鲜明对照,Feist 案否定的是机械性、常规性的编排,而 CCC 案肯定的是融入专业判断和数据评估的智力成果,两案共同勾勒出数据汇编作品独创性认定的边界。
以上三案虽然分属于不同的法域,但核心理念一致:数据本身不属于著作权的保护客体,但数据的独创性选择和编排可获得著作权保护。
数据权与专利权
数据与专利权的交集主要体现在数据处理方法和算法应用上。《专利法》第二条第二款规定,发明,是指对产品、方法或者其改进所提出的新的技术方案。而第二十五条明确排除了“智力活动的规则和方法”的可专利性。这一排除条款的核心在于区分抽象思想与具体技术应用。国家知识产权局 2025 年修订的《专利审查指南》对 AI 算法相关发明的可专利性作出了细化规定。根据指南,涉及人工智能的发明专利申请,如果权利要求仅仅涉及算法本身或算法与商业规则的简单结合,属于智力活动规则,不予授权;但如果算法与具体技术领域相结合,解决了特定技术问题,产生了技术效果,则可以作为技术方案获得专利保护。
司法实践中,这一区分标准在2024年最高人民法院审理的北京京某公司专利行政诉讼二审中得到了体现。申请人北京京某公司向国知局申请了一份有关“一种分享自动改变数值方法”的发明专利,该申请针对现有技术中只是将商品分享到社交平台,而没有跟踪订单功能导致用户缺乏分享动力这一现状,针对性提出一种“拼购”的商业方法,通过定金加尾款模式实现商品价格随人数变化而变化,从而提高用户分享的动力。国知局以其不符合《专利法》第二条专利权保护客体的规定予以驳回,申请人后依次经历专利复审、专利行政诉讼一审,均未得到支持。二审时,最高人民法院撤销了一审法院的行政判决、撤销了国知局的复审决定,要求对本申请重新进行复审审查。最高人民法院指出,本申请提出“拼购”这种商业模式,从申请权利要求书和说明书记载可知,至少采用了信息加密解密、关联绑定存储、数据匹配等技术手段,实现了准确判断分享链接使用情况的技术效果,属于《专利法》第二条规定的技术方案。并特别指出:“在新技术、新领域、新业态不断涌现的背景下,适度宽松的专利客体审查标准更符合科学技术进步和经济社会发展的时代要求,也更有利于激励创新主体的创造能力。特别是随着数字经济的快速发展,更应注意统筹运用好专利客体审查与实质审查各自的不同功能,对涉商业方法的专利进行客体审查时,应遵循一般的审查标准,发挥客体适格性审查的底线功能,而实质审查阶段则可遵循相对严格的审查标准,通过与现有技术的对比正确评估专利申请的技术贡献,公平合理地确定保护与否及保护范围。”
2026年2月,英国最高法院发布了一份有关AI技术的专利行政诉讼判决,涉案专利系Emotional Perception 公司申请的一份有关“一种基于人工神经网络(ANN)的音乐推荐系统”,该技术核心创新采用双ANN架构:语义情感ANN和音乐声学ANN。语义情感ANN通过输入歌曲的文本标签,经处理生成语义嵌入向量,学习歌曲的情感相似度。音乐声学ANN通过输入歌曲的声学特征,生成声学嵌入向量,学习歌曲的声学相似度。然后采用融合机制将两个ANN的相似度得分加权融合、相互校准,语义相似度高的歌曲,在声学空间中距离拉近,反之亦然,最终形成统一的情感-声学联合嵌入空间,用于检索推荐。2022年英国知识产权局以该申请“属于计算机程序”为由予以拒绝;2023年英国高等法院推翻该决定,认为训练好的AI不再是单纯程序;2024年英国上诉法院又推翻高等法院,恢复知识产权局结论;直至2026年2月,英国最高法院最终推翻上诉法院,认为在判断计算机程序是否构成发明时,要结合其是否会使用某种物理硬件实施,是否具有技术贡献等因素进行综合判断,本案中ANN是一组用于处理数据的指令,属于计算机程序,但是由于其必须依赖硬件实现,且带来了良好的技术贡献,故其不构成程序本身,不排除专利保护。
Emotional Perception AI案打破了英国近20年来对计算机程序专利保护的严苛门槛,预示AI模型、训练方法、神经网络架构等核心创新有望在英国获得更广泛的专利保护,为AI音乐、流媒体、情感计算领域的专利布局提供判例依据。纵观全球,数据算法的专利保护正从“严格限制”转向“适度放开”。但各国在可专利性判断上侧重各异,规则走向仍难统一。可以预见,随着技术快速迭代,全球专利制度将在保护创新与促进数据发展之间持续调整。
数据权与商业秘密
在各类知识产权中,商业秘密与数据权关联最为紧密。《反不正当竞争法》第十条将商业秘密定义为:不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。非公开数据集合,如训练数据集、标注数据库等,若同时满足秘密性、价值性、保密性三要件,即可作为商业秘密获得保护。
2025年8月,最高人民法院审结的首例涉视觉识别领域人工智能及算法技术秘密侵权纠纷案,具有开创性意义。案情方面,原告某甲公司开发了一款“指尖识别”产品,能够通过手指点触书本上的文字实现即时识别与翻译。该产品的核心技术包括大量标注图片数据和相应的算法训练代码。某甲公司主张这些技术信息构成其商业秘密,并采取了合理的保密措施。被诉侵权人张某等人曾为某甲公司员工,接触并参与了相关数据与算法的开发。张某离职后成立某乙公司,迅速推出具有类似功能的产品,并在短期内实现商业化。某甲公司认为,某乙公司等未经许可使用了其标注数据与训练代码,侵害了其技术秘密。裁判方面,最高人民法院二审明确指出,某甲公司的训练图片数据(包括标注后的图片库)与训练代码共同构成其“指尖识别”技术方案的核心内容。这些数据并非公开信息,且具有实用性和经济价值,属于商业秘密。法院特别强调“人工智能模型不会凭空获得识别未经训练类别的能力。模型输出结果的质量,从根本上说,取决于输入模型的训练数据的类型、规模和质量。”据此,法院认定训练数据本身可以成为技术秘密。本案的意义在于,明确了在人工智能与算法驱动领域,训练数据既可独立存在,亦可与代码共同构成技术秘密,纳入商业秘密保护范畴。这一裁判规则为AI技术中数据资产的法律保护提供了清晰的路径与规则,具有里程碑式的示范价值。
数据权与商标权
商标的核心功能在于识别商品或服务的来源,要求具备显著性以区分不同经营者。数据本身以数字化形态存在,通常不具有天然的可识别性或来源指向性,难以直接注册为商标。但若经系统开发、加工整合形成具有独立市场价值的数据产品,其名称、标识等元素在具备显著性的前提下,可申请商标注册。数据产品运营者通过持续提供稳定、优质的数据产品或数据服务,不仅能够积累商业信誉、提升商标品牌价值,还可向消费者传递可靠的服务来源与质量保障。因此,商标权虽不直接延及数据内容本身,却为数据产品的市场化运营构筑了重要的品牌法律护盾。
总结
综上所述,数据本身虽不设专有权利垄断,但其独创性编排、技术性应用、非公开状态与标识性使用,可分别纳入著作权、专利权、商业秘密与商标权的保护轨道。这四种路径并非互相排斥,而是可以协同运用在同一数据产品中。当前,全国“东数西算”布局已成型,算力基础设施正从“建起来”走向“用起来”,2026年被确定为“数据价值释放年”,政策导向从规范管理转向价值激活。在此背景下,数据保护并非终点,而是流通的起点。唯有以法治为轨道,以安全为底线,以高效为标尺,构建覆盖数据采集、加工、交易、应用全链条的流通机制,才能真正释放数据要素的乘数效应。
*文章内容仅为作者独立观点
作者:李芳芳
编辑:Sharon



