无讼阅读｜可能列为知识产权客体的“数据信息”将要保护什么权利？

本文由作者向无讼阅读独家供稿，转载请注明作者和来源

《中华人民共和国民法总则（草案）》第一百零八条将“数据信息”列为了知识产权一种新的客体。如民法总则确立下来数据信息作为新类型的知识产权加以保护，对中国大数据行业以及所有中国大数据企业将产生深远的影响。

由于草案中并未明确“数据信息”的具体定义，目前还无法得知最终确定下来作为知识产权保护的数据信息是哪个层面的数据。

数据信息从其生产过程而言，可以分为信息、原生数据、记录原生数据的数据库、衍生数据模型、衍生数据以及汇集衍生数据的数据库。数据的特征之一在其可记录性，在数据没有被记录之前其是以信息的方式存在的，比如一个人的年龄、性别，在没被记录之前是个体的信息，是客观存在，一旦被记录下来，则变为数据。具有相互联系的数据信息按照特定的顺序或方法排列形成的集合体为数据库。在原生数据的基础上，经过一定的算法加工、计算、聚合产生新的数据即为衍生数据，如蚂蚁的芝麻信用就是根据一定的模型基于阿里巴巴的电商交易数据和蚂蚁金服的互联网金融数据所衍生的数据。海量衍生数据又聚合成新的衍生数据库

信息以及单纯的记录客观信息的数据是没有必要以知识产权的方法予以保护的。以知识产权的方法保护的是数据库、衍生数据以及衍生数据模型。这就如同在著作权法里对记录客观事实和信息时事新闻不应该予以著作权保护一个道理。

对于数据信息保护应该包括三个方面：一个是数据信息以载体方式可被呈现的权利，如复制、发表、发行；另一个是数据利用的权利，即在原有的数据基础上生产新的数据；三是数据生产的权利，应该赋予权利人按既定规则合法生产数据的权利，对于以刷数据等为目的破坏数据的清净性造成数据库污染的，应该承担数据侵权责任。过去几年，互联网从“数据”到“大数据”经历了“量”的变化，如今，“数据”开始往“可信数据”，也就是“质”的方向发展，“可信数据”将是互联网的下一座金矿。对“可信数据”最大的损害莫过于故意违反数据生产规则，使数据库中加入不可信数据。这种侵害数据信息行为应该构成侵权。

另外，还有一个问题，衍生数据的模型也应该作为数据信息予以保护。衍生数据的模型本身也是在海量数据的基础上经过算法生成的，比如在芝麻信用分的评分当中，被分为五个维度：身份特质、履约能力、信用历史、人脉关系、行为偏好，每个维度的数据会占一定的评分比重，选入哪个维度计算以及每个维度的权重都会经过海量数据计算出来的，而不是人为随意决定的。衍生数据的计算模型是一种智力成果，也是数据工业竞争的核心，也应该予以保护。

数据库作为汇编作品以前是以著作权方式予以保护的，但其保护的力度是有限的，只有在侵权人实施了复制、发表、发行等权利时才能予以保护。随着大数据时代的到来，数据已经成为一种新的竞争资源、一种新的生产要素，是基础性资源和战略性资源。而数据不仅仅在被窃取、被不正当使用时才会对权利人产生危害。应该以立体的角度从数据生产的全过程看待数据信息应该被保护的内容。如果数据信息作为知识产权保护的客体确体下来后，可以使数据库也能得到超越著作权保护手段更全面的保护。

对于数据信息的侵害造成的损失，也应该与其他知识产权法一样按给权利人造成的实际经济损失或者是侵权人因侵权行为获得的全部利润进行赔偿。同时，由于数据信息不同于著作权、商标权、专利权的特征，数据信息侵权的损失往往更不容易计算和证明，其他几种知识产权还可以把许可费作为一个赔偿的标准考虑，但数据信息中往往没有单一数据或者数据库的市场价格，所以实际损失往往难以证明。而侵权人因侵权获得的利润往往与数据信息被侵权的程度不成比例，应该允许引入经济学中的数据精算的方法，以模型方式计算损失。对于由第三方提供的精算报告应该可以作为损失的证明，由此产生的费用也应该作为合理费用支出。

《民事总则草案》虽然在数据的权利方法虽然只提出了“数据信息”这四个字，但已经为专门的数据保护法奠定了基础，有望使我国的数据立法走入世界前沿。

实习编辑/代重阳