本文由作者向无讼阅读独家供稿,转载请注明作者与来源
从前有个程序猿小孔说,
"爬别人网站数据不能算偷……
爬!……程序猿的事,能算偷么?"
算不算"偷",还真不是小孔说了算,我国立法及司法判例均有明确答案。
这一方面取决于数据的"质量",如果别人网站数据符合我国著作权法意义上的作品,轻则可能涉嫌构成著作权民事侵权,重则可能构成刑事犯罪。
另一方面取决于爬数据的"吃相",轻则可能因实质替代获取不正当竞争优势、干扰或破坏他人网络服务的正常运行,涉嫌构成不正当竞争;重则可能因绕开技术措施非法获取数据,涉嫌构成非法获取计算机信息系统数据罪等罪。
本文将以我国立法与司法判例为基础,详细解读抓取他人网站数据的不同情形,是否分别侵犯著作权,构成不正当竞争,以及构成非法获取计算机信息系统数据罪等罪。
一、爬数据侵犯著作权的情形
(一) 侵犯著作权承担民事责任的情形
案例:北青报诉新浪网侵犯著作权系列案,美亚长城诉精伦电子侵犯著作权纠纷案(注:(2014)鄂民三终字第00107号),大众点评网诉爱帮网侵犯著作权纠纷案(注:(2009)一中民终字第5031号),泛亚公司诉百度MP3侵犯著作权纠纷案(注:(2009)民三终字第2号)。
案例评析:不同案件因商业模式不同,基础权利依据不同,最终是否侵犯著作权以及具体侵犯的权利子项各不相同,具体分析如下:
1.侵犯单个作品著作权的前提是数据具有独创性。抓取他人网站数据(文字、图片或视音频等)是否构成侵犯单个作品著作权的前提,取决于单个数据的质量,即单个数据必须具有《著作权法》意义上的独创性。我国《著作权法实施条例》第二条明确规定,"著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。" 北青报诉新浪网侵犯著作权系列案中,北青报的多篇新闻报道作品是记者根据调查采访撰写的专业新闻文章,每一篇均具有独创性,应受著作权法保护,即新浪网侵犯了北青报单个作品的信息网络传播权;而相反的,在大众点评网诉爱帮网侵犯著作权纠纷案、携程网诉去哪儿网侵犯著作权纠纷等案件中,因大多数用户单个点评信息"属于简单描述客观事实或观点,其表达方式非常有限",所以单个数据质量较低(不具有著作权法意义上独创性),固法院最终未支持数据抓取方侵犯单个数据著作权的主张。
2.结构性数据是否属于汇编作品。对于独创性不高的结构性数据(例如电商网站的主体信息、产品介绍、用户评价等),如果权利人以侵犯汇编作品著作权为由对数据抓取方提起诉讼,显然有利于节约维权成本。但是,我《国著作权法》要求汇编作品的"选择或者编排"具有一定的独创性。例如,在大众点评网诉爱帮网侵犯著作权纠纷案中,二审法院完全推翻了一审法院的认定,认为"大众点评网对于网友点评文字系按照时间顺序排列,排列方式是常见的排列方式,并不具有独创性",所以大众点评网中餐馆的介绍及网友点评文字整体上不构成汇编作品,固法院最终未支持数据抓取方侵犯整体数据汇编作品著作权的主张。
3.搜索引擎等抓取数据是否应当承担侵权责任。根据《信息网络传播权保护条例》、《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》,搜索引擎等网络服务提供者在提供自动接入、自动传输、信息存储空间、搜索、链接、文件分享技术等网络服务时抓取数据的,如果不会实质替代其他网站向公众提供相关作品的,不构成侵权。例如,在泛亚公司诉百度MP3著作权纠纷一案,最高人民法院认为,"百度网站提供的MP3搜索服务是一种网络技术服务,只有在明知或者应知所搜索链接到的作品为侵权作品仍然提供搜索链接的情况下才需要对第三方网站的侵权行为承担连带责任……在此过程中,百度网站是基于技术的安排,自动地提供服务,并未对搜索结果进行主动干预,其无从知晓搜索结果是否侵犯他人著作权。"相反的,在美亚长城诉精伦电子侵犯著作权纠纷案中,法院认为精伦电子在抓取数据后"对这些信息进行了编辑、分类、排行、评分、推荐……行为主观上具有过错,构成侵权"。此外,北京市高级人民法院在《关于涉及网络知识产权案件的审理指南》中,对于搜索引擎等承担责任的构成要件作出了详细规定,值得参考。
(二) 侵犯著作权承担刑事责任的情形
案例:2014年3月,被告人何某设立"车城小说"网站,其通过租赁海外服务器并运行其从互联网上下载的"关关采集"抓取软件,在未获被害单位起点中文网许可的情况下,擅自抓取复制650部文字作品,存储于自己的服务器上,供"车城小说"网站用户免费阅读。何某通过在"车城小说"网站网页内刊登广告获取广告收益,非法营利数额达人民币19万余元。
案例评析:我国《刑法》第二百一十七条明确规定了侵犯著作权罪的构成要件:以营利为目的;数额较大或情节严重;具体的侵权行为。具体分析如下:
1.关于以营利为目的。常见的表现形式为抓取数据后对外销售,除此之外,司法实践中下列情形通常也被认定为具有营利目的:收取会员费,刊登收费广告,捆绑他人作品获利,获取竞争优势或交易机会等情形。
2.关于数额较大或情节严重。侵犯著作权罪的追诉起点为违法所得数额三万元或者非法经营数额五万元;即便未达到上述金额,但抓取他人数据符合下列情节的,仍然应当追究:传播他人作品的数量合计500件以上;侵权作品实际被点击数达到5万次以上;侵权网站注册会员达到1000人以上;等等。
3.关于具体的侵权行为。通常表现为复制、发行,其中发行包括总发行、批发、零售、通过信息网络传播以及出租、展销等活动。抓取别人网站数据并在自己网站使用的行为,属于典型的"信息网络传播",即以有线或者无线方式向公众提供作品,使公众可以在其个人选定的时间和地点获得作品的方式。
在本案中,何某通过广告的方式获利,抓取并通过信息网络传播作品的数量高于法定追诉标准的500件,且营利数额超过5万元,构成侵犯著作权罪,判处有期徒刑1年,并处罚金10万元。
二、爬数据构成不正当竞争的情形
案例:大众点评诉百度地图不正当竞争案,乐视网诉爱奇艺、优酷不正当竞争案,大众点评诉爱帮网不正当竞争案(注:(2011)一中民终字第7512号)。
案例评析:通常,当抓取的数据因缺乏独创性无法以单个作品或者汇编作品获得著作权法上的保护时,权利人会寻求获得《反不正当竞争法》上的保护。其好处是,无需证明数据的独创性及是否获得数据的独占、排他性权利。但是,要获得《反不正当竞争法》上的保护必须满足如下条件:
1.数据是否构成法律上权利或利益。我国《反不正当竞争法》第二章列举了大量具体的权利或利益,同时第二条还笼统的规定了经营者的竞争优势也属于一种利益。具体到案例,例如在大众点评诉爱帮网不正当竞争案中,法院认为"大众点评网的商户简介和用户点评,是汉涛公司搜集、整理和运用商业方法吸引用户注册而来。汉涛公司为此付出了人力、财力、物力和时间等经营成本,由此产生的利益应受法律保护。"
2.双方具有竞争关系。双方具有竞争关系,是判断市场竞争秩序是否破坏,权利人利益是否受损的前提条件。例如在大众点评诉百度地图不正当竞争案中,百度地图认为"地图本身是导航服务,大众点评提供的是数据点评类服务,二者业务没有直接竞争关系。"另外,在大众点评诉爱帮网不正当竞争案中,法院认为"爱帮网和大众点评网都是提供分类信息查询服务的网站,爱帮科技公司和汉涛公司存在直接竞争关系,应受反不正当竞争法调整。" 此外,北京市高级人民法院在《关于涉及网络知识产权案件的审理指南》中,明确规定产品具有替代关系、交叉关系、依存关系或关联关系的,可以认定为具有竞争关系。
3.权利人利益受到实际损害。不正当竞争行为本质上一种侵权行为,侵权责任的承担以实际损害发生为前提,在此类案件中,双方争议的一个焦点即为利益是否受到实际损害。例如,在大众点评诉百度地图不正当竞争案中,百度地图认为百度的数据抓取及展示行为不但没有给大众点评带来损害,反而是为大众点评带来了利益,所以不构成不正当竞争。
4.抓取行为导致服务被替代构成不正当竞争。黄春林律师介绍,刚刚发布的北京市高级人民法院在《关于涉及网络知识产权案件的审理指南》中明确规定,未经许可且无正当理由,抓取能够为原告增加交易机会和竞争优势的他人网站内容,并足以替代消费者访问他人网站的,可以认定为反不正当竞争法第二条规定的不正当竞争行为。例如,在大众点评诉爱帮网不正当竞争案中,法院认为"爱帮网对大众点评网的点评内容使用,已达到了网络用户无需进入大众点评网即可获得足够信息的程度,超过了适当引用的合理限度,事实上造成爱帮网向网络用户提供的涉案点评内容对大众点评网的相应内容的市场替代,对汉涛公司的合法利益产生实质性损害。"所以,最终法院认定爱帮网构成不正当竞争,停止侵权并赔偿50万元。
5.《反不正当竞争法》修订为打击抓取数据提供新契机。本次《反不正当竞争法》修订稿明确增加了一种不正当竞争行为,即"影响用户选择、干扰其他经营者正常经营的行为"。其中第四款规定,经营者抓取他人网站数据"干扰或者破坏他人合法提供的网络应用服务的正常运行"的,构成不正当竞争。例如在乐视网诉爱奇艺、优酷不正当竞争案中,乐视网认为,爱奇艺、优酷未经许可,抓取乐视网视频的播放窗口,屏蔽了乐视网的视频网页界面(优酷还屏蔽了乐视网网址、商标),并通过设置网页广告、赚取网络流量和点击量牟利,构成不正当竞争。
三、 爬数据构成非法获取计算机信息系统数据等罪的情形
案例:南京同享网络法定代表人张某、副总经理沈某组织员工编写模拟程序,非法获取掌门科技"WIFI万能钥匙"数据库内的WIFI热点密码数据,构成非法获取计算机信息系统数据罪,判刑三年(缓刑);周某某利用Cookie劫持的方式,绕过圆通快递金刚系统权限认证爬取快递单信息,构成非法获取计算机信息系统数据罪,判刑三年三个月;王某非法获取中国兽医执业资格考试网站的考生注册信息数据刑事案件(判刑30个月);陈某等非法获取福建省公安厅交通警察总队的计算机系统的违法车主信息刑事案件(36个月)。
案例评析:根据我国《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。《刑法修正案七》首次规定,违反规定侵入普通的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据的,情节严重的,构成非法获取计算机信息系统数据罪。关于本罪理解:
1.犯罪行为人通过绕开管理权限或技术措施,仅实施了获取(复制、抓取)他人网站数据的行为;如果采用植入病毒、埋伏数据炸弹、直接删除、随意修改等行为则可能还构成破坏计算机系统等罪。
2.本罪中的数据,包括信息、文字、图片、影音资料、专有的程序或者软件等,但往往是不具有著作权法意义上的作品的独创性要求,否则构成侵犯著作权等罪。
3.本罪要求的情节严重,是指多次、大量获取他人计算机数据的行为。即为获取数据数量多、对比较多的计算机信息系统实施了非法获取行为、犯罪行为加重了计算机信息系统的工作负担、犯罪行为人获取的计算机数据有很重要意义、犯罪行为人取得了较大利益等等。
4.单位犯本罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照该规定定罪处罚。
四、启示
不爬数据的网站不是好网站,只看病不下药的医生不是好医生。通过黄春林律师前文的分析,你或许已经得出结论:有些爬,还真未必算偷!
启示1:你最好请个精通互联网的律师,他或许会教你如何维持"优雅的吃相"。
启示2:如果别人网站的数据是具有著作权的作品(例如小说、专业文章、图片、音视频等),你最好不要爬;非要爬,你最好将自己定位为搜索引擎或者网络存储等服务提供商等,并满足一系列免责条件,且遵守"通知-移除规则"。
启示3:如果是不具有著作权的结构性数据,你最好不要直接暴库使用,避免实质替代构成不正当竞争,多找几个数据来源(说不定你就有了汇编作品的著作权),并注意排查别人的数据地雷。
启示4:国家、国防事务中的数据以及商业网站中涉及隐私、个人信息的数据尽量不要爬,直接绕开技术措施(例如验证码)的事尽量不要干,摊上刑事责任就得不偿失了。
……
免费的法律服务,我只能帮到这里了。
编辑/张洁