于国强律师|判赔1250万!爬虫抓取公开交通数据,法院为“数据生意”划下刚性边界

一组交通拥堵数据被企业通过爬虫抓取,纳入自身金融终端作为付费服务。它并非传统“商业秘密”或知识产权,普通用户可查看、技术人员可抓取,这种“看似无主、实则有界”的特性,让这起“拥堵延时指数”案成为极具行业警示意义的典型判例。

该案直击核心困惑:互联网公开数据能否随意抓取?抓取后商业变现,属合法流通还是不正当竞争?

原告为高德地图相关运营主体,被告为万得公司。法院认定,被告未经许可破坏技术保护措施,持续抓取数据且未再开发,直接有偿提供给用户,构成不正当竞争,判令其停止侵权、赔偿1250万元,二审维持原判。

涉案“拥堵延时指数”,是车辆实际与畅通通行时间的比值,由地图企业投入成本,基于多类数据及算法加工而成,凝聚经营投入,具有商业价值和竞争利益。

该案并非简单的“数据所有权”纠纷,法院未否定所有爬虫行为,而是建立裁判逻辑:判断抓取行为合法与否,需考量数据形成、公开方式、持有人限制预期及抓取者使用方式四大要素。

这条边界影响广泛,所有依赖爬虫的企业均需重新核查数据来源与使用模式,明确核心认知:公开≠无主,可见≠可拿,能爬到≠能卖钱。

核心裁判要点一:公开≠合法,关键看数据持有人是否明确“禁止抓取”

很多企业认为“公开数据即可抓取”,这种认知极易误导决策——“公开”只是分析起点,并非合法依据。

北京知识产权法院明确,涉案数据虽公开,但系企业投入形成的“具有公共属性的企业数据”;持有人设置Robots协议等技术措施后,被告未经许可破坏措施抓取,构成不正当竞争。

“公共意义”不等于“无偿开放”,法律保护的是企业基于投入形成的数据成果及竞争利益,而非公共现象本身。

该案核心信号:数据能否使用,需综合考量公开细节、持有人限制及使用行为是否替代原产品。

法院明确区分抓取阶段:原告未设保护措施时,被告抓取未违预期;原告设措施后,被告绕开限制、原样转售,实质性替代原产品,这是其构成不正当竞争的核心原因。

法院未否定爬虫技术本身,真正违法的是“突破明确边界+直接商业变现”,被告行为本质是将他人劳动成果据为己有。

律师提示:技术可实现不代表法律可允许,绕开措施抓取节省的授权费,终将以判赔、合规重构等方式付出代价。

核心裁判要点二:Robots协议非万能钥匙,却是“合理预期”的关键佐证

市场对Robots协议存在两种极端认知,均不符合司法逻辑:既非“设置即违法”,也非“可随意无视”。

Robots协议并非法律规范,而是数据持有人的技术边界声明,单独使用不足以解决争议,但可与用户协议、反爬措施等证据印证,证明持有人“禁止批量抓取转售”的合理预期。

法院裁判要旨:判断抓取行为正当性,需结合多方面客观情况,考量持有人合理预期;违背该预期的抓取行为,具有不正当性。

“合理预期”是核心裁判工具,反不正当竞争法的作用的是审查竞争行为是否违背诚信、损害他人利益,无需先界定数据所有权。

核心判断标准:企业盈利是靠自身投入创新,还是靠绕开边界、转售他人数据产品。

这与2025年修订的《反不正当竞争法》衔接,该法第十三条明确禁止“避开技术措施获取、使用他人数据”。

本案一审适用旧法一般条款,新法则明确规制此类行为,合规要求更清晰,该案成为新旧规则衔接的重要载体。

律师提示:企业不能再以“法律未禁止爬虫”为借口,未来合规审查需聚焦五大核心问题,否则爬虫将成为重大诉讼风险点。

核心裁判要点三:数据流通≠原样搬运,再开发与转卖之间有明确红线

法院评价不仅覆盖“如何抓取”,更关注“如何使用”。很多企业忽视使用环节合规,而这恰恰决定商业后果严重程度。

法院明确,被告未授权、未再开发,直接有偿提供数据,构成不正当竞争,打破了数据企业的侥幸心理。

数据市场鼓励正当二次利用:企业通过合法渠道获取数据后,结合自身能力加工形成新产品,属于合法创新。

但“原样抓取+有偿转售”,导致客户不再依赖原数据产品,本质是“不劳而获”,属不正当竞争。

核心区别:是否有新投入、新价值,是否避免替代原产品。真正的再开发是加工“原材料”,而非转售“成品”。

1250万判赔极具警示意义,对“先抓了再说”的企业而言,最危险的是商业模式被认定为不正当,而非爬虫被封。

律师提示:商业模式违法将引发产品下架、赔偿、供应链重构等一系列危机,爬虫工具可能演变为公司层面合规风险。

企业合规指引:数据持有人与使用方的双向注意义务

该案对两类主体均有明确指引,核心是“明确边界、规范行为、留存证据”。

对数据持有人:沉默不是保护,主动设界才是关键

数据持有人不能事后主张权利,需在公开展示数据时,明确规则、设置措施并留痕,让边界可被外部识别。

律师建议,保护公开衍生数据需采取五项措施:

  • 明确规则:在用户协议中清晰约定数据访问、使用等具体规则;
  • 设置措施:对核心数据设置Robots协议、访问限制等技术措施,留存证据;
  • 建立授权:搭建商业授权机制,留存授权合同、收费记录;
  • 固定证据:及时留存异常抓取相关证据,包括IP、访问记录、绕开措施过程等;
  • 留存投入:保存研发成本、人员投入等证据,证明自身劳动付出。
  • 数据权益保护需靠实际措施和证据支撑,仅口头主张“投入大”难以获得法院支持。

    对数据使用方:公开不是授权,合规审查必不可少

    “网页能打开即可抓取”的认知已不合规,极易引发法律风险。

    律师建议,抓取或采购数据前,需完成三项核心审查:

    • 审查来源:明确数据来源,采购第三方数据需核查授权及赔偿约定;
  • 审查方式:确认是否绕开登录、反爬措施等限制手段;
  • 审查用途:明确是否原样展示、替代原产品,是否涉及敏感数据。
  • 第三方数据采购并非“避风港”,若供应商来源违法,购买方明知仍使用,需承担相应责任,合同无法“洗白”不正当竞争行为。

    律师提示:数据使用方需将来源合规纳入流程,明确供应商义务、核查数据风险,数据合规应上升为公司层面重点。

    结语:保护的不是垄断,而是公平的竞争秩序

    本案并非鼓励数据封闭,而是在保护与流通间寻求平衡——数据保护过度阻碍流通,保护不足打击创新,该案提供了可操作的裁判方案。

    过度保护将导致数据垄断,放任抓取则会淘汰数据生产者,均不利于市场健康发展。

    本案保护的是“投入与使用的公平距离”:企业可合规获取、分析、再开发数据,但不得突破边界、替代原产品。

    该规则利好数据市场:既保护持有人的合法利益,也为合规利用者保留流通空间。

    法律否定的是“逃避授权、绕开限制、转售他人成果”的灰色商业模式。

    数字经济的底线是:数据可流动,但不能破坏他人边界;商业可竞争,但不能侵占他人投入。

    这起案件给所有数据企业提了醒:数据时代的合规能力,不是“能抓到数据”,而是“能说清为何有权获取、使用数据”。