当前位置:首页 > 新闻中心

新闻中心

“公海打鱼”: 企查查、天眼查、启信宝的数据之战

发布时间: 2024-08-10 08:12:30 |   作者: 新闻中心

  “两查一宝”都表明了自己收录的国内社会实体信息达到两三亿家。视觉中国/图

  2023年12月,企查查科技股份有限公司称正在进行上市辅导,准备登陆科创板。旗下平台“企查查”为用户更好的提供工商、司法等企业信息查询服务。据灼识咨询,该平台2022年在C端(个人用户)市场占有率第一。

  市场占有率第三的启信宝启动IPO更早。其母公司上海合合信息科技股份有限公司(下称合合信息)2023年10月在科创板注册生效,历时两年走到上市最后环节。

  此前,这些商业查询平台已发展约10年,“查公司”“查企业”的广告语和蓝色图标一度充斥着各大城市电梯间。

  10年后,“两查一宝”成为行业代名词。2022年三家在C端市场的占有率合计超过85%,位居前二的企查查、天眼查约占78%。

  灼识咨询称,具体到提供商业查询的C端产品,2022年市场规模仅为11.3亿元。

  虽然市场规模不大,但这一些平台汇聚了大量商业信息。天眼查宣称收录全国3.4亿、全球6.4亿社会实体信息,企查查、启信宝公布的国内企业收录量分别为3.3亿家、2.3亿家。

  “两查一宝”均宣称所收录的信息来自公开渠道。2014年前后,政府推动国家企业信用信息公示系统、裁判文书网等一系列网站上线,形成了一片数据海洋。多家企业凭着网络技术入海打捞,做起了数据生意。

  然而,十年竞渡,数据来源的合规性依然是悬在这门生意头上的达摩克里斯之剑。

  2014年3月,温州人陈德强和两个朋友合伙,成立了苏州朗动网络科技有限公司,开发运营一款基于微信平台的工商信息查询工具,也就是企查查的前身。

  陈德强是技术出身,他在接受各个媒体采访时说自己2010年曾在苏州新加坡电信公司带领团队研发大数据项目。这款新的查询工具一上线万用户。

  苏州当地政府给了他不少支持。公司落户在苏州工业园区,前期资金紧张,园区辅导其申报科技领军企业评比,获得了200万元的启动资金。

  启信宝也诞生在苏州工业园区,最初由苏州贝尔塔数据技术有限公司开发。此公司离企查查只有11公里,2015年被合合信息收购。

  90后吴志安曾在企查查从事技术开发工作,他告诉南方周末记者,两家的员工不少都有对方公司的工作经历。

  陈德强曾在接受各个媒体采访时表示,这项业务能做起来,要感谢当时江苏、上海等少数省份开放了工商信息。

  《上海商报》报道,2014年3月上海已上线企业信用信息公示系统,公示市场主体登记、备案、监管等信息。这比覆盖全国的国家企业信用信息公示系统完全建成早了两年。

  2014年江苏省信用办宣布,全省社会法人信用基础数据库二期工程建设完成。

  更大的背景是当时政府对信息公开和社会信用体系建设的推动。2013年3月,国务院颁布的《征信业管理条例》开始实施,采集、使用企业公开信息,开展企业征信业务有了法规依据。

  2014年6月,国务院颁布《社会信用体系建设规划纲要(2014-2020年)》,鼓励社会征信机构加强对已公开政务信用信息和非政务信用信息的整合,积极推广信用产品的社会化应用。

  在此背景下,国家企业信用信息公示系统、裁判文书网、信用中国等一系列官方信息公开平台相继上线,企业工商、司法等信息逐步向社会公开。

  北京信用学会副会长刘新海当时在央行征信中心工作,从事征信数据研究、征信系统技术规划工作。他明显感到征信热起来了。

  “当时最主要的问题是大数据,基本上所有的互联网金融公司都在找数据。”刘新海向南方周末记者回忆,那几年经常有人找他探讨如何找数据、如何分析数据的问题。有些网络公司投入20%利润、组建上百人团队处理用于风控的大数据。

  互联网金融的兴起助推了市场对征信数据的需求。2014年前后P2P网贷平台大量涌现,先是面向个人放贷,之后拓展至小微企业。

  刘新海介绍,这些新兴信贷主体往往信贷交易少、信用状况一般,并非银行等传统金融机构的主要客户,央行的征信数据难以覆盖,从而为第三方数据企业来提供了市场空间。

  区别于央行的金融信贷数据,第三方企业主要靠采集和分析企业的工商、司法等信息,用以研判企业信用状况。“这一些数据以前市场上就有,并不是2014年才出现,只是(这时)有人买单了。”刘新海说。

  在政府和市场的双向推动下,有技术能力的人开始不断涌入这个行业。2014年10月,在企查查创立半年后,搜狗首席科学家柳超辞职,在紧邻中关村的知春路上创办北京金堤科技有限公司,推出同样提供商业查询服务的天眼查。

  柳超是1999年河南高考理科状元,2003年从北京大学计算机系毕业后赴美读博。创业时他刚回国两年,此前他在美国微软研究院担任研究员,主管数据智能团队。

  在天眼查CEO郑锐彣的印象中,在美国工作时柳超已经做出了天眼查的产品雏形。2014年国内征信体系建设、大数据应用环境日趋成熟,柳超顺势创业。

  在“两查一宝”之前,企业征信服务一直存在,邓白氏、益博睿等征信巨头开展这项业务已有百余年历史。

  顾群曾在邓白氏和益博睿工作逾十年,之后前往企查查担任全国销售总监。他告诉南方周末记者,邓白氏和益博睿也提供和“两查一宝”类似的服务,征信业内称之为信用概览报告。

  不同的是,传统征信巨头的服务主要面向企业等B端客户。客户提出需求后,公司有专门团队开展人工调查,其间也会搜集工商、司法等政府公开信息,整合分析后形成报告提供给客户。

  顾群在传统征信机构任职期间,曾有一家大型游戏厂商委托公司调查其近千家合作商的信用情况,公司一口气出了1000多份报告。当时一份报告收费几百元,需要3-5个工作日或一周时间完成。

  但“两查一宝”出现后,这部分业务开始锐减。这一些平台用网络技术进行数据搜集和分析,按照所提供信息的详尽程度收费,打开电脑或手机就能查询。

  “传统征信机构的部分业务已经被互联网模式颠覆了。”顾群说,以往传统征信机构的信用概览报告能为公司创造近30%营收,这项业务被逐步取代。

  更大的不同是,“两查一宝”开辟了面向C端客户的商业查询市场。此前,一个人想要查询企业工商、司法等信息,只能到政府办事大厅窗口申请,有些只允许律师等专业技术人员查询。

  郑锐彣介绍,天眼查的主要利润来自会员收费,2017年推出会员制当年就实现了盈利。这中间还包括B端客户付费,但C端会员营收更大,是其最大的利润来源。企业主、律师、财务专员等有商业信息查询需求的群体构成了主要用户群。

  天眼查向南方周末记者提供的信息数据显示,目前月活跃用户数达3500万,累计用户数超6亿。企查查则在官方微信公号宣称,2023年用户突破5亿。

  张恒曾在企查查担任销售负责人。他告诉南方周末记者,企查查约七成营收来自C端客户。

  “董事长的状态就是每天看手机。”周建南曾是企查查的中层管理者,他向南方周末记者回忆,董事长陈德强在公司最关心的就是企查查App的用户数据,产品负责人由企查查的004号员工担任。

  C端业务的利润率也更高。合合信息披露的多个方面数据显示,启信宝所代表的商业大数据C端业务毛利率在80%以上,B端业务为50%-70%。顾群介绍,企查查的毛利水平与之相当。

  刘新海曾在布鲁塞尔的金融分析公司和互联网数据公司担任顾问。他介绍,国外也有彭博社等企业来提供类似的商业查询服务,但和垂直产业的结合更深,侧重为客户提供定制化服务,创始人和主要研发人员大多有商业或经济背景。

  “两查一宝”所代表的国内商查平台则是技术驱动,创始人都出自IT行业,更注重产品的通用性。“特别定制化的那种(服务),大概率是不会做的。” 郑锐彣坦言。

  在他看来,深耕行业、提供定制化服务是传统征信巨头在互联网尚不发达的时代形成的商业策略。天眼查这样的商查平台更多是从互联网产品的方面出发,追求提供共性服务,以此来做大规模、降低成本。

  周建南还在企查查工作时,感受到老板不愿意做定制化生意,有时客户找过来,公司也会拒绝。“他们的思路就是‘我只做标品’。”

  这让周建南不太理解。随后他离职创业,专做细分领域的数据服务。张恒也做出了相似选择,离开企查查自己创业做定制化数据服务。

  面向C端用户更好的提供通用服务,伴随的问题是产品同质化明显。点开“两查一宝”的网址,相似的界面和查询服务让人难分彼此。以启信宝披露的数据分析来看,付费用户的比例也不高,只有1%左右。

  三家的竞争逐渐演化为营销大战。“关键是用户量。用户只会用一家的产品,谁的曝光量大,就能慢慢占领用户心智。”曾在天眼查从事公关工作的林静怡对南方周末记者说。

  天眼查是业内第一家大规模开展营销宣传的公司,2018年开始大量投放广告,2019年聘请热门电视剧《人民的名义》中达康书记扮演者吴刚出任品牌代言人。当时不止北上广深,三四线城市的公交站、电梯间也能看到天眼查的广告。

  林静怡透露,高峰时天眼查一年的线亿元。同行也纷纷跟进,合合科技披露启信宝2020年广告宣传费超过7000万元。因为投入还是比竞争对手少,公司在招股书中承认,这导致启信宝付费用户比例及新增付费转化率下降。

  企查查和天眼查还因为广告语闹上了法庭。2019年天眼查起诉企查查冒用其广告语,2020年企查查又起诉天眼查不正当竞争。

  除了广告,天眼查还率先采用媒体合作的方式提高曝光量,为记者免费开通会员。因为新闻报道需要注明信息源自,记者引用后,天眼查能借助新闻的传播实现曝光。

  “公关部的一个主要(考核)标准就是媒体引用量。”林静怡透露,公司要求这一指标每个月都要有所增长。为促进媒体引用,他们会组建媒体群,及时整理公司变动信息,形成新闻线索发到群里供记者参考采用。

  林静怡每天盯着各种公司的信息变动,平台一有更新就挖掘有价值的信息推送出去,像记者一样拼眼力、抢速度。尤其关注明星工作室或旗下公司的变动,这一些信息更容易在社交平台上形成热搜。

  对媒体的拜访量也计算在考核范围内。另一位公关人员告诉南方周末记者,他一个月要拜访八十多位“媒体老师”。

  继天眼查之后,其他平台也开始模仿这一做法。为避免同行抢媒体,各家又开始付费和媒体签订独家使用协议。一位内部的人偷偷表示,有些媒体一年签约价高达上百万,有些一二十万。

  “两查一宝”都在官网标注了自己的数据来源,均为全国企业信用信息公示系统、中国裁判文书网、国家知识产权局等政府网站。看起来似乎门槛很低,用网络技术从公开网站上抓取数据来进行整理分析就可以。

  现在在百度上搜索“商业查询”,排名第一的是“商商查”。界面与功能和天眼查、企查查相似,打着“免费查企业,就用商商查”的标语。这一平台2023年才上线,控制股权的人网筑投资管理有限公司是做建材供应链服务起家的。

  互联网巨头也在进入。2020年百度推出爱企查,一上线就以免费策略吸引客户,但2022年5月爱企查开始会员收费,市场占有率到今天都没有超过“两查一宝“。

  郑锐彣认为,相比价格,商业查询平台的用户更看重信息获取的效率和质量,挨个在公开网站上检索数据并深入分析,对个体而言并不是特别容易,谁能更好地解决这一痛点才是商业查询平台竞争的关键。

  “你可以认为这是一片公海,没有私海,没有个人鱼塘。但是从海里能捞出来多少东西,各凭本事。”郑锐彣把互联网爬虫比喻成船,公司要驾驭3300到4000艘这样的船,保证其正常运作,并把所消耗的算力资源降到最低。

  他说这并不是一件简单的事,获取数据后对数据的清洗和挖掘难度更大,技术团队是天眼查最核心的部门,服务器等算力资源采购和技术人员薪资是公司最大的成本。

  企查查同样重视技术团队。吴志安还在企查查技术部门工作时,发现负责数据抓取、清洗、分析的大数据团队,是企查查技术部门的核心,大约四五十人,有单独的办公空间,设有专门门禁,和其他技术人员分隔开来。

  各家比拼的是谁的数据更全面、分析更深入、更新更及时。周建南透露,B端客户在采购数据服务时,会专门挑一些新近更新工商资料的企业,测试供应商数据库的准确性。

  不同平台之间也会互相爬取,试图获取对方的独家数据。为防止这样的一种情况,各家都有反爬机制。

  但郑锐彣表示,真正核心的是数据分析。即便是同样的数据,不掌握处理规则,依然没办法形成结论,实现股权穿透、识别空壳公司等目的。而这些规则需要在大量数据处理中积累,即便互联网巨头也难以短时间取代。

  “我有13000条数据处理规则,你就算有再好的技术,请问你从哪里得到这些规则?”

  对于从政府网站爬取数据,包括郑锐彣在内的多位行业人士都向南方周末记者表示,这一做法并无资格要求,也无需向政府付费。但为保障运行稳定,政府网站一般会设置反爬机制,关键是如何绕开。

  作为平台公布的数据来源之一,国家知识产权局一位工作人员告诉南方周末记者,这类商业行为和国家知识产权局没关系,该局既不知晓其数据如何获取,也不进行管理。

  《征信业管理条例》明确,征信机构能够最终靠信息主体、企业交易对方、行业协会提供信息,政府有关部门依法已公开的信息,人民法院依法公布的判决、裁定等渠道,采集企业信息。

  这成为商业查询平台的法规依据,“两查一宝”都在网站醒目位置标注自己是官方备案的企业征信机构。

  郑锐彣认为,要规范市场建设,政府一定要信息公开,在这样的市场环境中,商业查询平台是一只“益虫”。“我们在提高大家获取信息的效率,打破信息不对称。”

  不过,爬取公开网站并不是商业查询平台获取数据的唯一方式,数据还可以买。

  合合信息招股书披露,向供应商采购是其获取企业数据的重要方法。2022年公司采购数据花费814.3万元,2021年这一数字超过千万元。

  郑锐彣表示,天眼查部分数据也是采购而来的,但采购数据是作为补充,这些并非公司业务需要的核心数据,花费资源抓取、处理并不划算,向第三方供应商采购性价比更高。

  以合合信息为例,其上游数据供应商包括东方财富信息股份有限公司、人民数据管理(北京)有限公司等。

  东方财富招股书披露,其主要向上证所信息网络有限公司采购金融数据。该公司为上海证券交易所2003年设立的全资子公司,负责对外发布和管理上海证券交易所实时行情、开发信息产品等。

  公司官网显示,提供股票期权行情、固定收益行情等数据产品,收费标准和应用限制范围均有公示。如股票期权行情数据,一年收费5万元,合法成立的信息经营单位均可申请购买,在许可范围内合法使用。

  人民数据的数据来源则包括网络抓取和采购两种,某些特定的程度上扮演了数据分销商的角色。

  南方周末记者咨询时,人民数据一名工作人员介绍,公司有专门的技术团队,舆情等数据利用互联网抓取获得,海关等数据从专门收集、处理此类数据的第三方供应商处采购再对外出售。

  商业查询平台也对外出售数据。但为了尽最大可能避免培养竞争对象,有些客户找上门来也不卖。周建南回忆,他还在企查查工作时,一名销售同事曾联系到中国电信旗下一家研究院,对方开高价想买企查查整个数据库,老板拒绝出售。

  对于商业查询平台获取的数据是不是完全合规,包括接近征信业监管层的专家及技术人员在内,多位受访者都向南方周末记者表达了质疑。核心问题就在于,这一些平台是否通过非公开渠道、获取非公开数据?

  一些业内人士认为,商业查询平台目前实现的多层股权穿透、企业关联分析等内容产品,必须要掌握企业关键人员的身份证号才能实现,而这并非公开信息。

  郑锐彣对此予以否认。他表示,这些功能能靠算法实现,天眼查并不掌握身份证号等非公开信息。

  这一质疑背后更大的担忧是,掌握公众数据的政府部门是否会将数据以非公开方式授予特定企业,从而损害公众利益?两位接近征信业监管层的收房的人说此前存在此类现象。

  2020年6月,深圳微众信用科技股份有限公司申请科创板IPO。招股书披露,该公司曾是9省市“银税互动”平台的运维方,负责搭建税务部门与银行共享数据的技术平台。2021年2月1日,上海证券交易所公布,微众信科因实际控制人涉嫌贪污、贿赂、侵占财产等违背法律规定的行为,上市进程被中止。

  刘新海认为,企业信息不同于个人隐私信息,在市场经济中大部分企业信息都应该公开,也应该被允许交易。“关键是需要公开透明、公平合理的交易渠道。”

  目前,企业征信机构由央行实行备案管理。但在备案公告中,央行表示,“本备案不视为对该机构征信数据质量、服务水平、内控与风险管理能力、IT技术实力、业务合规情况等的保证。”

  原央行征信中心副主任汪路向南方周末记者解释,企业数据不涉及个人隐私,应加强信息公开,所以管理相对宽松,只要求企业征信机构备案即可,不需另行审批。

  并且,社会信用体系建设由发改委和央行共同牵头,央行关注的主要是金融信贷数据。所以虽然在央行备案,但商业查询平台涉及的工商、司法等数据信息实际已经超出央行的监管范围。

  合合信息递交招股书后,上海证券交易所专门就其数据合规性进行了问讯。多位业内人士认为,数据来源是否合规将是合合信息、企查查等公司能否顺利上市的关键。