企查查、天眼查、爱企查这些网站的数据从哪里来的?

2022-06-07 10:01:55 +08:00
 bi531334444

最近也想做个爬虫爬一爬企业信息,但是国家企业信息公示系统反爬好像很严重,企查查这些公司的数据是爬的吗?还是买的?如果是买的是从哪里买的呢?

8547 次点击
所在节点    程序员
33 条回复
Threeinchtime
2022-06-07 11:25:39 +08:00
看下这些网站左上角,你就会看到征信牌照,有这个就是官方背书了。
la9998372
2022-06-07 11:44:16 +08:00
都是关系。。。就像专利一样,本来都应该是公开的,结果养活了多少专利搜索网站?
nothingistrue
2022-06-07 12:22:20 +08:00
猜测:商务、资质等上面是买的,技术上是爬的。技术上超过买的部分不会超过一半,因为如果超过了,数据来源方完全可以踢开这些查查自己搞。

搞技术的人,最应该懂得,技术才是最容易的,难得是合规。
fireecho
2022-06-07 13:42:13 +08:00
ZmlyZTEyNTkzNzc=
lfish
2022-06-07 13:47:32 +08:00
他们有资格爬的,但是你如果爬有可能进去喝茶
27149
2022-06-07 13:49:11 +08:00
爬的。核心难点是准聚融。
cxtrinityy
2022-06-07 14:08:12 +08:00
虽然我不知道他是哪里买的, 但是我知道保护企业信息就是个幌子, 早上你去注册个公司, 出了行政服务大楼门口 5 分钟就有无数个代理记账报税公司的广告电话开始轰炸, 又快又准, 能连打一两个星期不带重的, 每天稳定一个小时至少一个, 还是 995 的
关键是啥, 关键是国家企业信息公示系统里还不显示法人联系方式
ouqihang
2022-06-07 16:20:20 +08:00
@la9998372 就国家专利公开的查询系统,那体验,其他系统类似。外面的服务也不全是收费,免费版也足够基础使用,增值服务收费也合理,毕竟创造了价值。而且能减轻官方网站自身的压力。
kaiger
2022-06-07 17:55:42 +08:00
反爬严重直接截图 + OCR
taobibi
2022-06-07 22:05:13 +08:00
估计和国政通的方式差不多。
focuxin
2022-06-08 09:07:15 +08:00
@cxtrinityy 我看了企查查的接口文档,里面的法人信息来源是企业年报里面的,你去公示系统是可以查到的
cxtrinityy
2022-06-08 11:50:42 +08:00
@focuxin 竟让还有这种操作?!我上次查一家企业法人联系方式在公示系统里翻了半天没找到,下次试试。
不过依然没法解释为啥出门五分钟个人信息被泄露的问题,我看年报里的信息是随年报一起提交的,然而刚注册是并没有什么年报提交
gumupaier
2022-06-08 15:47:03 +08:00
爬的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/857797

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX