http://wenshu.court.gov.cn/ 想爬取搜索结果的统计信息,比如,搜索一个关键词,抓取左侧的年份,地域,案由筛选等等信息。 看了一些资料,反扒措施貌似很多,这样的需求应该不至于触发反扒措施吧
1
18817837227 2018-05-07 14:21:38 +08:00
|
2
sjmcefc2 OP @18817837227 非常感谢哈。
有没有简单成型的,目前不需要爬下文档,只要个搜索之后的左边的统计信息就好了 |
3
18817837227 2018-05-07 14:38:19 +08:00
github 上有很多写好的爬虫,试试能不能用?
|
4
sjmcefc2 OP @18817837227 ok,话说,如果爬上面的文档,用什么数据库存储比较好?
|
5
18817837227 2018-05-07 14:41:49 +08:00
个人爬,量不多就一个表,就 mysql 呗。
用别人的代码,那就看代码用的是哪个库就用那个 |
6
jssyxzy 2018-05-07 18:51:01 +08:00
python/scrapy
文件或者上数据库 |