想写一个新闻爬虫,没做过后端,只写过简单的 PHP,怎么入手?

2015-06-23 18:28:28 +08:00
 fghfjujiber

看了一下好像大部分都用Python,也有PHP的,还有现在的爬虫框架成熟吗?那直接调用的话开发应该很快吧?

2244 次点击
所在节点    问与答
7 条回复
xmbaozi
2015-06-23 18:39:56 +08:00
pyspider
lonelygo
2015-06-23 18:48:09 +08:00
@fghfjujiber 我貌似也有和楼主一样的想法,问题是,我啥端都没弄过😢。
python看了几天学习了下语法。
git找了个爬虫看了看代码,貌似框架成熟,关键是怎么分布,怎么处理反爬,怎么找免费代理,当然了,分析网页是基本能力。
LZ,一起玩呗(本人基本工作后就没碰过代码,有点汇编的底子)。
thanksir
2015-06-23 18:58:16 +08:00
python的话可以考虑pyspider、pyquery、scrapy
php可以考虑phpquery
比较而言,python更适合做爬虫
yytsjq
2015-06-23 18:59:01 +08:00
PHP Simple HTML DOM Parser
fghfjujiber
2015-06-24 09:47:20 +08:00
@lonelygo 可以哦!约起!
fghfjujiber
2015-06-24 09:47:36 +08:00
那看来还是python比较适合哦!
lonelygo
2015-06-24 10:09:58 +08:00
@fghfjujiber 哈,约。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/200608

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX