新手想请教一下,想用 python 在服务器上搭建一个爬虫页面来爬取指定网站的新闻资讯,这个在网上有哪些比较合适的教程可以参考的?谢谢!

2014-09-30 15:28:02 +08:00
 2232588429
以前使用过这样的页面,就是按照时间刷新新闻标题列表,然后点击标题就可以进入别人的网站阅读内容。想请大家帮忙推荐一下这方面比较合适的教程。
4707 次点击
所在节点    Python
5 条回复
zxcsf
2014-09-30 16:24:37 +08:00
fxbird
2014-09-30 20:13:56 +08:00
这玩意儿居然都出中文文档了,很强么?
orzfly
2014-09-30 20:38:22 +08:00
pyspider 也是个好东西 =。=
https://github.com/binux/pyspider
brickgao
2014-10-02 12:01:16 +08:00
处理新闻有一个叫 newspaper 的包

http://newspaper.readthedocs.org/en/latest/
GeekGao
2014-10-02 22:01:02 +08:00
scrapy 足以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/136549

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX