V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  toono  ›  全部回复第 8 页 / 共 16 页
回复总数  306
1  2  3  4  5  6  7  8  9  10 ... 16  
2017 年 9 月 22 日
回复了 saximi 创建的主题 Python 请推荐关于 Scrapy 包用法的中文版学习资料
@saximi

1. 这是看需求的,__init__方法的意义就是在于初始化。MyAgentMiddleware 中的__init__编写的意义在于记录我的 user_agent 的数目,方便后面的逻辑中使用 random 的随机方法。

2. 哈哈,这个是手误,原本打算用类似于 pipelines.py 中 MongoDBPipeline 的类初始化方法的,但是觉得直接写__init__方法更简便。

3. 我这里没有 return 语句实际上就是 return 了 None。

引用:如果其返回 None,Scrapy 将继续处理该 request,执行其他的中间件的相应方法,直到合适的下载器处理函数(download handler)被调用, 该 request 被执行(其 response 被下载)。

也就是我返回 None 的话,会继续按照 settings.py 的配置按顺序执行其他 Downloader Middleware。假如返回了 Response 对象,则会直接到达 spider 中 call_back 对应的方法进行返回的解析了。

4. 会有顺序,顺序就是 settings.py 中的优先级(数字)。为了爬虫群功能清晰,所以不同作用的功能分成不同的 Middleware 了。有的时候某个 Middleware 是某个爬虫特异需要的,那样子就可以做爬虫内配置去启用或者关闭 Middleware。有点拼乐高的意思。

像你说的合在一个类并非不行,只是不好。

5. 我认为开始爬虫的时候 spider 就是被开启的。你可以在 open_spider 方法调试输出,被调用的次数并不多。另外可以参考一下核心 API 状态收集器(Stats Collector) API。
2017 年 9 月 21 日
回复了 saximi 创建的主题 Python 请问有没有这样的爬虫代码范例
2017 年 9 月 21 日
回复了 ErnestChan 创建的主题 程序员 喜欢一个妹子不敢开口怎么办?
要是能群聊开始聊骚就好办了
2017 年 9 月 8 日
回复了 huangshu 创建的主题 iDev 没有基础学习 IOS 怎么入门啊?没有编程基础
想说 3 楼提到的 cocoa 并不是指论坛,而是指 Apple 的开发库。

作为从 OC 开始学习 iOS,然后再学习 swift 的人。觉得如果从 swift 学起的话,先看官方的最新的文档教程,然后可以去看看斯坦福的 iOS 公开课。视频的 swift 版本旧并不要紧,自己查询到对应的最新语法就行了。

既然不是专业开发 iOS 的话,就可以大胆用 storyboard 去写 UI 界面,不需要考虑太多性能的问题。
对于 iOS 开发项目结构的组织,建议看看一些入门级的 demo。例如某个网络库的使用 demo 项目,可以看到简单的项目结构组织。
2017 年 9 月 2 日
回复了 saximi 创建的主题 Python 请推荐关于 Scrapy 包用法的中文版学习资料
那不介意的话可以看看我在写的爬虫 https://github.com/ToonoW/TopicsSpiders
楼上+1,自定义过滤器不复杂。可行
2017 年 9 月 1 日
回复了 saximi 创建的主题 Python 请推荐关于 Scrapy 包用法的中文版学习资料
@saximi 想问一句,公司断网,要这爬虫有何用(摔
2017 年 9 月 1 日
回复了 saximi 创建的主题 Python 请推荐关于 Scrapy 包用法的中文版学习资料
@friejq 😂你的公司是我知道的第一家。我同学们的公司都没有这样。

难道你们做金融的?
2017 年 9 月 1 日
回复了 saximi 创建的主题 Python 请推荐关于 Scrapy 包用法的中文版学习资料
辛苦了,公司竟然断网
重磅😂
2017 年 6 月 13 日
回复了 yanwen 创建的主题 macOS QQ 6.0 要来了??
谁帮我挂一下我的 Q 宠去上学打工
2017 年 5 月 1 日
回复了 bytedance01 创建的主题 北京 [社招]今日头条效率工程团队招聘——多个技术岗位
“平常” 🌚
2017 年 3 月 13 日
回复了 falseen 创建的主题 Python 关于 pyqt5 跨进程操作 ui 的问题。
差点大意了 ,果然是进程间通信
2017 年 3 月 13 日
回复了 Andor_Chen 创建的主题 iDev 送几本《 Swift 学习手册》
拉低概率+1
可以有一段思考人生的冗余代码 (逃
2017 年 2 月 17 日
回复了 nonozone 创建的主题 无印良品 MUJI passport 的 ID 是全球网站通用的么?
kkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
2017 年 2 月 17 日
回复了 toono 创建的主题 数据库 [Mysql]怎么优雅地将一个表格的数据拆分成几个表格?
@CosimoZi 为什么不用外键?不用外键的话拆分表好像就没什么意义了?
1  2  3  4  5  6  7  8  9  10 ... 16  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1005 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 19:39 · PVG 03:39 · LAX 12:39 · JFK 15:39
♥ Do have faith in what you're doing.