V2EX › locoz 的所有回复 › 第 307 页 / 共 323 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 303 304 305 306 307 308 309 310 311 312 ... 323

❮

❯

2018-11-15 11:29:30 +08:00

回复了 Static2015 创建的主题 › 问与答 › 大佬们有没试过爬简单网站的用户信息出来？

用户信息指的是公开可见的还是不可见的？？不可见的爬不了

2018-11-15 11:27:45 +08:00

回复了 PPing520 创建的主题 › 问与答 › 喜欢日式 RPG 游戏，想玩掌机我该选择 switch 还是 psv

小孩子才做选择，大人全都要，两个都买，双倍的快乐 https://ws4.sinaimg.cn/bmiddle/62e721e4gw1et02g5wksrj200k00k3y9.jpg https://ws4.sinaimg.cn/bmiddle/62e721e4gw1et02g5wksrj200k00k3y9.jpg https://ws4.sinaimg.cn/bmiddle/62e721e4gw1et02g5wksrj200k00k3y9.jpg

2018-11-15 00:44:56 +08:00

回复了 aaa5838769 创建的主题 › 问与答 › 你们电脑优化软件用那些？

不优化，性能碾压就能解决 99 ％的问题了

2018-11-15 00:44:03 +08:00

回复了 whoami9894 创建的主题 › 程序员 › 请教一个 post 请求体被 URL 编码的问题

不一定是这个问题，建议直接抓包对比

2018-11-15 00:18:57 +08:00

回复了 pythonee 创建的主题 › 程序员 › 有点想入一个 Raspberry PI 玩下，不知道大家有什么好的玩法推荐？

当然是当摆设和灰尘收集器啊

2018-11-14 08:56:56 +08:00

回复了 kinghero 创建的主题 › 问与答 › 本地深度学习编程在服务器调试有什么好的方法吗

不过 vscode 应该也有插件可以做到类似效果，可以找一下

2018-11-14 08:56:22 +08:00

回复了 kinghero 创建的主题 › 问与答 › 本地深度学习编程在服务器调试有什么好的方法吗

pycharm 挺好的你又嫌笨重。。那就只能舍弃方便性了

2018-11-13 15:16:33 +08:00

回复了 nathandu 创建的主题 › 问与答 › 萌新求助，关于跳槽

我膨胀了。。连这种帖子都敢点进来了 https://ws4.sinaimg.cn/bmiddle/62e721e4gw1et01xu1r3aj200k00k3y9.jpg

2018-11-12 21:40:06 +08:00

回复了 tzhhahaha 创建的主题 › Python › Python 在上海什么程度才能找到工作？

@locoz #16 补充一下，git、docker 这些工具，主要得看公司内部用什么，等用到了在学也不迟。

2018-11-12 21:34:36 +08:00

回复了 tzhhahaha 创建的主题 › Python › Python 在上海什么程度才能找到工作？

首先吐槽一下，文中有病句，如果是简历中出现病句和错别字的话挺减分的。
然后大四为什么不去校招？难度低工资高还容易进大厂。
水平的话，据我了解的情况来看，算是应届生的平均水平／部分混日子混出两三年经验的人的水平，主要看你想往哪个方面发展。

爬虫方面可以尝试搞一些比较难爬的网站、app。请求带有加密参数的尽量通过逆向 js、apk 的方式破解，而不是直接拿 selenium 去怼。然后爬的量大一些，并且通过各种方式提升爬的速度。
后端方面其实一般情况下工作也就是写点业务代码，curd 写得熟练、了解常用的数据库、知道什么情况该用什么就差不多了。

2018-11-09 21:23:43 +08:00

回复了 smallgoogle 创建的主题 › Python › 谈谈网易云的反爬机制

不换 IP 又不在限制范围内当然会被封 IP 啊。。

2018-11-08 17:33:37 +08:00

回复了 Luckyray 创建的主题 › 程序员 › 有点头疼，接个小活不知道怎么收费。

看源站难度定，难度不高的话可以 1，难度一般的话 1 或 2，难度高的话按市场价打 8 折外加后续维护收费

2018-11-08 16:39:29 +08:00

回复了 bmos 创建的主题 › Python › 爬虫如何接收过几秒下载的文件

@bmos #11 不要凭感觉确定，直接在代码里加上使用代理服务器，然后用 Fiddler 之类的先抓一个浏览器上打开的正常请求，再跑一遍代码抓一个你自己发出去的请求，对比一下有问题的地方就很明显了

2018-11-08 13:17:18 +08:00

回复了 bmos 创建的主题 › Python › 爬虫如何接收过几秒下载的文件

对比一下自己发出去的请求跟正常在页面上发出去的请求之间的区别是可以最有效率地解决此类问题的办法

2018-11-08 13:13:55 +08:00

回复了 evin 创建的主题 › Python › 有没有现成的轮子可以抓取指定数量的 google 或者百度的搜索结果？

直接用别人的接口吧，比如 http://www.idataapi.cn/

2018-11-08 13:12:21 +08:00

回复了 337136897 创建的主题 › Python › Python 判断两个字符串内容相同的字符串，却返回了 flase

@gstqc #15 哈哈哈哈哈哈哈哈哈哈真实

2018-11-08 13:00:04 +08:00

回复了 111qqz 创建的主题 › Python › 如何在前端用 api 同时调用多个 scrapy 编写的爬虫？

挽尊
这个需求不太适合直接使用 scrapy 来做，可以用 web 框架+http 请求库，把爬虫做成接口的形式。比如使用 flask+requests，简单粗暴就能实现；或者是用 tornado 这种自带 server 和 client 的，又不需要特殊处理性能问题、又能在不依赖其他 http 请求库的情况下发出 http 请求。
部署方面多容器做负载均衡是可以的，但是如果是在同一台机器下启动多个的话其实意义不大。

2018-11-08 12:54:15 +08:00

回复了 ucun 创建的主题 › Python › 每周送免费 10 个爬虫项目

“单应用，即不需要代理、没有很变态的验证码、没有很复杂的 JS 解析”。。那不就是写 xpath 和正则吗，这种难度其实没啥必要拿来练手。
直接找个应用商店把热度排行前 100 里大厂的社交媒体类 APP 的网站版和 APP 版都爬一遍，这种有难度的才能叫练手。

1 ... 303 304 305 306 307 308 309 310 311 312 ... 323

❮

❯