V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  locoz  ›  全部回复第 265 页 / 共 318 页
回复总数  6351
1 ... 261  262  263  264  265  266  267  268  269  270 ... 318  
2019-09-19 10:22:07 +08:00
回复了 buaishi 创建的主题 Python 新手学 Python 爬虫
偷偷打个广告,我之前发的文章也可以看看。我现在和几个号主一起组建了 NightTeam 团队(微信公众号沿用了之前的 [小周码字] ),未来发布的文章也可以看看,都是高质量文章,跟那些一天到晚标题搞噱头、内容纯水的号不一样。
2019-09-19 10:18:25 +08:00
回复了 buaishi 创建的主题 Python 新手学 Python 爬虫
先定义一下爬虫的两种方向:
垂直爬虫指只爬特定的某些网站,且对所需数据都进行标准化、格式化的爬虫
通用爬虫指做搜索引擎、新闻聚合等用的那些爬虫,什么网站都爬,但只需要提取一些浅层的数据

然后你可以先看看崔庆才的书,现在他那个书的第一版已经免费了,在博客上就能直接看,虽然不算很深,但广度基本足够了,入门的时候用来了解一下还是可以的。
然后看方向决定是深入哪方面,如果想往垂直爬虫方向发展就深入逆向,如果想往通用爬虫方向发展就深入算法、机器学习。
2019-09-19 10:11:57 +08:00
回复了 Osk 创建的主题 奇思妙想 v 站的大佬多, 有没有人试过用半导体制冷片来制热的?
2019-09-19 08:16:11 +08:00
回复了 Osk 创建的主题 奇思妙想 v 站的大佬多, 有没有人试过用半导体制冷片来制热的?
不靠谱,可以看看 LinusTechTips 的这个视频。
http://www.bilibili.com/video/av68026329
2019-09-17 19:05:14 +08:00
回复了 iiduce 创建的主题 分享发现 日本买了款眼药水真好用,国内就没有类似的吗?
眼干尽量热捂、打哈欠刺激分泌泪液,实在不行就用人工泪液
2019-09-17 19:04:18 +08:00
回复了 iiduce 创建的主题 分享发现 日本买了款眼药水真好用,国内就没有类似的吗?
首先,这种眼药水少用,已经被丁香医生发文说过好几次了。
然后这个价格...真的暴利,之前去日本的时候了解了一下实际价格之后,发现参天的这些眼药水代购回来都是几倍至十几倍的价格,像微商特别喜欢吹的那个 FX 眼药水,日本买一盒就相当于人民币十几块,国内代购很多都卖几十、上百。
至于你这个...我查了一下之前查商品码查到的几个价格正常的日本药店网站,价格差不多是 40-50 人民币左右,你找的代购给你翻了两倍的价格...
日常来讲没什么感觉,现在主要还是部分区域信号覆盖不足导致网速差,但是覆盖足够的区域想干啥干啥,加载时间并不是什么问题。
2019-09-16 15:41:25 +08:00
回复了 Gnepre 创建的主题 硬件 有没有适合放在家里 24 小时运行的电脑或服务器?
只要供电和散热稳,什么电脑都可以。(数据重要的话额外注意一下硬盘方面买企业级的。
2019-09-14 22:08:26 +08:00
回复了 hugebug 创建的主题 程序员 码农哪个领域的中年危机能相对小些?
写会让人有中年危机感觉的公众号文章,然后收产生感觉了的人的智商税😂有些人已经这么做到年入百万了
2019-09-14 14:42:18 +08:00
回复了 mainlong 创建的主题 Python requests 为什么不走代理还要往 Network Proxy (socks)身上凑?
@mainlong #13 碰到这种问题,看看代码就知道了,反正 python 的库都是可以直接看到源码的
2019-09-13 14:45:00 +08:00
回复了 mainlong 创建的主题 Python requests 为什么不走代理还要往 Network Proxy (socks)身上凑?
看文档谢谢,这是 requests 本身的功能,只要环境变量里有设置代理服务器地址,requests 就会自动作为 proxies 的值放进去使用。
由于你设置的环境变量是 socks5 协议的代理服务器,在没有安装 socks5 相关依赖的时候,requests 没办法使用 socks5 代理进行请求,所以就报错了。
如果你想要在有设置环境变量的情况下不使用代理,可以将 proxies 设为 None。

You can also configure proxies by setting the environment variables HTTP_PROXY and HTTPS_PROXY.

$ export HTTP_PROXY="http://10.10.1.10:3128"
$ export HTTPS_PROXY="http://10.10.1.10:1080"

$ python
>>> import requests
>>> requests.get('http://example.org')
2019-09-09 15:54:20 +08:00
回复了 wersonliu9527 创建的主题 Python 萌新请教,关于 adsl 拨号代理问题
@wersonliu9527 #4 那你可以尝试使用 Privoxy 之类的工具,将 Socks5 代理转成 HTTP 代理。
可行,而且很简单,相关文章网上也有很多
2019-09-09 14:43:13 +08:00
回复了 wersonliu9527 创建的主题 Python 萌新请教,关于 adsl 拨号代理问题
@wersonliu9527 #2 我没有深入地用过 scrapy,你可以翻一下文档看看 scrapy 是否支持 socks5 代理,并且确认一下是不是这么写。
2019-09-08 10:24:00 +08:00
回复了 greatdancing 创建的主题 京东 差点上当的一次京东购物经历
我补充一下,京东自营和淘宝、天猫官方旗舰店并不一定是同一个运营团队
2019-09-07 22:52:24 +08:00
回复了 yeshiwei 创建的主题 深圳 出差深圳,哪里可以玩?
深圳除了大型商场附近以外就没啥特别“好玩”的地方了吧…娱乐设施非常集中。
看风景的话就青青世界、莲花山、深圳湾什么的,不过也就那样。
2019-09-07 09:53:57 +08:00
回复了 wersonliu9527 创建的主题 Python 萌新请教,关于 adsl 拨号代理问题
跟 fq 一样的,一般的代理当然不能让墙内机器直接 fq
2019-09-06 12:54:39 +08:00
回复了 zhihupron 创建的主题 问与答 普通人的电脑真的就没有办法提高深度学习训练速度吗?
只要愿意加钱,方法很多
2019-09-05 19:51:22 +08:00
回复了 fengwen1995 创建的主题 宽带症候群 IPV6 的实用性在哪里,求大佬告知
IPV6 可能带来的一个问题就是以后做风控的更难了,因为 IP 不再是一个可以被判别的东西,量太大。但反过来对做爬虫的、灰黑产的都是优势。
1 ... 261  262  263  264  265  266  267  268  269  270 ... 318  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   789 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 55ms · UTC 22:48 · PVG 06:48 · LAX 15:48 · JFK 18:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.