[爬虫与 5G] 5G 的到来会对爬虫速度有质的改变吗??

2019-06-09 20:45:47 +08:00
 WaJueJiPrince

最近的 5G 技术,炒的是非常火热,大家都在畅想着,5G 的到来会对什么行业有影响,会在哪个地方有爆发?

我是写爬虫的,所以就联想到 5G 的到来,会对爬虫有质的提升吗?又会改变爬虫哪些地方呢? 经常写爬虫的朋友应该知道,爬虫的速度慢,关键在于爬虫是 I/O 密集型的。也就是当我们发出一个请求以后,需要等待响应的回归。所以对于 CPU 的利用不是太好,我指的是用 Python 来编写爬虫。由于 Python 的 GIL 全局解释器锁。所以,我们为了提高效率,可以采用多进程的方式,也可以采用多线程的方式,甚至采用协程的方式来实现爬虫。 听说 5G 的到来。网速有相当大的改善,据说一秒钟可以下载一个电影。

7847 次点击
所在节点    Python
91 条回复
WaJueJiPrince
2019-06-10 00:07:27 +08:00
@botian 爬虫触犯法律目前已经有一个案例了 盗取别人家的视频获刑 似乎是中国首例 还有一个什么公司 靠采集别人的简历 好像融资 1.5 亿 最后被一锅端 30 多人坐牢了
cz5424
2019-06-10 00:20:13 +08:00
越快越容易被 block
FrankHB
2019-06-10 00:25:54 +08:00
@chinvo
螳螂会爬
螳螂是虫
螳螂也是爬虫
(论证有力)
Northxw
2019-06-10 01:02:30 +08:00
(简单论述) IO 密集,多线程,5G,岂不是更加利用 CPU 资源,更加美滋滋?
Caan07
2019-06-10 01:09:03 +08:00
家族群我堂弟说:哇,5G 快来了。5G 速度好快啊。

我二姑爷说:5G 不用钱么?

全群安静。
masker
2019-06-10 01:11:10 +08:00
???网速影响实现代码?
lostberryzz
2019-06-10 01:26:15 +08:00
别问,问就是速度是 5G 最无聊的应用
binux
2019-06-10 03:05:46 +08:00
@WaJueJiPrince #10 你写的爬虫框架连 IO 都解决不了?
zwh2698
2019-06-10 06:27:21 +08:00
科普,通信网络是由核心网,接入网,用户设备, 简单说明。接入分有线和无线,核心网 10 多年没有变化了,变化比较多是接入网中的无线部分
zwh2698
2019-06-10 06:30:58 +08:00
所以大家觉得 5G 是通信网络中那部分呢??
zwh2698
2019-06-10 06:39:15 +08:00
1.5g 说会出现大量网联设备,这说明没有 5G 的情况也有物联,不是大量对吧?
2.大量会不会是伪需求?比如汽车连接电饭锅,你在路上的时候可以煮饭?请问锅里米谁洗?水谁放?电谁插?保姆呀,都有保姆,还要这个有用吗?
3 让子弹飞一会儿。
wunonglin
2019-06-10 07:56:19 +08:00
@zwh2698 他们肯定会说 5G 来了肯定就会有具备自动放米、自动洗米功能的电饭煲,而且还能通过大数据精准放置多少米量 emmmmm,你信不信

我要笑死了哈哈哈哈哈哈哈哈哈
locoz
2019-06-10 08:06:13 +08:00
这个问题挺有意思的,不过我认为对速度的影响并不大,等下到公司细说一下。
alamaya
2019-06-10 09:07:43 +08:00
写爬虫不是该跟人家反扒策略斗智斗勇?就现在的带宽你能跑满?
icharm
2019-06-10 09:11:02 +08:00
异步爬虫了解哈?
zwh2698
2019-06-10 09:17:44 +08:00
@wunonglin 其实我不是嘲笑 5G,我只是客观说明,这东西被包装过度,无非有人想要摸鱼,华为的任老大不是也说内部没有外面那么夸大,这是华为任老大说的,有视频的,都不要找我哈。我引用。 回到题主,题主这是有线接入,和 5G 一毛关系都没有。通讯延迟减小只是说明以前无线设备和无线接入这块有改善。和核心网速度一点关系都没,大油管如果很小,分支油管还能上天? 核心网将近 20 年都没变了,什么光纤改善,CPU 提升,内存速度快,理论上只是运营商节约了一点成本,其实也没节省。就像现在运营商都是 nfv,结构,nfv 的目的是为了省钱,但是现在其实比原来黑盒子更多 10-30%, 移动或者电信的朋友出来说说看。
abcbuzhiming
2019-06-10 09:19:32 +08:00
楼主,你说你是写爬虫的?你难道没有被别人家的反爬虫措施整的欲仙欲死的经历?你居然认为阻碍爬虫的问题是网速和响应时间?你真的是写爬虫的?你不是在逗我?
lihongjie0209
2019-06-10 09:23:25 +08:00
哪怕没有网速的限制, 你觉得对方的服务器资源可以让你随意占用?
whwq2012
2019-06-10 09:25:38 +08:00
你说 ipv6 能提升爬虫的效率都比说 5g 好
kisshere
2019-06-10 09:26:27 +08:00
好多写爬虫的还主动降频,就是为了怕对方发现,你这思路清奇,即使对方毫无反爬措施,爬虫的进程数、解析 DOM 速度才是最大瓶颈,网速高有毛用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/572202

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX