新入职,我感觉我不适合这行

2020-09-25 15:51:55 +08:00
 feiniu

新入职,加这周才 2 周

老大这周一给我一个任务

爬 tmall 店 铺商品列表

我只想说,周一到现在,我感觉我要自闭了

5123 次点击
所在节点    职场话题
35 条回复
HFX3389
2020-09-25 20:47:06 +08:00
爬淘宝天猫说实话,就算能爬,也很难做自动化,分分钟风控,什么验证码就来了
而且 爬虫写的好,牢饭吃到饱 可不是一句空话
gou7ma7
2020-09-25 22:06:22 +08:00
@feiniu 当时杭州有个公司,在本站也是招聘的时候说 955,然后面试的时候给我说。刚去肯定会加班,然后我就没去。
gouflv
2020-09-25 22:14:27 +08:00
确实不适合,换个正常的公司
miku831
2020-09-25 23:51:54 +08:00
@v2hh 太恐怖了,真就不管老板啊
XD2333
2020-09-26 00:01:25 +08:00
不如去看看官方的接口,我记得这个你这个还是有的,没必要一个树上吊死。
jon
2020-09-26 00:16:05 +08:00
建议跑
TimeRain
2020-09-26 07:43:57 +08:00
实在不行换个公司吧,离爬虫远点比较好,爬虫个人感觉是离监狱最近的地方,别和我说公开数据可以爬,只要不影响到别人的业务就行,因为最终解释权在人家公司那里,他说你有罪大概率逃不掉,他没说不能做也不要掉以轻心,说不定有些公司就是专门搞这种爬数据的人
AJQA
2020-09-26 08:48:07 +08:00
headless chrome 加 上千个类似 aws lambda 他们总不能分辨是爬虫了吧?
因为上千个 lambda 肯定会有很多 ip?
headless chrome 真实浏览器?
leafre
2020-09-26 09:59:32 +08:00
难吗
huai
2020-09-26 19:45:42 +08:00
所以爬取这种相当于公开的数据 也是违法?楼上可以证实?还是也是道听途说(提问
efaun
2020-09-26 23:03:13 +08:00
@huai #30 IT 界的万能罪“破坏计算机信息系统罪”了解一下
Curtion
2020-09-27 10:39:21 +08:00
@huai #30 爬取有反扒机制或者有 Robots 协议的网站都是犯法的。
huai
2020-09-27 12:04:16 +08:00
@efaun 根据《中华人民共和国刑法》第二百八十六条规定,破坏计算机信息系统罪是指违反国家规定,对计算机信息系统功能或计算机信息系统中存储、处理或者传输的数据和应用程序进行破坏,或者故意制作、传播计算机病毒等破坏性程序,影响计算机系统正常运行,后果严重的行为

那估计爬虫 ddos ?
huai
2020-09-27 12:04:50 +08:00
@Curtion 反扒机制这个怎么算?有一些可能就是很轻松
Curtion
2020-09-27 12:15:09 +08:00
@huai #34 我说的反扒机制指的是:网站有故意设立的反扒机制,如果你尝试绕过这个机制去爬取数据就有一定风险,上面我说的它犯法不准确,因为没有法律明文,不过有风险是肯定的,因为有过判刑案列。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/710458

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX