公司要用爬虫抓取数据,不知道是否侵权

2019-12-30 10:05:33 +08:00
 zhaofy
请教一下各位,领导安排一个任务,爬取别的公司网站的资讯然后发布到自己网站上,频率不高,被监测到的可能性不大;但是我看该网站资讯下面注明了非公开数据,我是不是要汇报一下领导告诉他利害关系?
8417 次点击
所在节点    程序员
52 条回复
locoz
2019-12-30 15:54:51 +08:00
@caneman #39 只要不过分、展示出去的东西是经过加工的、能给源头带来利益,没人会想着搞你...而且即使搞你了也拿不出证据。(自己傻到用同一个 IP 一直怼的除外)
caneman
2019-12-30 16:11:14 +08:00
@locoz #41 这个当然知道了,有些数据来源非常单一,举个简单的例子,抖音 /微博的博主信息,点赞关注回复之类的,假使抖音 /微博他们完全不开放相关接口,你无论怎么加工,只要提供了相关服务必然会暴露你拥有信息这个事情,抖音虽然无法从服务器上面知道究竟是谁在爬它,但是它很容易知道谁在提供服务。只要想盈利你不可能把数据捂着放一边把,告了公司,法院和警方会寻找真正的爬虫 er,爬虫被抓的,基本也都不是从源头被追踪到的,都是从下游一直往上捋,捋到的。

也可以做,但是大环境确实比以前难多了,说到底,低调就对了,出头就是找死,除非你的服务对被爬方有益,但是也难说被卸磨杀驴,当然这些前提都是在商用领域,
smilenceX
2019-12-30 16:20:30 +08:00
@wdv2ly 我记得以前听课的时候,有个说法是,知不知法是不影响定罪和量刑的。古装剧里“罪加一等”的前半句应该是“执法犯法”。
我不是专业人士,如果我说错了,请告诉我。
Kig
2019-12-30 16:28:13 +08:00
看爬什么吧
henices
2019-12-30 17:06:10 +08:00
coderluan
2019-12-30 17:19:32 +08:00
如果是非“爬”不可的情况,我会选择油猴脚本的方式,这样从技术角度我只是分析了本地的网页数据,风险就从盗窃信息变成了未授权转载了......效率低负罪感也低点......
codeduan
2019-12-30 18:40:02 +08:00
爬虫写得好,牢饭吃到饱
nvhanzhi
2019-12-30 18:50:13 +08:00
今日头条一天到晚在爬,人家老板成了巨富
qiuqiuwang99
2019-12-30 19:05:42 +08:00
三个字 不要碰 尤其有个人信息的 一条也不要爬 即使是个人公开也不可以。这是高压线,个人信息保护法马上要出,正愁没祭刀的呢。
SwagXin
2019-12-30 23:54:29 +08:00
侵权,你就不应该发这个帖子,现在你知道了你还会爬吗。
niboy
2019-12-31 11:22:18 +08:00
别爬,如果东窗事发,程序员是要被开刀的
lisiqi
2019-12-31 11:41:11 +08:00
@coderluan #46 好主意。。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/633458

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX