首页   注册   登录
 caneman 最近的时间轴更新
caneman

caneman

V2EX 第 101294 号会员,加入于 2015-02-28 19:27:58 +08:00
caneman 最近回复了
如果这场撕逼能持续到明天,这是不是 V 站首个跨年撕逼大战?[深思]
27 天前
回复了 zhaofy 创建的主题 程序员 公司要用爬虫抓取数据,不知道是否侵权
@locoz #41 这个当然知道了,有些数据来源非常单一,举个简单的例子,抖音 /微博的博主信息,点赞关注回复之类的,假使抖音 /微博他们完全不开放相关接口,你无论怎么加工,只要提供了相关服务必然会暴露你拥有信息这个事情,抖音虽然无法从服务器上面知道究竟是谁在爬它,但是它很容易知道谁在提供服务。只要想盈利你不可能把数据捂着放一边把,告了公司,法院和警方会寻找真正的爬虫 er,爬虫被抓的,基本也都不是从源头被追踪到的,都是从下游一直往上捋,捋到的。

也可以做,但是大环境确实比以前难多了,说到底,低调就对了,出头就是找死,除非你的服务对被爬方有益,但是也难说被卸磨杀驴,当然这些前提都是在商用领域,
27 天前
回复了 zhaofy 创建的主题 程序员 公司要用爬虫抓取数据,不知道是否侵权
@abcbuzhiming 是啊,感觉就是赌,赌对面不会告你,保不齐哪次就栽了...
27 天前
回复了 zhaofy 创建的主题 程序员 公司要用爬虫抓取数据,不知道是否侵权
@locoz 其实说到底,能让你爬的数据一般价值有限,真正有价值的数据是不可能给你授权的。(购买接口就不叫爬虫了)。现在的形势,感觉做爬虫的就是走钢丝,把选择权交给对方,不告你啥事没有,一告你百分百出事....

有商业价值的数据,感觉有一个算一个,只要爬,没一个是具有合法性的。。。只能想各种办法来规避对方告你的风险(要么不要让对方知道你在爬,要么你爬的速率和规模在对方容忍范围内),因为告你也是需要成本的。

还是好难做啊...
27 天前
回复了 zhaofy 创建的主题 程序员 公司要用爬虫抓取数据,不知道是否侵权
@locoz 那现在爬虫的出路在哪?只能逼迫转行?
48 天前
回复了 KaynW 创建的主题 程序员 Postman 都有女票了,你萌呢?
我这里有个绿色的帽子你要不要。。
一个人,一张嘴,电脑还没普及,跟我吹互联网贸易大皮,满嘴跑火车,我觉得他是个骗子。 -- 雷军
@zlccn 有没有可能是纳税大户一般都有独立的法务部门,他们在这方面的规避比较好?那个长长的免责条款。。。。,小作坊可能也就网上抄两段放上去了
@caijunyi 对啊,这几个被拉出来的典型都是定位,现在要定位信息的 APP 不太常见了吗。
53 天前
回复了 caneman 创建的主题 git 关于 git rebase 的一点疑问
@xingheng 对啊,我遇到的情况是,branch1 会把 branch2 上的修改同步一遍,就是两个分支都变成了 branch1 垫底,branch2 跑上面去
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2143 人在线   最高记录 5168   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 10ms · UTC 12:12 · PVG 20:12 · LAX 04:12 · JFK 07:12
♥ Do have faith in what you're doing.