V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
zhoumouren
V2EX  ›  程序员

做图片采集器有风险么

  •  
  •   zhoumouren · 2019-10-24 07:41:19 +08:00 · 4834 次点击
    这是一个创建于 1883 天前的主题,其中的信息可能已经有所发展或是发生改变。

    做一款图片采集器,可以适配大量的图片站的采集,当然所有采集都是在本地完成,没有任何的云端服务,所有采集哪个网站都是用户行为,软件本身只是作为一个被安排的明明白白的图片采集器。

    如果软件被某些不正当的人拿去做涉黄或违法图片采集,软件作者本身会有风险么?

    另外采集器只支持采集公开内容,无任何的身份授权添加设置,以及没有做反反爬的行为。

    38 条回复    2019-10-25 19:16:04 +08:00
    Juszoe
        1
    Juszoe  
       2019-10-24 08:02:31 +08:00
    我觉得不会,就像浏览器上黄网,抓的也只是那个网站的人
    imn1
        2
    imn1  
       2019-10-24 08:03:11 +08:00
    任何没有解释权的人,所说答案都不能视为正确答案

    现状嘛
    很多人做,也很多人用
    我自己都有个程序,只是从没发布过,采集的图片也没发布过

    不过也不能说没有前车
    pxw2002
        3
    pxw2002  
       2019-10-24 08:10:44 +08:00 via Android   ❤️ 3
    别用采集字眼
    改成 图片收藏
    个人收藏 这就是个人行为了
    一键图片收藏
    就和印象笔记一样 收藏什么是用户的行为
    和笔记没关系
    lswl66
        4
    lswl66  
       2019-10-24 09:05:00 +08:00
    说你有就有
    hereIsChen
        5
    hereIsChen  
       2019-10-24 09:11:49 +08:00
    3 楼说的对,名字最好规避一下
    zhoumouren
        6
    zhoumouren  
    OP
       2019-10-24 09:14:13 +08:00
    @Juszoe 是有几分这样的道理

    @imn1 但是国内对于这样的企业采集软件都很多呀,而且不知道用户拿来干他的用途

    @pxw2002 可以

    @lswl66 哑巴吃黄连
    designer
        7
    designer  
       2019-10-24 09:25:21 +08:00 via iPhone
    犯不犯法是被采集公司和公安局说的算
    annielong
        8
    annielong  
       2019-10-24 09:27:03 +08:00
    类似的火车头,八爪鱼之类不活的好好的
    zhoumouren
        9
    zhoumouren  
    OP
       2019-10-24 10:22:49 +08:00
    @designer okay

    @annielong 所以说不好搞
    zdnyp
        10
    zdnyp  
       2019-10-24 10:32:51 +08:00
    作为工具应该没问题,市面上采集器这么多。卖刀的也不能因为买刀的砍人就犯法啊。
    zhoumouren
        11
    zhoumouren  
    OP
       2019-10-24 10:37:50 +08:00
    @zdnyp 对,但是还是要规避一些风险
    Wenco
        12
    Wenco  
       2019-10-24 11:04:18 +08:00
    快播王欣当年是不是也是这么想的,技术无罪。
    harrison0124
        13
    harrison0124  
       2019-10-24 11:43:09 +08:00
    某天有个人说了一句:“技术无罪”,然后被关了两年。。菜刀可以切菜,也可以杀人,,最终解释权不在你手上,在凶手手上。
    zhoumouren
        14
    zhoumouren  
    OP
       2019-10-24 13:17:28 +08:00
    @Wenco 快播是在自己的服务器里面发现了淫秽视频
    Wenco
        15
    Wenco  
       2019-10-24 15:09:04 +08:00
    王欣认为公司和个人不构成犯罪:快播只做技术,不提供视频,也不具备搜索功能,被查服务器是缓存服务器,缓存视频是行业的普遍做法,快播无法分辨视频是淫秽视频还是普通视频,快播还成立了“110”系统,用关键词禁止淫秽视频播放,并接受举报屏蔽四千多个色情网站[3][9][20]。

    控方认为快播公司及王欣是色情内容的受益者,“情节特别严重”,应判王欣十年以上,而王欣认为快播反而是色情内容的受害者,辩护人认为如果判只提供技术的快播有罪,那么将产生寒蝉效应使互联网公司将人人自危[20]。对应快播监管不利的指责,辩护人回应称其屏蔽了四千多个黄色网站,而 2014 年全国扫黄打非 8 个月才查处了 422 家[20]。面对转型问题,快播用中国移动有诈骗短信的问题回应[20],称自己不做技术也会有其他公司做[21],并列举了淘宝网、腾讯的 QQ 和微信、百度存在的问题[22]。公诉人指出以 AV 女优为关键字,“快播+关键字”得到的搜索结果远超过与“暴风影音”、“迅雷看看”等一起搜索时的结果,但王欣表示这毫无意义,并暗示用“QQ+关键字”会有更多条搜索结果[21]。


    -------------摘抄自维基百科
    zhifSu
        16
    zhifSu  
       2019-10-24 16:04:46 +08:00
    zhifSu
        17
    zhifSu  
       2019-10-24 16:07:01 +08:00
    建议看看这篇文章
    zhifSu
        18
    zhifSu  
       2019-10-24 16:07:35 +08:00
    westoy
        19
    westoy  
       2019-10-24 16:15:16 +08:00
    纯卖采集软件, 主打监控和舆情, 不打包和提供任何采集规则, 不会有什么问题的, 火车头都卖了十几年了

    但是你要提供涉灰涉黑的采集规则或者定制服务, 那绝逼完了, 十年前 286 有个斑竹拿火车头帮人写了个采 XX 站收了百来块钱, 进去吃了两年饭
    zhoumouren
        20
    zhoumouren  
    OP
       2019-10-24 16:48:55 +08:00
    @westoy 不写采集规则以及定制服务,不盈利
    hereIsChen
        21
    hereIsChen  
       2019-10-24 17:17:46 +08:00
    @zhifSu 文章里这种非法采集个人信息当然是犯法的,但是如果只是采集一些公开的资料,如百度图片这些。只要不是闹得太过分,基本不会管你的,也没见过 12306 把携程、飞猪这些告了。而且 楼主 要做的是一款本地软件,类似于扒站小工具,和那种扒别人服务器信息然后出售盈利是两码事
    pxw2002
        22
    pxw2002  
       2019-10-24 18:01:25 +08:00 via Android
    可以导入采集规则
    但是你不提供 让客户找别人写就好了

    快播是 sb 缓存都是缓存整个影片
    根本没有切片加密什么的 直接就可以播放

    要是缓存加密的切片数据就好了

    再进一步 他就不应该做缓存服务器,
    他是想提供更快的播放速度,
    结果缓存的都是大姐姐电影,
    eason1874
        23
    eason1874  
       2019-10-24 18:33:27 +08:00
    @Wenco #15 怎么感觉你没用过快播。

    快播不是纯粹缓存,是缓存+点播。当年国人黄网发视频几乎都是用快播,站长先用快播 Qvod 服务器发布,然后在网页按快播提供的链接格式插入链接,用户点击播放就可以调起快播播放器去播放,流媒体来源是 P2P 网络和快播缓存服务器,会员可以用缓存加速。

    说白了就是免费给盗版 /黄网提供视频服务器,但不直接向站长收费,而是向视频播放器用户收费。
    eason1874
        24
    eason1874  
       2019-10-24 18:36:50 +08:00
    纯粹的图片采集软件,不反爬,不做特高并发,不针对特定网站提供采集规则,不会有问题。
    luoway
        25
    luoway  
       2019-10-24 20:24:35 +08:00
    国内有人使用开源软件违法犯罪,作者有没有法律责任?
    https://www.zhihu.com/question/341552825/answer/808882750
    luoway
        26
    luoway  
       2019-10-24 20:27:38 +08:00
    就结果上看,有的
    zhifSu
        27
    zhifSu  
       2019-10-25 08:25:58 +08:00
    我就想提醒下楼主
    @hereIsChen
    Wenco
        28
    Wenco  
       2019-10-25 09:36:55 +08:00
    @eason1874 ==我确实没用过,只是觉得挺像的,提醒楼主一句。据你这个说法快播只是做了缓存没错啊,只不过没有过滤及限制内容而已,百度云也是 p2p 加速。有专门的百度云分享群上传敏感资源,然后分享链接在线观看的(以前有,不知道现在还有没有),百度云会员可以加速下载及观看,这难道不是一样的模式?同样的还有迅雷等,不过是快播闹得最凶罢了。
    eason1874
        29
    eason1874  
       2019-10-25 09:46:02 +08:00
    @Wenco #28 百度云网盘是一样的模式,迅雷也是一样的模式,但他们加了限制,绝大部分 AV 在百度云网盘播放都会变成 8 秒净网温馨提示,迅雷则禁止下载,现在迅雷连很多版权电影都禁止下载。

    其实快播也搞过监管,出事之前因为这个问题被深圳罚过好几次,他们也成立了什么举报中心,不过都是雷声大雨点小,毕竟主营业务就是这个,真全封了快播也凉了,后来就被抓典型了。
    zdnyp
        30
    zdnyp  
       2019-10-25 09:54:05 +08:00
    @zhifSu #17 写爬虫抓别人数据跟采集工具完全两码事
    Wenco
        31
    Wenco  
       2019-10-25 10:40:45 +08:00
    @eason1874 百度、迅雷等做限制也是这几年才有的,之前有多凶相信你也见识过。只是善意提醒一下楼主。积极向上、不获利、没形成规模当然是皆大欢喜了。
    eason1874
        32
    eason1874  
       2019-10-25 10:59:19 +08:00
    @Wenco #31 都是 2013、2014 那两年发生的事。其实百度还有一个跟快播更像的产品,说是一模一样也不过分,叫百度影音,那几年我们做盗版电影站的用百度影音,做黄网的用快播,这两家可以说难分秋色。不过百度反应快,2013 一见风声不对,马上就关掉 P2P 转型成普通播放器了。

    我相信程序员做的东西干嘛用自己心里都清楚,要挂羊头卖狗肉就得最好被抓的心理准备。题主真心只是做一个纯粹的图片采集器,别反爬,别针对特定对象做采集规则,肯定没事。
    zhoumouren
        33
    zhoumouren  
    OP
       2019-10-25 12:02:04 +08:00
    @eason1874 没做反爬,完全本地化
    locoz
        34
    locoz  
       2019-10-25 14:48:05 +08:00
    作为公开使用的工具而非为某个用户、站点定制的工具就没有问题,规不规避“采集”这个操作的名字也没啥关系,加入免责声明 /说明就可以了,本身这种公开使用的工具就不可能控制用户的使用模式。操作方式可见目前名字出现得比较多的傻瓜式爬虫工具,都做了类似的声明 /说明:
    八(和谐)爪(和谐)鱼 https://www.ba (和谐) zhuay (和谐) u.com/faqIndex
    火(和谐)车(和谐)头 http://www.lo (和谐) coy.com/about
    神(和谐)箭(和谐)手 https://www.she (和谐) njian.io/index.php?r=sign/priority
    后(和谐)羿 http://www.ho (和谐) uyi (和谐) caiji.com/?type=video&vid=5875

    @zhifSu #16 也建议你看看这篇文章 https://mp.weixin.qq.com/s/aXr-ZE0ZifTm2h5w8BGh_Q
    locoz
        35
    locoz  
       2019-10-25 15:03:28 +08:00
    @locoz #34 突然想起来,附加一下:
    图片采集器市面上非常多,目前没看到任何一个这种被公开使用的工具的作者被请去喝茶、被抓的情况,也没看到任何一个做傻瓜式爬虫工具的公司被抓。

    即使是像火(和谐)车(和谐)头这样做了这么久的公司,被诉讼的次数也是屈指可数,并且还跟火(和谐)车(和谐)头这个产品本身毫无关系,完全是之前另一个产品确实存在侵权问题导致的。
    m2276699
        36
    m2276699  
       2019-10-25 15:39:20 +08:00
    估计以是否造成损失、是否侵害隐私等来定性
    iKun66
        37
    iKun66  
       2019-10-25 16:27:24 +08:00
    快播也不提供那种内容,王铁匠不还是被抓了
    locoz
        38
    locoz  
       2019-10-25 19:16:04 +08:00
    @iKun66 #37 快播是可控但是放任不管,不一样的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5037 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 03:52 · PVG 11:52 · LAX 19:52 · JFK 22:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.