首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
yaokwok
V2EX  ›  奇思妙想

想输入网址获取整站邮箱号,有这样的网站吗?

  •  
  •   yaokwok · 2018-11-13 09:54:14 +08:00 · 3852 次点击
    这是一个创建于 439 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想做个网站,输入网址自动爬虫获取整站邮箱号或手机号,不知道目前有没有这样的网站,如果没有的话,你们有没有这样的需求?

    29 回复  |  直到 2018-11-15 16:12:45 +08:00
    ljspython
        1
    ljspython   2018-11-13 09:55:21 +08:00
    ...牛逼
    codechaser
        2
    codechaser   2018-11-13 09:56:32 +08:00 via Android
    这怎么可能
    hinate
        3
    hinate   2018-11-13 09:58:57 +08:00 via iPhone
    你可以这样想:输入网址直接下载网站的数据库!获取的信息更全更多~
    yaokwok
        4
    yaokwok   2018-11-13 09:59:20 +08:00
    @codechaser 我知道现在很多大站的反爬虫策略都很强,但是如果先不考虑这些很强的大站,其它站还是可以自动递归每一个有价值的页面的。但从用途来讲,觉得这样可行吗?
    dingdangnao
        5
    dingdangnao   2018-11-13 10:12:47 +08:00
    输入网址直接把服务器 down 下来?
    russiansim
        6
    russiansim   2018-11-13 10:33:56 +08:00 via iPhone
    输入你银行账号,你钱直接到我卡里行不行?
    隐私这个词听过吗?
    你邮箱手机号随便被人想 down 就 down,这样的网站你敢用吗?
    codechaser
        7
    codechaser   2018-11-13 10:37:28 +08:00 via Android
    @yaokwok 注册邮箱这些都属于隐私数据,只有用户自己和数据持有方才能看见。
    whileFalse
        8
    whileFalse   2018-11-13 10:39:14 +08:00
    国外有这样的网站。

    可以找属于同一个公司的人的联系方式。比如输入 google.com ,就会出一堆 google 的邮箱地址和联系人名字,可能还有职位等信息。但是绝对不全,也不能获取诸如 gmail.com 的后缀的邮箱。
    AN3O
        9
    AN3O   2018-11-13 11:16:21 +08:00   ♥ 1
    chungzhao
        10
    chungzhao   2018-11-13 13:24:59 +08:00
    好奇你这样干嘛???
    o0
        11
    o0   2018-11-13 13:32:14 +08:00
    整站,比如说谷歌还是淘宝呢,要不直接花几个比特币去买之前的酒店数据不是更好。
    ayconanw
        12
    ayconanw   2018-11-13 13:44:10 +08:00
    那我如果输入 google.com
    kimcool
        13
    kimcool   2018-11-13 14:03:27 +08:00
    不知道是表达错了还是我理解错了···先不说数据量问题···你这是直接拿别人数据库呀
    miniliuke
        14
    miniliuke   2018-11-13 14:19:03 +08:00 via Android
    就你聪明系列......
    lzhd24
        15
    lzhd24   2018-11-13 14:24:40 +08:00
    @codechaser 昨天看美剧的时候,发现字幕组邮箱默认直接显示
    huiyadanli
        16
    huiyadanli   2018-11-13 14:25:51 +08:00
    LZ 这里应该说的只是爬页面上存在的手机号、邮箱,用作营销使用吧。。。有些营销工具都有这个功能。。
    用一些在线的爬虫服务也可以做到。。
    nekoneko
        17
    nekoneko   2018-11-13 14:52:38 +08:00
    活着不好?
    yaokwok
        18
    yaokwok   2018-11-13 15:01:54 +08:00
    @huiyadanli 是的,收集这些主要用于定向营销,不过我确实没仔细考虑到隐私问题
    yaokwok
        19
    yaokwok   2018-11-13 15:03:26 +08:00
    @ayconanw 获取不到信息。主要获取论坛类,信息类网站
    yaokwok
        20
    yaokwok   2018-11-13 15:04:33 +08:00
    @codechaser 是的,注册信息只有用户自己和网站能看到,爬虫顶多爬一些公开的,回复的信息
    lc1450
        21
    lc1450   2018-11-13 17:30:22 +08:00
    楼主表述可能有问题,我觉得你就是想抓到页面上的能看到邮箱吧,就像某度贴吧里那种留邮箱的吧,这玩意可以直接拿源码正则提取,
    yaokwok
        22
    yaokwok   2018-11-13 17:47:34 +08:00
    @lc1450 是的 是我的表述问题,大家误解了
    LukeChien
        23
    LukeChien   2018-11-13 19:08:28 +08:00 via Android
    付款二维码生成器!
    honeycomb
        24
    honeycomb   2018-11-13 20:57:54 +08:00 via Android
    @yaokwok 既然是搞定向营销的话,这样更不能帮楼主了
    o0
        25
    o0   2018-11-13 21:43:40 +08:00
    百毒找到的,希望对 lz 有用,『法无禁止即可为』绝对是错误的,等追责那天就 GG 了,哈哈。
    如果网站运营者已经采取了一定的反爬虫措施(黑名单、robots、使用条款等),而爬虫控制者基于经营目的、强行突破网站运营者采取的反爬虫技术措施,并客观导致被抓取网站的正常运行,则大可能构成上述规定所规制的不正当竞争行为。
    《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。
    未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于《刑法》第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。
    yaokwok
        26
    yaokwok   2018-11-14 10:48:07 +08:00
    @o0 这么说我可能是犯罪捷径提供者 0.0
    killerv
        27
    killerv   2018-11-14 13:09:02 +08:00
    这个节点选择的真好
    u3u
        28
    u3u   2018-11-15 16:04:00 +08:00
    我知道为什么骚扰电话那么多了
    keventseng
        29
    keventseng   2018-11-15 16:12:45 +08:00
    在违法边缘摩擦摩擦~
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1999 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 28ms · UTC 06:09 · PVG 14:09 · LAX 22:09 · JFK 01:09
    ♥ Do have faith in what you're doing.