V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
JhOOOn
V2EX  ›  Python

如何验证一个代理的好坏呢?

  •  
  •   JhOOOn · 2015-12-15 12:54:13 +08:00 · 2834 次点击
    这是一个创建于 3270 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如获取到一个代理后,通过 get 百度是 OK , 但通过该代理访问其它网站就是 500 ,
    甚至是在同一个网站首页验证 OK , 但访问该网站其它页面就 500 错误了。

    1 ,那么验证一个代理的好坏的比较好的方法是什么呢?
    2 ,如何维护一个代理池(长久保留的, 坏的踢出去,好的拿进来,),有相关资源可以推荐下么?
    先谢谢了。

    (我验证代理的好坏的方法就是 , get 一个网站,如果能找到其中的内容,就认为是一个好代理。)

    6 条回复    2015-12-15 17:37:30 +08:00
    tkisme
        2
    tkisme  
       2015-12-15 13:15:42 +08:00
    mtr 掉包率
    JhOOOn
        3
    JhOOOn  
    OP
       2015-12-15 14:33:31 +08:00
    @skywatcher 打不开。。
    zingl
        4
    zingl  
       2015-12-15 14:47:15 +08:00
    proxyhunter 在很多年前就给出了示例
    mee
        5
    mee  
       2015-12-15 15:23:28 +08:00
    我之前做爬虫的时候使用代理,也遇到了这个问题,用爬虫得到的大部分代理,统统将页面重定向到了百度,只有一小部分是可以直接用的,因此我就需要去验证哪一部分不可用将其剔除,我采用的方法是这样的.
    1.使用代理取请求一个普通的网页(不要是百度这样的,最好具体的网页),判断得到的状态码是否 OK
    2.判断请求得到的网页内容是否跟你通过浏览器得到的网页内容相同(可以通过判断里面的一些特殊字符串判断)
    wikinee
        6
    wikinee  
       2015-12-15 17:37:30 +08:00
    天下武功,唯快不破!
    --火云邪神
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5372 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 09:32 · PVG 17:32 · LAX 01:32 · JFK 04:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.