@
leavic 你怎么知道 url 后面的 page number 有 2000 个? 如果只有 10 个,你是不是要 request 2000 次?
我定义的优雅的方式是不需要要自己手动去生成 page number, 最好能通过某种手段自动得到。比如你 request 一下 baseurl 的时候,要是能返回 total page number 就最好了。
我能想到的不优雅的方式是:
for page_number in xrange(1, a_large_number):
____try:
________request("{base_url}{page_number}".format(base_url=base_url, page_number=parge_number)
____except ExceptionIDontKnow:
break
就是设置一个比较大的 page number, 当访问不到的时候应该会返回一个特定的异常,然后就退出循环