import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
'Host': '
www.19lou.com'
}
s = requests.session()
s.headers = headers
res = s.get('
https://www.19lou.com/forum-269-thread-41401535624978493-1-1.html')
redirect_url = res.url
result_cookie = re.search(r'substr\|(.*?)\|365', res.text).group(1)
result_cookie = result_cookie.split('|')
s.cookies.update({result_cookie[0]: result_cookie[1]})
url = redirect_url.replace('
https://www.19lou.com/safeRedirect.htm?', '')
res = s.get(url)
print(res.text)
你看看可以满足你要的要求了吗,本来我想用 execjs 执行返回的 js 的代码,但预期结果总是不符,我发现用 node 去执行,却总是正确的,后来我发现这个 cookie 的键值就存在于返回的 js 中,所以最后就直接提取了,我访问了两个链接,cookie 的键值总是不变,感觉这个 cookie 存在的意义不大啊,也可能还存在潜在的反爬