某个网站会对浏览器 navigator 的 webdriver 字段进行检测
写了一段 js 来修改 webdriver 的值,如下
Object.defineProperty(window.navigator, 'webdriver', {configurable:true});
现在的问题是,这段 js 在 pyppeteer 中可以过检测,但是在 selenium 中不可以。
经过测试大概有以下几种 case
pyppeteer 中不注入 js,不过检测
pyppeteer 中注入 js,过检测
selenium 中注入 js 不过检测,但是控制台查看 webdriver 字段已被修改
在 selenium 中不刷新网页,控制台重新输入上述 js,不过检测
在 selenium 中刷新网页(手动),在控制台输入上述 js,过检测
pyppeteer 代码如下
async def main():
launch_kwargs = {
"headless": False,
}
browser = await launch(launch_kwargs)
page = await browser.newPage() #
await page.goto("https://www.xxxx.com")
await page.evaluate(pageFunction="""
Object.defineProperty(window.navigator, 'webdriver', {configurable:true});
""", force_expr=True)
while True:
time.sleep(1)
selenium 代码如下
url = "https://www.xxxx.com"
driver = webdriver.Chrome()
driver.get(url)
driver.execute_script(js) #driver.execute_async_script(js)(也不行)
while True:
time.sleep(1)
按理说,通过 case1、case2、case5 应该可以确定 webdrier 是过不过检测的关键字段,那么如果
pyppeteer 和 selenium 这俩在注入 js 的时候有什么不一样的地方吗?
还有最让我迷惑的是 case4 和 case5 为什么结果不一样啊?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.