用 selenium +chrome() 写了一个爬取 http://www.rainpat.com/Home/Index ‘’ 自动下载专利的爬虫。 一开始使用的 chrom,用的是 xpath 定位元素()右键审查元素,然后复制 xpath )一切正常 [code=php] from selenium import webdriver driver = webdriver.PhantomJS() driver.maximize_window() driver.get('http://www.rainpat.com/Home/Index') new = driver.find_element_by_xpath('/html/body/div[4]/span').click() login = driver.find_element_by_xpath('//[@id="S_top_content"]/div[1]/div[2]/ul/li/a').click() name = driver.find_element_by_xpath('//[@id="SLoginform"]/table/tbody/tr[1]/td[2]/span/input[1]') name.send_keys(name) password = driver.find_element_by_xpath('//[@id="SLoginform"]/table/tbody/tr[2]/td[2]/span/input[1]') password.send_keys(paseeword) login2 = driver.find_element_by_xpath('/html/body/div[3]/div[3]/a[1]/span/span[1]') login2.click() driver.implicitly_wait(5) driver.maximize_window() close22 = driver.find_element_by_xpath('/html/body/div[4]/span').click() driver.maximize_window() search = driver.find_element_by_xpath('/html/body/table/tbody/tr[2]/td/form/div[2]/input[1]') search.send_keys(str(105636083)) driver.implicitly_wait(2) search_click = driver.find_element_by_xpath('/html/body/table/tbody/tr[2]/td/form/div[2]/input[2]').click() driver.refresh() driver.implicitly_wait(10) print('download') driver.maximize_window() downloads = driver.find_element_by_xpath('//[@id="S_patentlistup"]/div[2]/table/tbody/tr/td[2]/div[4]/span[4]') [/code] (其中我写了很多刷新和最大化,因为我发现对于同一段代码执行多次有时候能够定位到,有时候不能。我发现加了等待和刷新就可以了。) 但是当我把浏览器换成(driver = webdriver.PhantomJS())之后,在( downloads = driver.find_element_by_xpath('//*[@id="S_patentlistup"]/div[2]/table/tbody/tr/td[2]/div[4]/span[4]'))这一句中,这个元素一直定位不到 报错:NoSuchElementException: 为什么?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.