昨天入门了下爬虫
今天遇到了问题
我想爬这个图片网的图片
就是用 selenium 获取到了 url
但是得到的 driver.page_source 的值是一堆 javascript,没有
而我想获得的是
里的内容
所以现在用 beautifulsoup 解析不出来
BeautifulSoup(driver.page_source, 'lxml').find_all('a', class_='cV68d')
应该怎么解决?貌似用 driver.get_element 之类的方法也能找出来标签内容,但我想把整个 driver.page_sourse 的内容解析出来,用 soup 来处理
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.