问个 JavaScript 问题,在浏览器控制台抓取页面信息

2015-07-31 19:56:24 +08:00
 lichun

http://i.imgur.com/0YVuC4t.jpg
Imgur
<img src="http://i.imgur.com/0YVuC4t.jpg" title="source: imgur.com" />

var doc = document.getElementsByClassName('item_title')

for(var i = 0; i < doc.length; i++) {
    console.log(doc[i].textContent)
}

PS: 一直没怎么学过JS的,只是需要用到的时候去翻w3c


http://i.imgur.com/0YVuC4t.jpg
[Imgur](http://i.imgur.com/0YVuC4t.jpg)
<img src="http://i.imgur.com/0YVuC4t.jpg" title="source: imgur.com" />

各种格式都不能显示图片,我已经不会发图了。

2836 次点击
所在节点    Python
10 条回复
SilentDepth
2015-07-31 20:41:17 +08:00
一翻页页面就刷新了,上下文也就刷新了,变量自然就没了。需要一个脱离当前页面的东西来抓取和储存数据,比如外部应用、浏览器插件,或者把数据存到Cookie等地方。
jugelizi
2015-07-31 20:48:30 +08:00
保存到localstorge
iyangyuan
2015-07-31 21:40:49 +08:00
保存也没用,刷新的时候程序都没了,楼主的需求最好是用程序模拟http请求,不依赖浏览器,如果喜欢js,可以用nodejs
lichun
2015-07-31 21:42:46 +08:00
@iyangyuan 因为有些网站的登陆验证挺繁琐的!所以才没有用python来做
bdbai
2015-07-31 21:56:19 +08:00
@lichun Cookie大法好
geeti
2015-07-31 22:02:31 +08:00
lz头像有品位!
lichun
2015-07-31 22:12:52 +08:00
@bdbai 哦哦, 猛然醒悟,直接把浏览器的cookie拿来用就好了
iNaru
2015-07-31 23:10:21 +08:00
cookie长度有限制吧,不如直接ajax。
iyangyuan
2015-08-01 08:22:03 +08:00
我一般是用c#的webbrowser解决登陆问题,直接在软件里搞个浏览器界面,手动登陆,然后程序控制浏览器,随心所欲:)
xarrow
2015-08-02 12:30:33 +08:00
小的信息放在localStorage里面,如果抓取多的话,用node

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/209924

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX