python 抓取页面使用 javascript 做跳转,该如何获取有效 URL?

2015-04-08 14:52:38 +08:00
 iam36
web页中使用了javasript进行翻页跳转,如何通过python获取有效的URL?

搜索了半天不得要领
6188 次点击
所在节点    Python
9 条回复
facat
2015-04-08 15:04:44 +08:00
什么形式的跳转?是直接写在js里面,还是用js取回地址后跳转?
est
2015-04-08 15:19:12 +08:00
月经问题了。

学抓页面的从来都不去学习下web入门知识么。。。。。。。。
ljcarsenal
2015-04-08 15:39:09 +08:00
全民抓取啊。。。。具体情况具体分析,有些链接是有规律的,自己拼接url。。不如你把连接贴出来
iam36
2015-04-08 16:00:56 +08:00
动作:
<a href="javascript:query('prevWeek');" class="prev">上一周</a>

JS:

function query(weekflag) {
var channelId = document.getElementById("channelId");
var dateStr = document.getElementById("dateStr");
if (dateStr.value == null || dateStr.value == '') {
alert("请选择时间.");
return false;
}
if (channelId.value == null || channelId.value == '') {
alert("请选择类型.");
return false;
}
var channelName = channelId.options[channelId.selectedIndex].text;
document.getElementById("channelName").value=channelName;
form1.action = "/app/get.action?weekflag="+weekflag;
form1.submit();


不会写网页 ,连调试都不会,道理上应该是确定weekflag的内容,再和"/app/get.action?weekflag="串起来提交即可。

确实没搞定
mengskysama
2015-04-08 20:16:43 +08:00
phantomjs算了
Slienc7
2015-04-08 21:07:50 +08:00
找个网站,看看JavaScript和html入门要不了多久
facat
2015-04-08 23:22:46 +08:00
@iam36 看你贴的这段代码,你直接抓取 http://www.你抓取的网站.com/app/get.action?weekflag="你要的内容"
aaaa007cn
2015-04-09 00:13:51 +08:00
@iam36
最无脑的方法肯定是开着浏览器的开发者工具记录请求
然后观察点击后浏览器发出的请求

@facat
这是个 form
还得考虑 dateStr、channelId、channelName 是不是在 form 中
是 GET 还是 POST
v5mark
2015-04-09 11:38:38 +08:00
phantomjs +1

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/182332

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX