Python 爬虫 js 分析

2020-09-25 11:08:40 +08:00
 MrhuangSTR

一般遇到 js 加密参数的,能通过全局搜索定位到对应的 js 文件,然后就没有然后了,试过网上搜索通过打断点调试分析加密逻辑,但是对于那些 js 反混淆比较厉害的就束手无策,网上搜对应的博客看的也是云里雾里,请问当你遇到这种不知道该如何下手的时候你们是怎么处理的?如何提高自己的 js 分析能力

2206 次点击
所在节点    Python
11 条回复
lusi1990
2020-09-25 11:22:43 +08:00
没有提高自己的 JS 分析能力, 而是换成 selenium 爬
MrhuangSTR
2020-09-25 11:25:16 +08:00
@lusi1990 selenium 真心不想用
musi
2020-09-25 11:44:26 +08:00
慢慢 debug,一般代码都是混淆的也没啥办法
vone
2020-09-25 12:01:01 +08:00
1 、可以把相关 js 单独复制出来,复制的时候如果搞不明白依赖关系就把相关的代码都拿出来;
2 、用 node 模拟需要的 window 、navigator 等特殊对象;
3 、如果有缺失代码则继续去复制;
4 、node 调试执行上述代码,如果有异常,重复 2 、3 步骤(最终目的相关 js 方法可以在 node 环境中正常工作);
5 、逐步排除无用代码;
6 、技术比较硬核的可以调试并理解对应的逻辑,弱鸡则可以直接使用 js 解释器直接包装为方法。
imn1
2020-09-25 12:08:11 +08:00
我反正没搜到不用 selenium 爬豆瓣的例子
MrhuangSTR
2020-09-25 14:59:05 +08:00
@musi 整个人都会焦躁吧..
murmur
2020-09-25 15:00:56 +08:00
爬虫大多数都是灰产黑产,干这行一点耐心都没有还行,你这还是有代码可以 debug,别人做反汇编脱壳的怎么说,一不小心程序跑飞了
MrhuangSTR
2020-09-25 15:01:21 +08:00
@vone 说到底还是要对 js 熟悉,只了解一些基本的基础知识真的很容易卡壳
MrhuangSTR
2020-09-25 15:01:46 +08:00
@imn1 豆瓣的加密还好吧
MrhuangSTR
2020-09-25 15:02:50 +08:00
@murmur 脱壳 APP 逆向应该是爬虫里最难的了
liuqiangxi
2020-09-25 15:13:30 +08:00
怎么周哥还不来打广告

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/710344

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX