我想实现这个网站的爬虫功能: https://www.cnhnb.com/hangqing/cdlist-0-0-0-0-0-1/?k=%E6%9F%91%E6%A9%98
但是这个网站在爬取时会出现滑块验证码需要验证的问题,我检索工具中找答案,但是基本都是使用 Python 来解决的,我不怎么会把那里的 Python 代码转化到 Java 代码,用 GPT 也转不了(会出现各种预期之外的代码问题),还有一个方式是先获取原图像和滑块的缺口图像然后再对图像进行处理,但是我验证码的 HTML 代码里没有 src 我也不知道怎么通过什么下载出来,这招对我来说也不行
各位想知道那个滑块验证码的具体样子只要进入我的网址多翻几页就可以看到了
我真的什么办法都尝试过了,我真没办法所以我来问问各位,有懂的大佬能不能记一下,在下感激不尽啊
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.