如何抓去一个网站的友情链接和友情链接网站的友情链接

2019-12-07 18:34:26 +08:00
 GeekYun7

如题

如何抓去一个网站的友情链接和友情链接网站的友情链接,和友情链接网站的友情链接网站的友情链接………

说起来比较繁琐哈,就是我想抓去一个博客的友情链接,然后在抓去他博客友情链接站点的链接…一直重复…

大佬们有什么好的解决方案嘛?

我主要是想通过 rss 订阅一些有价值博客的文章,用于快速阅读

1340 次点击
所在节点    问与答
5 条回复
Tink
2019-12-07 20:31:05 +08:00
如果没有特征的话,可能真的需要一个一个适配
GeekYun7
2019-12-07 21:00:17 +08:00
@Tink 不可直接匹配非站点 url 吗?有没有相关的软件可以协助我完成我的想法
Tink
2019-12-07 21:34:08 +08:00
@GeekYun7 #2 关键不是这个问题,关键问题是如何找到每一个站点的友情链接页面,找到之后就很简单了,抓取非本站点 url 就行了
GeekYun7
2019-12-08 09:10:22 +08:00
@Tink 直接匹配非本站链接就可以了一般 /links 或者 /friends 就是了,首页也有
ysyk
2019-12-31 16:55:57 +08:00
友情链接最常见的情况是,在首页存在。

所以就可以限定网站首页非此网站域名,且判定链接是域名,或二级域名,或一级目录。

其他的可以不做考虑。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/626843

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX