求教 R 语言里有什么包可以获取某个 domain 下所有的 url 链接?

2019-04-02 23:40:12 +08:00
 sjmcefc2

想着输入一个 www.abc.com ,然后把这个 domain 下的所有 url 都 extract 出来,根据 title 帅选,有相应的包吗? 谢谢。

1185 次点击
所在节点    程序员
2 条回复
lyquan
2022-02-16 17:40:53 +08:00
虽然很久的帖子了, 可以用 rvest
html_nodes(xpath='//*/a') %>% html_attr('href')
sjmcefc2
2022-02-17 22:08:30 +08:00
非常感谢。
@lyquan 感觉现在就是爬虫小白啊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/551469

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX