像印象笔记这种抓取页面关键内容的技术有相关开源项目吗?

2013-11-22 17:48:14 +08:00
 thursday
像印象笔记这种抓取页面关键内容的技术 效果很不错。想在自己项目中应用下。生成简介内容。。大家有什么方案吗?
4420 次点击
所在节点    程序员
11 条回复
chmlai
2013-11-22 17:54:31 +08:00
thursday
2013-11-22 18:02:50 +08:00
@chmlai 感谢
reorx
2013-11-22 18:15:12 +08:00
需要什么语言的?
thursday
2013-11-22 18:20:16 +08:00
@reorx 语言无所谓
kingwkb
2013-11-22 18:25:13 +08:00
greatghoul
2013-11-22 19:02:17 +08:00
google code 上面那个项目还在维护吗?
icyalala
2013-11-22 19:20:19 +08:00
http://v2ex.com/t/67099 之前有帖子。。

http://www.cnblogs.com/phoenixnudt/articles/2382140.html 这文章里有介绍常用的开源库

Github以"readability"搜索,有很多开源项目~
thursday
2013-11-22 20:38:07 +08:00
@lcyalala 感谢
ccbikai
2013-11-22 21:44:12 +08:00
thursday
2013-11-22 22:39:26 +08:00
@ccbikai 这个有调用限制的吧
yearsaaaa
2013-12-19 20:41:58 +08:00
公司有部门已经用了readablity了哦

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/90233

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX