Reader 只是 Safari 的一个功能,和其他浏览器的插件一起应该都是各自独立的实现。要说标准的话,有一个概念叫语义化,semantic HTML。也就是不同的内容,以结构性放入对应的 HTML tag 里,反例就是所有内容全部放在 div 里。再辅助以 microdata 等 metadata 信息( css class 名之类的也算),剩下的就看各个插件,依靠常识来判断提取内容了。
说白了就是看网站自己的代码质量了。
geelaw
2019-08-02 11:08:35 +08:00
方法是猜哪部分是标题 /正文 /时间 /作者 /版权信息等,再应用一个特定的 CSS 来显示。
beijiaoff
2019-08-02 11:37:10 +08:00
你自己手写一个网页也支持的。他就是智能提取文章的大段文字。
demov2
2019-08-02 11:44:44 +08:00
readability
love
2019-08-02 11:49:26 +08:00
有算法的,大致来说是 P 标签数量 /文字长度 /元素 className/A 标签数量比率等因子的组合
第 1 页 / 共 1 页
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。