Safari 的阅读器模式很好用，但是它的工作原理是什么。。

在浏览某些网页的时候，可以点击地址栏左边的“阅读器视图”按钮，即可切换为阅读器模式（类似 PDF 页面的效果，简洁舒适）。比如 qq 新闻详情页面等。
但是它的技术原理是什么，是否是某种 html 标准？

chroming

2019-08-02 10:30:46 +08:00

应该只是做了网站正文检测和匹配，没标准

maxxfire

2019-08-02 10:39:16 +08:00

@chroming 我看不少网站都支持，甚至一些没名气的小站点。。

fansangg

2019-08-02 10:45:35 +08:00

https://github.com/kenshin/simpread

winddweb

2019-08-02 11:04:36 +08:00

Reader 只是 Safari 的一个功能，和其他浏览器的插件一起应该都是各自独立的实现。要说标准的话，有一个概念叫语义化，semantic HTML。也就是不同的内容，以结构性放入对应的 HTML tag 里，反例就是所有内容全部放在 div 里。再辅助以 microdata 等 metadata 信息（ css class 名之类的也算），剩下的就看各个插件，依靠常识来判断提取内容了。

说白了就是看网站自己的代码质量了。

geelaw

2019-08-02 11:08:35 +08:00

方法是猜哪部分是标题 /正文 /时间 /作者 /版权信息等，再应用一个特定的 CSS 来显示。

beijiaoff

2019-08-02 11:37:10 +08:00

你自己手写一个网页也支持的。他就是智能提取文章的大段文字。

demov2

2019-08-02 11:44:44 +08:00

readability

love

2019-08-02 11:49:26 +08:00

有算法的，大致来说是 P 标签数量 /文字长度 /元素 className/A 标签数量比率等因子的组合

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/588421

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.