统计了 1000 个中文独立博客,我算出了他们的“腐烂率”
数据来源: https://github.com/saveweb/rss-list
总计:965 个博客
托管于 Github Page 的博客:182 个(不包含使用了 CDN 代理 Github Page 的博客)
腐烂的博客数:113 个(不管网站是否删过内容,换过域名,只要博客主体存在,就不算腐烂)
统计持续时间:17 个月
中文独立博客定义:
- 包含:独立域名 和 eu.org 、github.io 、gitlab.io 、gitee.io 的三级域名。
- 不包含:wordpress.com 、网易博客、blogger.com 等的三级域名。
经过简单计算,中文独立博客的年站点腐烂率为 8.26% ,换句话说,每年约有 8%的中文博客会消失(被其他网站采集,如 archive.org ,也算消失)。
以此类推,现在这一批中文独立博客在 8 年之后,会有 50% 消失(0.9174^8)——半衰期是 8 年。15 年之后,现在这一批中文独立博客将有 70% 消失(0.9174^14)。但互联网日新月异,未来腐烂率的数值是多少谁也说不准。
不过中文独立博客的年链接腐败率暂时难以量化统计(需分析收集到的 59447 个博文链接,要花上一些时间,有时间我会统计一下),但只会比站点年腐烂率更高。因为很多博客会出现数据库丢失、更换域名、博主主动删除文章、迁移博客程序等一系列导致永久链接失效的情况。所以我主观估计中文独立博客的年链接腐败率在 20~30% 左右。
同时,我们发现越来越多的中文博客选择使用静态博客程序并托管到 Github 、Gitlab 、Cloudflare 等 Pages 服务上,这一趋势无疑对减小腐烂率有益。且用户友好的低技术托管平台有助于中文独立博客数量的提升(网上一堆静态博客入门教程)。但需要指出的是,选择 Pages 服务托管静态网站本质上和选择 Blogspot 、Wordpress.com 等第三方博客托管平台并无区别,仍然面临平台倒闭或事故导致数据丢失的集中隐性风险(假如 Github Page 现在停止服务,我们将瞬间丢失至少 20% 的中文独立博客)。
而短期来看,自托管(self-host)博客仍然是风险、成本、技术要求较高的选项,比集中化的平台更容易发生链接腐烂的情况。
https://blog.othing.xyz/archives/chinese-independent-blogs-link-rot-2022.html
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.