我们正在尝试收录所有的中文博客

145 天前
 linlinzzo

我们创建了一个名为“中文博客列表导航”的项目,目标是收录几乎所有的中文博客,目前项目收录的体量大概在三千左右。

不同于一些其他的博客聚合项目,博客列表的收录门槛很低,基本上只要求是个中文博客以及有三篇文章即可。这让我们可以更全面地收录中文博客。

除了您主动向我们提交和我们顺着友情链接“顺藤摸瓜”,我们还会从一些别的聚合项目同步博客,您有可能在没有提交博客的情况下发现您的网站已经被我们收录了。

我们收集了博客的名称、一句话简介、订阅地址、网站地图、博客架构以及我们人工给博客贴上的标签。访客可以在项目主页通过标签筛选来找到对应标签下的博客,也可以在统计图标看看现在大家都在用哪些架构,比如 Hexo 和 Typecho ,或者是大家都在用哪个后缀的域名。订阅地址这些信息在前台隐藏了,不过您可以通过我们公开的 API 查看到我们收集的完整信息。

我们尽可能收集全面,也希望有社会学研究的朋友研究博客的时候可以有一个比较广泛的样本。

当然,因为我们收录的博客太多了,所以我们还需要有人来帮我们实现诸如博客测活之类的自动化。我们也希望可以为这些博客数据找到一些新的用途。

我们项目的地址是 https://zhblogs.ohyee.cc/

6667 次点击
所在节点    分享创造
65 条回复
Track13
144 天前
如果打算盈利,就不要镜像别人的内容。
linlinzzo
144 天前
@microka 我反馈给负责网站的人了,等待恢复。
linlinzzo
144 天前
@win11 我们有从十年之约、BlogFinder 和中文独立博客列表同步博客,在上述聚合项目提交的博客也会被同步到博客列表中。

> 做这件事情和做 up 主列表差不多(
所以我们说收录几乎所有中文博客,路长漫漫,但估计总要有人做?
linlinzzo
144 天前
@Track13 我们还没有打算盈利
8620
144 天前
非常不建议镜像。一旦镜像,无论是否盈利,就有版权和法律的风险(如千禧版权法案通知),毕竟不是所有博主都给博客上 CC 一类的协议。
kebamt
144 天前
502 Bad Gateway
The proxy server received an invalid response from an upstream server.

Powered by Tengine
amber0317
144 天前
hi ,我做过一个顺着友情链接递归搜索+去重/黑名单过滤的中文博客搜集爬虫,开源在 https://github.com/AsterisMono/InfluncPlus 。当时写这个项目是出于和你们一样的目的,希望能有所帮助。
michaelzxp
144 天前
502 Bad Gateway
Doldrums
144 天前
502 Bad Gateway
The proxy server received an invalid response from an upstream server.

Powered by Tengine
linlinzzo
144 天前
@momooc @jaya2024 @gpt5 @ztstillwater @kebamt @michaelzxp @Doldrums 问题已反馈,等待网站恢复。
linlinzzo
144 天前
@momooc @jaya2024 @gpt5 @ztstillwater @kebamt @michaelzxp @Doldrums @microka 问题已暂时解决(程序版本的已知问题,下个版本再修),网站可以访问了。
ko20
144 天前
博客架构分析和域名分析那部分长见识了,项目挺有意义的。

另外也看到了我的博客 哈哈哈 谢谢
molezznet
144 天前
那就顺便提交下自己的
lhwj1988
144 天前
support
sss123
144 天前
我之前收藏一个类似的: https://www.boyouquan.com/blogs
BeijingBaby
144 天前
用最新的技术( nextjs ),做最古老的网站(风格)。
HeyWeGo
144 天前
有时候独立博客可信度比公共媒体的可信度更可靠。因为利益关系没那么明显
Charon2050
144 天前
有一个建议哈,目前提交登记时的分类选择实在是太多了,估计有上百个,根据「太多选择会让人放弃选择」的经验,感觉可以精简到 20 个以内,这样也有利于后续按分类查找博客
linlinzzo
144 天前
@Charon2050 好建议!我登记一下
linlinzzo
144 天前
@sss123 在这遇到了一些熟悉的博客😄

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1053625

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX