一个精选公众号文章的网站,基于 Pelican

2017-07-03 15:48:16 +08:00
 fangpeishi

妹子之前常常在公众号会分享一些文学社科类的文章,质量都比较高,所以想着能够做一个推荐,一天一期,目前做了六期。内容是妹子手工筛选的,加个简单的评语。有时候一期有主题,一期没主题,全看她的心情。

http://s.fangpeishi.com/

我坚持要做一个 Web,Coolshell 那篇《为什么我不在微信公众号上写文章》 很多观点都赞同,不过大势所趋,我想做的只是希望能把这些文章的链接搬到一个相对开放的地方,做个推荐,不至于埋在公众号的历史文章里面。

Pelican 这个静态博客框架非常好用,推荐给大家,不知文章数近百篇的话,生成的时候会不会有性能问题。

现在已经有许多抓取公众号的站,大都是全文抓取,对作者来说不太友好。个人觉得虽然微信封闭,但是对作者的保护还算不错,所以不太喜欢这种方式。

目前推荐的文章的公众号列表,大家可以看看,对我来说这些公众号之前听都没听过(关注的基本都是 IT 相关),还挺有意思。

妹子找文章的过程中,发现有不少商业运作的公众号,一开始的文章写的非常好,后续变的非常糟糕,非常可惜。

另外也有一些个人的公众号,写的非常好,比较小众,更新全靠心情,只有圈子里的人才知道。

妹子说,在一堆垃圾找东西,虽然辛苦,但是还算有趣。

阿里云 ECS 续了半年,看看妹子能否坚持下去吧。 如果她能坚持下去,应该有 100 期了,人气可以的话,会投入一些钱,做推荐文章奖励计划,依靠“群众的力量”。

TIPS. 阿里云过期之后再续费,折扣比较大。

本来想发到分享创造,不过想来还是发在推广比较合适,本来就是有推广的想法,激励她做下去。

谢谢。

3217 次点击
所在节点    推广
16 条回复
cqcn1991
2017-07-03 16:42:06 +08:00
这种我也做过
一个小建议是做数据驱动
公众号的文章的数据有阅读量,赞数,以及时间序列
这 3 个结合可以玩出很多花了,内容质量会比较不错,而且维护精力极小
fangpeishi
2017-07-03 16:49:53 +08:00
@cqcn1991 谢谢建议。有时候,就是感觉不太相信数据。看过几个按照阅读量做出来的榜单,质量不太高。不过通过这些手段,若可以为降低人工挖掘的成本,也是极好的。
cqcn1991
2017-07-03 17:43:55 +08:00
@fangpeishi 是看你如何理解数据
一个简单的例子,只按阅读量来做的话,那么阅读量最高的,非常接近于今日头条的“震惊”等等文章,这种文章是毫无意义的
但是,假如考虑这种模型:对于一个小众公众号,平均阅读量在 300,点赞在 10,那么有一篇新文章,假如阅读量在 600,点赞在 30,是不是可能会有价值?因为和之前的表现不同
那么我监测的时候,超过本号平均阅读量 百分之多少,我就可以晒出来,作为进一步考虑的对象
0017
2017-07-04 10:06:57 +08:00
提供了 RSS,赞 现在有 rss 的站点越来越少了
lsj5031
2017-07-04 10:39:15 +08:00
@cqcn1991 个人觉得这种数据参考价值不大,别人的喜好可以和你的非常不一样,哪怕是大众的主流的。哪怕赞的比例高或者多,代表不了什么……
fangpeishi
2017-07-04 10:42:24 +08:00
@0017 rss.xml 那个有点问题,atom 的会持续更新维护:
http://s.fangpeishi.com/feeds/all.atom.xml
0017
2017-07-04 10:56:54 +08:00
@fangpeishi 看了下网站解析到的就是 atom 没有 rss,其实对订阅来讲这两个格式没什么区别
0017
2017-07-04 10:59:43 +08:00
两个都提供的个人喜欢选 RSS 格式,冻结了核心开发感觉用起来更稳定
nifanle7
2017-07-04 11:17:43 +08:00
@lsj5031 作为读者,我倒是觉得 @cqcn1991 方法未尝不可,做推荐系统,能有不一样的好东西出现在时间线上,没准会喜欢上。当然,要是再加个筛选或者屏蔽规则,就更帅了。
cqcn1991
2017-07-04 12:08:25 +08:00
@lsj5031 我好像没太解释清楚?

对于一个你感兴趣的喜欢的公众号,不太可能他每天推的内容都是非常好的,你每天去看,会比较费精力,尤其是 LZ 这种 curation 的东西

一个简单的办法,就是看这篇文章,其表现(阅读量,点攒数 etc.)是不是比平时的表现要高, 这样子比较可以显著减少筛选的工作量.

你现在觉得这个数据参考价值依然不大?可以解释一下吗?
cqcn1991
2017-07-04 12:09:56 +08:00
@lsj5031 我这里用的是最粗的模型,都没有按信息源去排序,效果对我自己来说已经很好了
http://productchaseapp.herokuapp.com/tech2pocket
cqcn1991
2017-07-04 12:17:28 +08:00
@nifanle7 这只是给了一个简单的思路。真要做推荐系统,可以往里面扔的东西太多了....我这种都不算经典的推荐系统做法,比如可以根据点击量动态调整文章顺序, 协同过滤等等
fangpeishi
2017-07-04 12:24:01 +08:00
@cqcn1991 思路挺好的,可以降低人工筛选的工作量。
不过微信的封闭,让我不太想花时间去写代码完成这种工作,很可能熬一个通宵做的东西下周就失效了。
isCyan
2017-07-04 14:35:19 +08:00
这个纯 Bootstrap 的主题真精致,超级养眼
lsj5031
2017-07-04 17:28:44 +08:00
@cqcn1991
噢,公众号用得少,有点拍脑袋,我是觉得如果我的 reading list 里面根据一些和我关系不大的人的赞的话,估计很有可能都是共青团或者鹿晗了……

我一般是主动阅读,想了解什么的时候去关注相关信息,被动推送的都是看个标题决定看不看。

pocket 的 explore 之流就还行,起码是认为这文章还不错的人在看些什么,稍微更具参考价值。

网站做得不错
fangpeishi
2017-07-04 17:59:49 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/372695

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX