最近用 Google BigQuery 收集了一些排行比较高的书

2017-05-08 11:46:02 +08:00
 pluson

规则很简单,就是在 Stack Overflow,Reddit 跟 Hacker News 里提到的最多的几本书,按照提到的次数排名。

http://getbookpocket.com/

如果有人对美赚有兴趣,懂运营推广,懂 SEO,也欢迎一起聊一下。

2937 次点击
所在节点    分享创造
8 条回复
lycos
2017-05-08 14:04:49 +08:00
感谢分享
lanstonpeng
2017-05-08 18:33:10 +08:00
可惜 GCP 里面没有 douban,goodreads 的数据,如果能自己花些成本抓就好了~

另外,数据上算是一个讨论最多,而非 Best, right?
最后我觉得在列表页里面的直接可以去到 Amazon 比较好,这样转化较高
pluson
2017-05-08 19:09:54 +08:00
@lanstonpeng 确实不能算是 Best, Right,应该算是 Top mentioned. 不过这也能说明这些书的质量都确实很高,从另外一个角度上来说也可以说是 Best.

当然可以直接从列表进 Amazon,我想一下展现形式。另外也是希望在内容做得更好一些,长期而言,内容才是最主要的。

另外在这方面也(在)做了一些研究,如果有兴趣的话,可以加个联系方式,一起聊一下
althoughghgh
2017-05-09 15:28:36 +08:00
stackoverflow 开放的数据有 34,000,000 条 Posts,可以在 archive.org/details/stackexchange 下载,
之前有个博主自己下载并分析了 so 的 top mentioned books
https://medium.freecodecamp.com/i-analyzed-every-book-ever-mentioned-on-stack-overflow-here-are-the-most-popular-ones-eee0891f1786
pluson
2017-05-09 16:52:55 +08:00
@althoughghgh

这篇文章之前就看过,这个想法来是来自于他,我提到的 Stack Overflow 的数据是来自 Google 的 BigQuery. 我同时试过加上 Comments (55,000,000) 结果也没有差很多。不过 Google 最后一次的数据更新是 march,也会有一点误差。

另外你如果仔细看了文章的话,而且再深入一下,你会发现,这个博主做的工作,花了几天( > 2 )时间,来分析的这些数据,但是 Google 的 BigQuery 需要几秒钟(<10s)就可以了,关键是结果并没有太多的差异。
pluson
2017-05-09 17:14:50 +08:00
网址测试: <a href="http://getbookpocket.com/">getbookpocket.com</a>
althoughghgh
2017-05-09 18:00:40 +08:00
@pluson 是的,结果没什么差别,因为提到 Amazon 链接的 post 其实挺少的,
不知道能不能再挖掘些其他方便变现的数据 (
话说楼主有收入了么。。
pluson
2017-05-09 18:04:15 +08:00
@althoughghgh 这个网站刚做出几天来,我也在想,如果有兴趣的话,可以加个微信聊一下,我的邮箱在网站上。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/359831

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX