我为什么创办 Java 个体户网站?

279 天前
 gzh412sina

爬虫

之前之所以坚持人工录入,是为了确保文章质量。

现在为了平衡文章质量和文章数量,也会使用爬虫,从优质内容渠道自动采集数据。

后面的话,大部分内容都会基于爬虫自动采集。

但是有 2 个前提:
1 、必须优质内容渠道
2 、其次才是爬虫自动抓取

我为什么创办 Java 个体户网站?

Java 个体户网站的网址是: https://www.javaself.cn,要解决的问题是,搜索引擎搜不到优质内容。

搜索引擎垃圾,找不到优质内容。这是一个用户痛点,是刚需。

为什么找不到优质内容?因为海量数据时代,搜索引擎已经不起作用。你平时搜索关键字,一般都是看前面几个,最多不会超过一页,第二页基本上没人看。就这一页内容,大部分还都是垃圾。

那你怎么保证是优质内容?肉眼识别,纯靠人品。人工还是自动?人工。为什么不自动?自动就和谷歌百度没有区别,没有做的必要,这个世界上不需要再多一个搜索引擎。

段永平说了,公司做产品要有差异化,没有差异化的公司,不值得投资。苹果也是做手机,但是它可以赚到 80%以上的利润。手机行业只有两个公司,苹果和其他,其他公司都没有什么差异化。

为什么不在公众号看?因为收藏之后,你自己都忘记了。为什么会忘记?因为不方便查找啊,而且内容太杂了,大部分内容和技术无关。另外手机根本不适合看技术文章,只适合娱乐,用手机学习技术,根本沉不下心来。

为什么不用爬虫自动?爬虫不爬虫不是关键,这是技术思维在作祟。用户不关心你用什么技术,也不关心爬虫还是爬狗。用户思维是,能不能解决我的问题,能不能解决我的需求,能不能找到优质内容。或者干脆不用找,每一篇内容都是优质内容,就像沃尔玛山姆超市。

网站的核心功能是:随便看,都是优质内容,人为过滤掉 80%甚至 90%的垃圾内容。可搜索,站内全文检索。打标签,按菜单和常见关键字,分类聚合。

同类产品,之前有个开发者头条,现在已经倒闭了,关闭之前,还在天天更新。但是那里面的内容比较杂,不够垂直。

另外,一些大 V ,比如阮一峰,也会发布类似技术周刊的优质内容,坚持了好几年,具体内容我也没仔细看,应该主要是前端相关,而且最大的问题是不不方便搜索。

还有一些自媒体博主,偶尔也会发布自己看过的优质内容,但是核心问题都有一个共性,就是不好搜索,数量也不够,发几天后面就不发了。

收藏是给自己看的,甚至连自己都不看了。本质上你发出来,虽然做了聚合,但是如果不方便搜索,那么其实就和收藏夹没有区别。

所以,我们网站的优点是:优质内容 + 搜索方便。能解决好这两个核心需求就够了,其他功能都是辅助功能。搜索引擎的优点是:内容全 + 搜索方便。这就是差异化。

我们的网站,足够垂直,目标用户就是 Java 。所以,全部内容都是 Java 和 Spring 相关,说白了,就是 Java 生态相关的所有内容。

有的人可能觉得这个没有太大的价值,有没有价值,是用户需求决定的,不是意淫出来的。就问你平时找优质内容,需不需要一个专门的垂直的包含所有优质内容的技术网站。你现在是到处找,非常浪费时间,因为优质内容分布在不同的平台和 app ,而且平台和 app 都是全品类内容,大部分都是和技术无关的,有关的内容里面大部分也都是垃圾内容,你还要花时间分辨筛选,每个人每次搜索都要重复这个工作。一天下来,浪费了好几个小时。然后,当时可能收藏了,但是再也找不到了,然后下次继续搜索、筛选和收藏,重复浪费时间。

要么就是觉得技术简单,这个是典型的技术思维,一看就是个小码农,一辈子注定打工,学了这么多年技术,也没做过一个自己的产品。没有自己的产品,没有自己的生产资料,就等于古代的奴隶和长工。就知道背八股文,就懂一点理论知识,就知道扯几把淡。知识学得越多,人越白痴。

好 123 网站,就是一个网址集合,能有什么技术?但是能解决大部分人的上网需求,卖给百度的时候,百度花了好几千万。创始人直接财富自由。

这个创始人的名字就叫李兴平,他的技术水平就是一个网吧网管,网站编程都是自己自学的,这都不是重点,重点是他能发现别人的需求,并且还能满足别人的需求。所以卖了好 123 之后,第二天又创办了 4399 小游戏网站,能有什么技术含量?就是一个游戏集合而已,但是节约了大部分用户的找游戏时间,它就是个好产品。

内容网站的运营,是个苦活累活,一般人干不了。虽然是苦活累活,但是其实也花不了多少时间,每天几分钟,最多半个小时。因为我每天碰到了什么技术问题,都会去各种搜索,现在无非就是把我看到的优质内容聚合起来,方便别人搜索,方便你我他。

为什么是苦活累活?因为需要坚持,每天都要坚持,日更不辍。运营时间,得以年为单位,没有几年的时间,流量肯定起不来。首先没有时间的沉淀,优质内容数量都不够。所以得需要慢慢熬,积淀内容。

坚持是一方面,另外还要懂,就算是人肉识别,不是干这个的也不懂,就算懂,大部分人也不一定有耐心。但是看书看文章,这个事情平时就是我的爱好,所以也没有想象中的累。

搞技术的,必须要有产品思维,否则永远做不了自己的产品。没有自己的产品,就没有产权,只能打工内卷,跪舔领导。千万不能变成脑残,打工打傻了,只看技术,不看需求,更不看价值。一顿操作猛如虎,结果是个二百五。

国内哪个公司是靠技术取胜?阿里是靠技术?淘宝网站早期是买的,然后对外包产品进行二次开发。拼多多市值超越阿里,是靠技术?都是靠商业模式啊,大哥。

6446 次点击
所在节点    程序员
68 条回复
defunct9
279 天前
打开看了一眼,然后关掉了。
bzj
279 天前
看了一下,不如不做
june4
279 天前
符合对 java 后端程序员的刻板印象
wxyrrcj
279 天前
rss?
yumusb
279 天前
3 楼
luckyrayyy
279 天前
太丑了哥
journalistFromHK
279 天前
感觉这个分类吧...分了 又好像没分
GeekGao
279 天前
这和垃圾站没区别啊…
ajaxgoldfish
279 天前
是没做移动端吗
coderpwh
279 天前
啊,为啥这么丑
selca
279 天前
文案估计都是 ai 写的
ZeekChatCom
279 天前
个体户网站😓

今年是 2000 年吗?
siweipancc
279 天前
不如 pages
renmu
279 天前
省流:大部分内容都会基于爬虫自动采集
LDa
279 天前
梦回早期互联网时代
玩的就是一个反潮流
支持
google2020
279 天前
搜索引擎找不到,你这更找不到。一堆你认为优质的内容链接堆在哪里,我怎么知道看哪个,哪个又是符合我的。分类和归档太过粗放,等于没有。
sss15
279 天前
“你平时搜索关键字,一般都是看前面几个,最多不会超过一页,第二页基本上没人看。就这一页内容,大部分还都是垃圾。”
那阁下的 915 页优质内容,我又如何看的完?
lstz
279 天前
可以收录开源项目吗?我认为一些文章其实足够让搜索引擎去那部分的工作了,但好的开源项目,还是需要一个整合的
hefish
279 天前
你用我推荐, 我用我不用。
SimonWoo
279 天前
有点虎头蛇尾的感觉。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1024772

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX