中文搜索的未来走向何方?

2019-08-01 08:49:37 +08:00
 ligz

标题是中文搜素,而不是百度搜素,因为最近是越来越发现整个中文的搜素质量都很堪忧,无论是 Google 还是百度或者其他的搜索引擎。搜索的答案都不能令人满意,远远达不到当年万事不决问度娘的水平。我们以技术和生活两大方面举例。

技术

除去 Github 和 Stack Overflow 还有官方文档的帮助,我们一些生产上的技术问题很多还是需要靠前人的经验博客来帮忙,但是现在因为博客网站的商业化,比如 csdn,因为广告和营销手段导致很多的人都不愿意在上面写博客了,都把优质的博客和教程写到自己的网站或者 github 中了。

现在 csdn 里面充斥着大量的抄袭、雷同的低质量博客,但是 csdn 在搜索引擎的权重比都非常的高,导致了很多优质量的答案排名远远比不上那些抄袭和雷同的答案,(无论是百度还是谷歌)有时就出现中文搜索答案前几名一模一样的情况,或者全是一些 csdn 和博客园类似的答案。

如果使用纯英文在 Google 上搜索技术问题,会发现 Google 会搜录一些像 Stack Overflow 或者官方文档还有其他的小网站的博客或者教程,答案的质量直观的可以感受到比中文搜索的要高。

愿意分享优质答案的网站没有排名,有排名的大都是雷同和抄袭的答案。确实是现在中文搜索技术方面的现状。

生活

搜索和生活相关的就更无力吐槽了。百度热衷于创建自己的流量生态而无视其他内容平台的贡献。导致腾讯阿里和现在一些新的电商和社区(知乎、虎扑之类)自建信息孤岛,不公开数据给搜索引擎,导致不仅仅是百度,谷歌的中文搜索质量也存在相当大的下滑,生活上比如新闻、影视、找资料等等已经不会去用到搜素了。

那么问题就来了,中文搜索会就此一蹶不振吗?是各大巨头建立信息孤岛替代一站式搜索达到目的?还是有新的趋势弯道超车来满足一站式搜索的需求呢?

中文搜索的未来走向何方?

13023 次点击
所在节点    程序员
110 条回复
swulling
2019-08-01 12:44:21 +08:00
第一次听说百度搜不到腾讯阿里的锅是百度自己。
cherryas
2019-08-01 12:48:23 +08:00
『百度热衷于创建自己的流量生态而无视其他内容平台的贡献。导致腾讯阿里和现在一些新的电商和社区(知乎、虎扑之类)自建信息孤岛,不公开数据给搜索引擎』

从结果看是正确的,但是从过程看,却不正确。
abcbuzhiming
2019-08-01 12:49:05 +08:00
@trait 因为我国尚处于资本主义初级阶段,没有亲身体验过大企业玩垄断统治的恐怖。美国对超级大企业有警惕是因为经历过上世纪 30-40 年代如洛克菲勒,杜邦这种超级寡头无法无天,动不动在街头请竞争对手的工程师坐土飞机的时代
xmoiduts
2019-08-01 12:56:13 +08:00
最近遇见一件迷惑的事情,我自己博客开了个单页,藏在侧边栏里,手动点击才能找到,是我不会搞 sitemap,用来手动索引某些文章单页的,这样他们就不会占我主页时间线。
然后这页被百度收录了,除了另一个归档外,其他文章一点没收录。

所以啊,努力不一定成功,但摸鱼一定会很轻松。
loryyang
2019-08-01 12:56:48 +08:00
你是看了这个文章吗? https://www.huxiu.com/article/310632.html
xmoiduts
2019-08-01 12:58:51 +08:00
当然我是个小博客,流量主们甚至连文章都懒得盗,我只见过一篇正文被 csdn (可能也是 bot )转载,还附了链接很 ok 了。
tomoya92
2019-08-01 13:02:01 +08:00
@luomu24 瘦死的骆驼比马大 :dog
coolair
2019-08-01 13:04:25 +08:00
字节跳动要做搜索了。
soulzz
2019-08-01 13:17:29 +08:00
中文信息孤岛 国内巨头要负很大责任
xuanwu
2019-08-01 13:18:26 +08:00
求人不如求己: https://v2ex.com/t/488032#reply39
iPhoneXI
2019-08-01 13:29:16 +08:00
personal blocklist not by Google
CarrotD
2019-08-01 13:30:45 +08:00
中文网络中本身有用的信息就是真的很少,当然百度无底线的运作模式也是现状的一大原因,Google 成为我的首页已经很久了,现阶段感觉无论用什么进行中文搜索都是有一种沙里淘金的疲惫感,尤其是搜索技术一类的问题,英文结果基本上不出前三个绝对能找到答案,中文就真的算了吧……
ZztGqk
2019-08-01 13:38:00 +08:00
技术内容:直接用英文搜,中文除了翻译的内容和一个些个人博客外,其余的都是重复的。
生活内容:搜出来的全是一样的内容(一样的几率比技术内容高不少,毕竟受众广,好营销),一篇文章发发几个地方,要么就是营销号,要么全是正面内容,很糟糕。
Wicked
2019-08-01 13:40:42 +08:00
连中文媒体都没有多少优质内容,就不要说独立博客了
我现在 90%以上都是用英文搜索和看英文资讯
fromdark
2019-08-01 13:53:01 +08:00
还是英文吧,确实中文内容即使用谷歌来搜,有时候也达不到想要的结果
stargazer242
2019-08-01 14:12:29 +08:00
搜索已死
zjyl1994
2019-08-01 14:17:37 +08:00
中文互联网的问题在于,一批网站被关,一批 app 禁止外部搜索做信息孤岛,还有大量话都说不明白的 SEO 聚合网站稀释信息有效度,能搜到的有用内容就很少了。这和搜索引擎没关系。。。
laqow
2019-08-01 14:25:17 +08:00
中文搜索没毛病,中国的中文搜索有毛病
wingkou
2019-08-01 14:34:16 +08:00
从根源上来说,就是垃圾站太多。

另一方面,从自然语言的处理来说,中文由于其本身的特点,的确比英语难做很多。
cco
2019-08-01 14:40:06 +08:00
Google 吧,似乎稍微能好一点点,至少有些大佬 github.io 的文章还是能搜到的。再就是丰富 RSS,配合印象笔记的裁剪,统统保存到自己的日记中吧,不少优秀的博客陨落了,也希望大家做站点的能够坚持一下,有费用的话可以白嫖 github 或者 netlify。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/588046

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX