我写了一篇有关搜索引擎原理与架构的文章

2015-11-05 23:22:32 +08:00
 gujianbo

如下:
http://gujianbo.1kapp.com/search-engine-intro/

博客没有谁来看,没有什么流量,原本写博客的目的就是跟大家交流讨论,让大家给我提意见,让大家都有所进步。我当然是坚持原创的东西

4067 次点击
所在节点    程序员
17 条回复
jeffjade
2015-11-06 00:47:52 +08:00
不错,赞一个。

请教一个关于针对百度搜索的问题可以? 用百度搜索总会有这样的尴尬: 比如你想搜索:“李易封”三个字。然而它的“智能化”算法,给你的结果都是“李易峰”。可是如想要就是'李易封',怎么办?

之前有看到文章说可以用半角英文引号将需要搜索的内容包裹起来搜索;可是刚才也试了试,并不能 很好的工作。额~ 百度如此搞起‘贴心’,真的好么?
HentaiMew
2015-11-06 03:02:24 +08:00
临时收藏了,有时间看看。
@jeffjade 其实谷歌也会这样。不过百度更蠢一些,以前经常是点击了 仍然搜索“ XX ” 以后继续给你搜索“纠正”后的结果 ... 再点击仍然搜索“ XX ”之后依旧如此往返... 不同时间段在手机百度上都出现过这种情况。虽然现在基本没了。。。
Andy1999
2015-11-06 03:11:05 +08:00
百度:有钱就是爷

索引我博客一堆 但是文不对题 有个毛线用
simon7
2015-11-06 07:48:39 +08:00
I SsVpnsogf
ryd994
2015-11-06 08:22:42 +08:00
亲爱的用户,我是你爹
realpg
2015-11-06 08:28:37 +08:00
@jeffjade
只要是你搜的那个词确实有结果,会提示
已显示 XXX 的结果 仍然搜搜 YYY
MeOO
2015-11-06 08:48:23 +08:00
楼主厉害!大赞!!
aksoft
2015-11-06 08:52:58 +08:00
你是百度的?
LittleLeopard
2015-11-06 09:11:30 +08:00
没法评论,总是提示 微博登陆后 再评论。。
jeffjade
2015-11-06 09:49:45 +08:00
@aksoft 楼主是 Tencent 的(博客中 about 中有提到)。
hitmanx
2015-11-06 09:59:38 +08:00
写得通俗易懂,赞!
hitmanx
2015-11-06 10:01:35 +08:00
“谢霆锋的是谁的儿子?”这句话看得别扭死了。。
pein
2015-11-06 10:15:51 +08:00
写得不错,值得学习,如果能再深化一点就好了。
tankcong
2015-11-06 11:34:42 +08:00
看到李娜那个例子提到个性化,如果搜索引擎在搜索结果页提供主动地打分或者 LIKE/PREFER 这样的选项会不会更好的建立用户数据。因为如果只考虑搜索历史记录的话感觉不能完整的体现用户习惯。比如同主题的两篇文章,一个仔细研究了 1 小时,另一个打开扫了一眼就关了,两者明显不同。
xiaoFen
2015-11-06 11:39:18 +08:00
谢谢分享,正想做相关毕设:)
wavingclear
2015-11-06 11:40:43 +08:00
@jeffjade 搜 李易封 -李易峰
有一次点仍然搜索发现他们就是这么干的
menc
2015-11-06 18:02:50 +08:00
@tankcong 会的,而且已经应用在工业界。

现在学术界的前沿是考虑用户无意识的鼠标动作来判断他感兴趣的 classification ,就是你搜索“李娜”之后,你鼠标看似无意识的乱动和在每个结果处光标的动作被拿来用于分析你的搜索倾向,你体会一下。

点击行为和浏览行为已经被研究的透透的了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/234001

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX