大家建站的时候,到了搜索这一步,会不会很头疼呢?
做站内搜索的时候,可以使用 Google 或百度的站内搜索,或者干脆自己写(自己搭)。但是 Google 和百度的体验显然不大好,自己写又很麻烦(要学习,要优化还要运维),这时候使用第三方的搜索引擎就很方便了。
微搜索是托管的服务。最少只需要3步,就可以给自己的网站添加上搜索功能了:
嗯,是不是很简单?
除此之外,微搜索还提供基于 API 的高级用法(包括索引,搜索,分析统计等)与可视化的数据分析界面。
主要特性有:
详细请参见微搜索特性
我们是一个不大的团队,目前只有八个人。现在的每个人都是程序员,连行政都会参与coding。因此,我们创业的理念就是:让开发者的工作更简单!
在之前的项目中,我们都碰到了"要提供搜索功能"的问题,用过 ElasticSearch。直到我们渐渐意识到,像这样的工作,就跟"服务监控","长连接推送","发邮件"等等一样,如果能有专门的团队提供服务,由他们去调试,去优化,去运维,而我们只要专注自己的产品核心的开发,该是一件多么有意义的事情。
于是就这样,我们开始了"微搜索"这样一个项目。
目前微搜索还处于内测阶段,需要注册码才能注册试用。想体验的朋友可以使用如下注册码:
53e5864d316361008c010000
此外,如果你对我们团队,对我们做的事情感兴趣,欢迎联系我们。
我们长期 招募靠谱开发者
同时我们也 招募美少女
1
mornlight 2014-09-22 16:01:16 +08:00
如果网站只对内开放,需要账号才能浏览页面,你们有解决方案么
|
3
yandy OP |
4
binux 2014-09-22 16:28:55 +08:00
用拼音搜索,zidingyi 可以,zidingyisou 就不可以了
|
6
mornlight 2014-09-22 16:42:28 +08:00
@yandy 必须有账号才能搜索,所有内容都是对内。我刚才注册了一个,看起来你们是用爬虫自己去爬页面的。需要怎样的API?
|
7
yandy OP @mornlight 是这样的,搜索的流程简单来说分为两部分:索引和搜索。所谓索引,就是将需要被搜索的内容push到搜索引擎。
我们有两种方式实现索引: * [索引 API](http://doc.tinysou.com/v1/overview.html): 可以通过 API,主动地将需要搜索的内容 push 给我们。使用这种方式,可以建立自己的文档结构。 * 爬虫: 如果不想通过 API 的方式,又有一个站点。那么可以依赖我们的爬虫去抓取。爬虫的本质也是 download 你的网页,抽取信息,通过"索引 API" push 给搜索引擎。 |
8
mornlight 2014-09-22 17:20:03 +08:00 1
@yandy 明白了,大致是用户发表一个新帖子的时候,服务器就主动把帖子标题、内容等都push到你们那边。这样也可以。
|
9
simapple 2014-09-22 17:56:39 +08:00
用现成的不是sphinx或者其他的组件不是更简单,这个产品的优势是更加准确的语义分词? 还是足够庞大的机器学习 分词能力?
|
10
jingwentian 2014-09-22 18:19:26 +08:00 via Android
v2支持markdown了么,原文中的链接怎么发布的
|
11
yandy OP @simapple 这样的,从功能上讲我们专注做搜索,无论是学习数据还是开发精力,我们肯定比自己搭要投入得多的多,这也就意味着我们的服务更有可能比自建搜索引擎来得准确、智能。其次我们提供的是服务型的产品,还有成本和运维上的意义。
|
12
yandy OP @jingwentian 在发布的时候,右下角有个选项,得选择一下 markdown。不过坑爹的是,只有发布的时候可选,之后就没办法支持了。。。(见附言)
|
13
laomo 2014-09-22 19:35:18 +08:00
不错,和 Swiftype 很像
https://swiftype.com/ |
14
wgqzlj 2014-09-23 13:42:45 +08:00
阿里云也有类似的了 http://www.aliyun.com/product/opensearch
|
16
yandy OP 注册码有更新了~ `c5b8f5e67291`
|
17
kwklover 2017-02-10 11:35:18 +08:00
一直有关注,可惜网站已经打不开了,其实做云模式的站内搜索并不容易,数据结构,同步,数据量,搜索量,内外网,有特殊权限架构情况如何解决?
所以我们一直致力于私有化部署的站内搜索产品--搜易站内搜索引擎,就是希望点点鼠标就能够配置好,完全无法写代码,当然也有局限性,比如无法部署到 LINUX 上。 目前也有很多开源的产品,比如 ES , sphinx ,但是这些都需要有一定的安装门槛和开发能力才能搞定。有技术力量的话,当然是首选方案。 |