backdata.net 一个新的搜索引擎

2023-06-19 09:16:47 +08:00
 netqyq

Backdata 是一个注重用户体验和性能的搜索引擎。

您可以在这里浏览和查找官方网站,各行业各领域的信息,包括 IT 技术,医疗问答,法律问答,会计,国学,历史文化等。 目前经常会缺乏一些具体的信息,比如人名,公司名,书籍,电影等,但是整体上各行业的数据是在不断地增加中。 如果您只想随便看看有哪些流行的网站,可以访问 CoolTool.top 这个导航网站。

目前由于后台服务能力有限,很多网站只是索引了首页的部分信息,站内信息并没有索引。目前优先索引官网和首页。

您也可以提交网址

1827 次点击
所在节点    分享创造
14 条回复
wuwuta170
2023-06-19 09:57:06 +08:00
搜索引擎什么技术实现的
googlefans
2023-06-19 11:49:57 +08:00
打不开
eleganceoo
2023-06-19 13:53:58 +08:00
cooltools.top 少加了个 s
wentx
2023-06-19 17:49:09 +08:00
@wuwuta170 分好几个步骤
爬虫技术:搜索引擎需要通过网络爬虫技术来收集互联网上的网页内容。爬虫技术可以通过自动化程序访问网站,并将网页内容抓取下来。

索引技术:收集到的网页内容需要进行索引建立,以便后续的搜索请求能够快速高效地检索到相关的内容。索引技术可以通过将网页内容进行分词、归类等方式来实现。

检索技术:搜索引擎需要通过检索技术来处理用户的搜索请求,并返回相关的搜索结果。检索技术可以通过倒排索引、向量空间模型等方式来实现。

排名技术:搜索引擎需要通过排名技术来对检索到的结果进行排序,以便最相关的结果能够排在前面。排名技术可以通过 PageRank 、TF-IDF 等算法来实现。

自然语言处理技术:搜索引擎需要通过自然语言处理技术来理解用户的搜索意图,并进行相关的搜索结果推荐。自然语言处理技术可以通过词义分析、语法分析等方式来实现。

机器学习技术:搜索引擎可以通过机器学习技术来进行搜索结果的个性化推荐,以提高用户的搜索体验。机器学习技术可以通过分类、聚类、回归等算法来实现。
netqyq
2023-06-20 22:05:06 +08:00
@wentx 棒!学习了!
wangpeng138375
2023-06-21 09:48:08 +08:00
下载做搜索引擎的初衷和目的是什么,难道是做大模型爬的数据,顺便攒了搜索引擎?
bigtang
2023-06-21 11:33:59 +08:00
同行,我也做了一个搜索引擎 tanglib.com 在想怎么做出差异化来
netqyq
2023-06-21 15:50:52 +08:00
@googlefans 可以的吧,为什么?
netqyq
2023-06-21 15:51:05 +08:00
@eleganceoo 多谢提醒,好像改不了了
netqyq
2023-06-21 15:53:43 +08:00
@bigtang 我试了一下你的,挺好用的,我觉得有用,搜代码很方便。顺便收录了: https://cooltools.top/developers.html
netqyq
2023-06-21 15:58:50 +08:00
@wangpeng138375 各方面都有吧,可能是感兴趣,也可能是单纯就想做搜索
RatioPattern
2023-06-22 17:04:37 +08:00
@wuwuta170 之前有个 ES 的很快,楼主这个不太像
netqyq
2023-06-24 19:18:26 +08:00
@RatioPattern 最近确实有点儿慢了,还没解决。
netqyq
2023-08-17 21:34:04 +08:00
@bigtang 你这个功能挺专业的,本身就有差异

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949832

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX