我们做一个新的搜索引擎, 「F Search | F 搜」, 希望能给大家除了百度和搜狗以外不同的选择 - V2EX 首发

2021-11-24 15:39:57 +08:00
 tmacLiu9527

Our Vision

访问: https://fsou.cc

主要功能

中文搜索

英文搜索

In-line 翻译

CDN 加速

在搜索结果中如果有 StackOverflow Question 和 Github Issue 的页面, F 搜会加载到 CDN 加速

StackOverflow CND 加速 (beta) - 考虑到国内用户访问 SO 的速度问题, 我们将原页面缓存到 stackoverflow.nilmap.com 进行加速

Github Issues CDN 加速 (beta) - 考虑到国内用户访问 GH 的速度问题, 我们将原页面缓存到 github.nilmap.com 进行加速

高级搜索

+: 必须包含关键字

-: 必须排除关键字

site: 站内搜索

filetype: 搜索文件

more: 偏好某站

对于部分常用的网站, 比如所知乎, stackoverflow, github 等支持 inferred token, 比如搜索 "cannot read property of site:知乎" = "read property of site:zhihu" = "read property of site:zhihu.com"

代码搜索 (alpha)

这个功能处于 alpha 阶段, 需要在 toggle 实验功能 (右上角的小狗狗图标). 目前能够支持一些简单自然语言的 naive 搜索, 比如说 "java 用 scanner 输入字符串" 会有如下的结果

开发小工具

目前我们提供了几个开发用的小工具, 例如 Gist, Json Formatter, Regex 调试, Markdown 在线笔记. 都是来自于 Github 上面的开源项目, 也是我们团队经常使用的一些工具.

关于隐私

我们的隐私条约 - https://fsou.cc/privacy

我们自己手写的简单的隐私条约 (如果你有相关知识, 觉得我们写的有问题的, 请联系我), 如果有任何改动, 我们会及时通知所有相关的用户.

F 搜目前不使用 Cookie, 但是会使用浏览器的 Local Storage 存储如下信息, 服务端不保存数据:

  1. 语言偏好
  2. 搜索关键字历史
  3. 登录状态

关于 Censoring

对于搜索的关键字不进行检测, 但是对于结果会进行检测和过滤. 我们做个项目的初衷是帮助工程师更高效的工作和获取知识 (我们在创业过程中遇到的最大的痛点). 所以我们想花 90%的时间专注在产品的打造和痛点的解决而不是关键字的过滤, 因此我们的策略会比较的 aggressive, 如果你是正常使用的话, 应该不会有任何问题.

合法合规

因为产品的主要用户群是在国内, 所以我们会遵从中国相关法例做到个人信息保护合规, 虚假广告与虚假宣传风险排查与合规与网络安全与数据保护合规. 如果有任何问题, 请联系我.

如何使用

输入邮箱获取到登录链接, 如果你不想使用个人的邮箱, 请使用临时邮箱. 更多信息可以查看下面的 FAQ. 另外, 我们用的邮件服务是 Mailgun, 可能存在收邮件缓慢的问题, 请耐心等待, 如果长时间没有收到, 请联系我.

已知问题

  1. 部分浏览器适配问题, 例如旧版本 360.
  2. 缺少实时性数据支持, 例如新闻, 热搜等.
  3. LBS - 比如说 location aware 的搜索, 例如本地餐厅, 周边 POI 等 (因为没有收据收集, 目前的实现方式不是很满意, 所以暂时先不提供了)

FAQ

为什么和 Google 这么像?

Google 做了大量的用户研究, 在用户浏览和交互效率上面已经是非常极致了, 我们不想 reinvent the wheel.

数据来源是什么?

  1. Google (30%)
  2. Bing (30%)
  3. On-premise (25%)
  4. Yahoo Boss (10%)
  5. Yandex (5%)
  6. Wolfram Alpha (5%)

我们不从百度和搜狗获取任何列表结果的信息.

为什么需要登录?

Anti-spamming - 目前都会要求登录, 后续 public beta 会解除这个限制.

会开放接口允许第三方服务使用吗?

会. 我们做这个产品的初衷是帮助用户更高效的工作和获取知识, 那赋能大家可以打造自己的产品是理所当然的. 具体的 Roadmap 我们会在接下来的几天公布, 如果有特殊的 inquiry, 可以联系我们 (联系方式在下面).

F 搜怎么商业化?

  1. 同意数据收集的用户 - 我们的产品重心会放在知识获取和管理的效率, 商业化相关的工具和功能.
  2. 不同意数据收集的用户 - 广告, 但是会控制到 2-3 个首页列表的占比.

我有一些想法和意见, 怎么联系 F 搜?

WeChat: Y29ubm9yd2FuZzMyNQ==

Email: Y3dhbmdAaGV0YW9hcHBzLmNvbQ==

访问: https://fsou.cc

50848 次点击
所在节点    分享创造
400 条回复
tmacLiu9527
2021-11-24 16:46:42 +08:00
@kun775 👍 👍 👍 保证不修复
qq316107934
2021-11-24 16:46:52 +08:00
兄弟,你这个产品安全性有待进一步加强啊,可以遍历注册邮箱和 token 甚至注入。
你们的第一个邮箱是不是 w**n@hetaoapps.com
token 是 77388*****824

尽快修复安全问题吧
tmacLiu9527
2021-11-24 16:53:18 +08:00
回复一下大家对于登录的疑问和不满

我们的目的不是想强制用户登录, 因为我们不做数据采集, 很多交互上的迭代和问题的发现会有很多困难. 早期我们想和真正有产品需求和明显痛点的用户可以深度交流和帮助一起迭代产品. 输入邮箱只是一个识别强需求用户的一个方法, 上面 V2er 提到的避免登录的操作, 其实已经达到我们目的了.
tmacLiu9527
2021-11-24 16:54:08 +08:00
@qq316107934
对 这个我们上线前意识到了, 所以建议大家用临时邮箱. 在"如何使用"中提到:

输入邮箱获取到登录链接, 如果你不想使用个人的邮箱, 请使用临时邮箱.
qq316107934
2021-11-24 17:00:41 +08:00
@tmacLiu9527 可以改成输入邮箱的用户可以使用进阶功能或者具有反馈渠道,不登录一刀切连主功能都不让用从设计角度讲就是不合理的。
tmacLiu9527
2021-11-24 17:08:20 +08:00
@qq316107934
目前是计划在周五时候 public beta, 所以这三天想测试一下系统稳定性和一些内容过滤 (合法合规) 的准确度. 现在服务跑在很小的 AWS 实例上 Caching (T2.Micro) + Server (R4.Large), 等 rate limit 和一些安全问题 patch 完了就可以 public beta 了. 大家如果不想使用邮箱, 可以到周五再试下...
yesicoo
2021-11-24 17:10:01 +08:00
希望添加个本地保存的自动搜索后缀 比如自动添加 -csdn 就不用每次都输入了。
likeunix
2021-11-24 17:10:29 +08:00
为大佬点赞,还望不要强制登录,现在干个啥都要我先登录,尤其我着急用的时候,影响心情
Buges
2021-11-24 17:12:27 +08:00
方向不对,局域网的搜索引擎主要有两点需求:一是在无互联网连接的设备上临时搜一些东西,最基本的要求只要能搜到官网就行,一般用 bing 。二是搜索各大不向搜索引擎开放的区域的内容,因为中文互联网中向搜索引擎开放的内容已经几乎没有了,一般用搜狗或站内搜索。
百度已经彻底拉跨,各种场景都无法提供价值。

对“工程师”来说互联网连接是不可缺少的需求,过滤互联网的信息要么一刀切要么无法合规,并且大部分结果在无互联网连接的情况下无法或几乎无法访问,你能“加速”多少网站?
搞一个 Google 的替代品除了降低“工程师”对 firewall 的 plausible deniability 以外没有任何意义。
adminharlem
2021-11-24 17:12:35 +08:00
太棒了,搜索还要登陆
tmacLiu9527
2021-11-24 17:21:07 +08:00
@yesicoo 好的 这个可以 👍
tmacLiu9527
2021-11-24 17:25:04 +08:00
@Buges 这是我们正在 explore 的一个 option, 比较抽象的说是 search decentralization. 像你所说的更多是垂直搜索和一些深度 / 独家内容搜索的场景, maybe 一个解决方案是有一个很轻的植入方案替代 es 或者 site search. 但是这个阶段我们想从已有的简单痛点切入.
tmacLiu9527
2021-11-24 17:25:44 +08:00
@adminharlem 周五会 public beta, 这两天想测试一下的得填下邮箱了..
ceno
2021-11-24 18:05:50 +08:00
等不需要登陆的时候叫我一下吧
xieqiqiang00
2021-11-24 18:14:07 +08:00
怎么绕过谷歌的验证码的?
night98
2021-11-24 18:16:44 +08:00
要是能加一个服务端过滤就好了,平常搜东西实在是受不了 csdn 这鬼东西
tmacLiu9527
2021-11-24 18:21:12 +08:00
@night98 上面有个 v2er @yesicoo 提到 浏览器可以保存常用操作符. 这周会上个 patch, 本地会保存一些简单的喜好设置. 周五前 ship!
tmacLiu9527
2021-11-24 18:23:33 +08:00
@adminharlem @likeunix @czfy @leeggco @nekoneko @kylinC
稍后就可以取消登录, 如果使用时收到 429 error, 那是被 rate limit, 等几秒重试就行.
tmacLiu9527
2021-11-24 18:27:56 +08:00
@xieqiqiang00 实时 Google 的数据我们尝试过, 基本不可行 (但不是完全不可行)

需要解决

1. reCaptcha
2. latency
3. filtering

加起来 P99 要 6000ms+, P50 3000ms+, 体验上是不能接受的. 所以放弃了类似的实现方式.
JeffGe
2021-11-24 18:47:18 +08:00
支持

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/817678

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX