https://github.com/hitmux/hitmux-context-engine
ACE 虽好,但 HCE 更好!开源且可自己部署!
1.先说优点:
- 几乎不要钱。推荐使用的 Qwen3 Embedding 4B 仅仅 0.02 刀/MTokens 输入
- 开源,完全自己部署。后端数据库也可以自建,也可以用免费的。甚至连向量模型,如果有好显卡也可以部署。即便没有,官方 api 成本也几乎为 0
- 准确度高。真实测试见附录
2. 准备条件
向量数据库:Milvus
如果机器大于 4G 内存,可以考虑自己安装 Milvus 数据库开源下载 Windows 可以用 Docker 安装
如果条件不够的,当然有免费的远程数据库,看上去是用的 AWS 的机器,有免费 5GB 空间:Zilliz Cloud
向量嵌入模型
这里推荐 Qwen3 Embedding 4B 硅基流动,国际站有一刀试用,完全够了
关于 Qwen3 Embedding 4B:
不推荐用 8B 的版本,因为据我测试 OpenRouter 上面的 8B 版本速度慢了 5 倍
如果想试用的话,直接注册硅基流动,我看国际站有 1 刀试用 Qwen3 Embedding 4B 官方定价输入 0.02$/M ,输出免费
这大概是什么概念呢?假设你有 100 万行的巨型代码库,大概 1000 万 Tokens 首次建立索引要全量输入,花费 0.2 刀 然后在开发期间查询了 1000 次,每次需要将查询的话转化成向量,一次 20Tokens ,共 20000/1000000*0.02=0.0004 刀 开发期间共改了 50%的代码。这些代码需要增量索引,花费 0.1 刀
0.1+0.2+0.0004=0.3004 ,差不多 2 块钱 一个硅基流动的试用一刀额度够完成三个这样 100w 行项目的开发
安装并配置 HCE
npm i -g @hitmux/hce
然后创建~/.hitmux-context-engine/config.conf并写入
embeddingProvider = OpenAI
openaiBaseUrl = https://example.com #不要带 /v1
embeddingModel = qwen/qwen3-embedding-4b
openrouterApiKey = sk-or-your-openrouter-api-key
milvusAddress = localhost:19530
如果用的是 Zilliz Cloud ,就把milvusAddress换成
# milvusAddress = your-zilliz-cloud-public-endpoint # 配置了下面的 Token ,此项可以省略,能自动推断
milvusToken = your-zilliz-cloud-personal-key
配置 MCP:
{
"mcpServers": {
"hitmux-context-engine": {
"command": "hce"
}
}
}
OR
[mcp_servers.hitmux-context-engine]
command = "hce"
好了,完成了
cd 到你的项目,确保.gitignore 等文件正确
然后hce index即可。
用 OpenRouter 的 qwen3-embedding-4b 速度大概在 5w 行代码要 2 分钟
但查询一次仅仅 3-5s ,和代码库大小关系不大
附录
效果
https://github.com/hitmux/hitmux-context-engine/blob/main/README.zh-CN.md 页面最下方的图片
原理
见代码......