如果想在 V2EX 获得更好的推广效果，欢迎了解 PRO 会员机制：
https://www.v2ex.com/pro/about

如果你经常使用铜币置顶主题，持有 V2EX Solana Token 会在每日签到时获得额外铜币：
https://www.v2ex.com/solana

https://github.com/hitmux/hitmux-context-engine

ACE 虽好，但 HCE 更好！开源且可自己部署！

1.先说优点：

几乎不要钱。推荐使用的 Qwen3 Embedding 4B 仅仅 0.02 刀/MTokens 输入
开源，完全自己部署。后端数据库也可以自建，也可以用免费的。甚至连向量模型，如果有好显卡也可以部署。即便没有，官方 api 成本也几乎为 0
准确度高。真实测试见附录

2. 准备条件

向量数据库：Milvus

如果机器大于 4G 内存，可以考虑自己安装 Milvus 数据库开源下载 Windows 可以用 Docker 安装

如果条件不够的，当然有免费的远程数据库，看上去是用的 AWS 的机器，有免费 5GB 空间：Zilliz Cloud

向量嵌入模型

这里推荐 Qwen3 Embedding 4B 硅基流动，国际站有一刀试用，完全够了

关于 Qwen3 Embedding 4B：

不推荐用 8B 的版本，因为据我测试 OpenRouter 上面的 8B 版本速度慢了 5 倍

如果想试用的话，直接注册硅基流动，我看国际站有 1 刀试用 Qwen3 Embedding 4B 官方定价输入 0.02$/M ，输出免费

这大概是什么概念呢？假设你有 100 万行的巨型代码库，大概 1000 万 Tokens 首次建立索引要全量输入，花费 0.2 刀然后在开发期间查询了 1000 次，每次需要将查询的话转化成向量，一次 20Tokens ，共 20000/1000000*0.02=0.0004 刀开发期间共改了 50%的代码。这些代码需要增量索引，花费 0.1 刀

0.1+0.2+0.0004=0.3004 ，差不多 2 块钱一个硅基流动的试用一刀额度够完成三个这样 100w 行项目的开发

安装并配置 HCE

npm i -g @hitmux/hce 然后创建~/.hitmux-context-engine/config.conf并写入

embeddingProvider = OpenAI
openaiBaseUrl = https://example.com #不要带 /v1
embeddingModel = qwen/qwen3-embedding-4b
openrouterApiKey = sk-or-your-openrouter-api-key
milvusAddress = localhost:19530

如果用的是 Zilliz Cloud ，就把milvusAddress换成

# milvusAddress = your-zilliz-cloud-public-endpoint # 配置了下面的 Token ，此项可以省略，能自动推断
milvusToken = your-zilliz-cloud-personal-key

配置 MCP：

{
  "mcpServers": {
    "hitmux-context-engine": {
      "command": "hce"
    }
  }
}

[mcp_servers.hitmux-context-engine]
command = "hce"

好了，完成了

cd 到你的项目，确保.gitignore 等文件正确然后hce index即可。用 OpenRouter 的 qwen3-embedding-4b 速度大概在 5w 行代码要 2 分钟但查询一次仅仅 3-5s ，和代码库大小关系不大

附录

效果

https://github.com/hitmux/hitmux-context-engine/blob/main/README.zh-CN.md 页面最下方的图片

原理

见代码......

No Comments Yet

开源部署嵌入

Hitmux-Context-Engine——开源替代 ACE