baidu 的 comate 有个牛逼的功能:通读整个代码库

170 天前
 SuperDaFu

我在阿里一类的别的公司都没有看见这样的功能。 生成架构图等宣传的功能,这种功能怎么实现了。 我的猜想是

  1. 代码 embedding 到本地文件,直接本地文件相似搜索。 但是这只能解决基于当前代码的点对点的问题,大局观上会丢失,本质还是根据核心去匹配的。 那么整体架构这种功能,是如何实现的。
1558 次点击
所在节点    OpenAI
4 条回复
Theigrams
167 天前
GitHub Copilot 也能读取整个工作区的代码,devv.ai 的 GitHub 模式也能读取整个 GitHub 仓库的代码,

Copilot 是直接基于文本相似度检测,devv 是对 embedding 计算相似度
3oq5kOT3OxK28MA9
164 天前
目前这种都是加了向量


ps:ChatGPT 合租平台,隐私隔离: https://plusai.zhangsan.link
maymay5
162 天前
有一个做法不知是否可行,不考虑整库读取了,只考虑工作区,以及工作区打开的旁系 tab ,对每个函数进行单独切片,用 AI 对函数进行解释,并总结出可能在什么场景使用,把解释进行向量嵌入,函数体作为 data ,这样通过注释就可以检索到可能使用到的函数,把检索结果 data 放入上下文,是否就可以解决非点对点的情况,虽然这会受到工作区不规范的影响
SuperDaFu
160 天前
@maymay5 我最近也是差不多这个方案做的。但是我直接解析了整个项目的调用关系。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1048175

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX