V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
SuperDaFu
V2EX  ›  OpenAI

baidu 的 comate 有个牛逼的功能:通读整个代码库

  •  
  •   SuperDaFu · 16 天前 · 1003 次点击

    我在阿里一类的别的公司都没有看见这样的功能。 生成架构图等宣传的功能,这种功能怎么实现了。 我的猜想是

    1. 代码 embedding 到本地文件,直接本地文件相似搜索。 但是这只能解决基于当前代码的点对点的问题,大局观上会丢失,本质还是根据核心去匹配的。 那么整体架构这种功能,是如何实现的。
    4 条回复    2024-06-20 10:04:03 +08:00
    Theigrams
        1
    Theigrams  
       12 天前
    GitHub Copilot 也能读取整个工作区的代码,devv.ai 的 GitHub 模式也能读取整个 GitHub 仓库的代码,

    Copilot 是直接基于文本相似度检测,devv 是对 embedding 计算相似度
    3oq5kOT3OxK28MA9
        2
    3oq5kOT3OxK28MA9  
       10 天前
    目前这种都是加了向量


    ps:ChatGPT 合租平台,隐私隔离: https://plusai.zhangsan.link
    maymay5
        3
    maymay5  
       8 天前
    有一个做法不知是否可行,不考虑整库读取了,只考虑工作区,以及工作区打开的旁系 tab ,对每个函数进行单独切片,用 AI 对函数进行解释,并总结出可能在什么场景使用,把解释进行向量嵌入,函数体作为 data ,这样通过注释就可以检索到可能使用到的函数,把检索结果 data 放入上下文,是否就可以解决非点对点的情况,虽然这会受到工作区不规范的影响
    SuperDaFu
        4
    SuperDaFu  
    OP
       5 天前
    @maymay5 我最近也是差不多这个方案做的。但是我直接解析了整个项目的调用关系。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1099 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 22:39 · PVG 06:39 · LAX 15:39 · JFK 18:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.