ruimz

ruimz

V2EX 第 204374 号会员,加入于 2016-12-04 23:48:39 +08:00
今日活跃度排名 6076
根据 ruimz 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
ruimz 最近回复了
44 分钟前
回复了 lurui45 创建的主题 Android 安卓机升级系统竟然会自动更新所有 App
感觉不如 iPhone ,iOS 甚至同版本备份恢复系统数据也会自动更新 app
/t/992973
把汽油里附加的养路费取消,所有汽车统一改成按里程收
21 天前
回复了 Iannis 创建的主题 Apple 是不是 apple ai 实际上就一小撮人关注
对,实际上 yt 上不少英文评测也没测出什么有用的功能出来
用旧手机里的二步验证删除现有的验证,然后再重新添加新的二步验证到新手机
恭喜 OP 发现了现在软件工程领域对 LLM 研究的三大前沿:
1. ”我给它上传了一个公共库代码和调用它的完整代码“,这对应着 ”仓库级代码自动修复“ ( Repository-Level Automatic Program Repair)
如今年的 Y. Chen et al., "When Large Language Models Confront Repository-Level Automatic Program Repair: How Well They Done?," in 2024 IEEE/ACM 46th International Conference on Software Engineering: Companion Proceedings (ICSE-Companion), Lisbon, Portugal, 2024, pp. 459-471, doi: 10.1145/3639478.3647633.

2. ”必须把公用库代码清理干净“,这表明 OP 发现了代码注释对 LLM 理解的重大影响甚至误导的现象,在 2024 年发表的多篇论文中亦有研究记载,如今年的 H. Yu et al., "CoderEval: A Benchmark of Pragmatic Code Generation with Generative Pretrained Models," in 2024 IEEE/ACM 46th International Conference on Software Engineering (ICSE), Lisbon, Portugal, 2024, pp. 428-439, doi: 10.1145/3597503.3623322.

3. “或者是完整写明哪些函数有用他才会看”,这表明 OP 发现了思考链( chain-of-thought )以及专业知识对 LLM 理解能力的提升的现象

此外,SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering 或许可以对”它疯狂优化根本没用上的函数“ 的现象有所缓解
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5826 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 01:45 · PVG 09:45 · LAX 17:45 · JFK 20:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.