chengrui0428
V2EX  ›  Claude

我做了一个工具,给 Claude Code 会话打分——找出 AI 协作里的得分点

  •  
  •   chengrui0428 · 1 day ago · 271 views

    用 Claude Code 久了,有个问题一直困扰我:不知道自己的使用方式好不好。每次 session 结束,感觉有收获,但说不清楚哪里低效、哪里做对了。

    于是写了这个工具:session-score-plugin


    它做什么

    Claude Code 每次 session 结束后,自动读取会话记录,输出一个 1–100 的分数,分解成 7 个维度:

    维度 满分 衡量什么
    🔒 Security 15 危险命令、凭证泄露、risky pattern
    ⚡ Effectivity 15 目标完成度、纠错轮次、人工干预次数
    🏗 Solidity 10 测试覆盖、commit 规范、PR 流程
    💡 Efficiency 15 token 消耗、重复读文件、冗余步骤
    🗺 Planning Quality 15 先问清楚再动手、用了 plan mode 吗
    🔄 Recovery Ability 15 遇到报错能恢复吗、还是一直重复同一个错
    🎯 Hallucination Rate 15 有没有引用不存在的文件/函数

    安装

    brew tap Laotree/tap
    brew install session-score-plugin
    session-score-plugin install   # 注册 Stop hook ,之后每次 session 结束自动打分
    

    我自己用下来的感受

    最让我意外的是:数字化之后,坏习惯变得非常清晰。我 Planning Quality 一直偏低——经常一上来就开始写代码,没有先把需求问清楚。Efficiency 也差,反复 Read 同一个文件。

    以前这些都是模糊的感觉,有了分数之后就变成了可以改的具体问题。


    开源: https://github.com/Laotree/session-score-plugin Rust 写的,MIT 协议。

    欢迎用过 Claude Code 的朋友试试,也欢迎提意见——特别是评分维度的权重合不合理,以及有没有遗漏的重要维度。

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2757 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 15:34 · PVG 23:34 · LAX 08:34 · JFK 11:34
    ♥ Do have faith in what you're doing.