• 请不要在回答技术问题时复制粘贴 AI 生成的内容
bingoAI
0.01D
V2EX  ›  程序员

AI coding 时代, test case 测试用例的价值如何评估?

  •  
  •   bingoAI · 5 days ago · 644 views
    = 1475 passed, 3 skipped, 90 warnings in 47.90s =
    qdd48
        1
    qdd48  
       5 days ago
    看各种评测数据集,基本都需要测试用例,测试用例价值挺大的,感觉训练验证属于必不可少的内容
    xsonglive491
        2
    xsonglive491  
       1 day ago
    测试用例和 benchmark 价值大增
    bingoAI
        3
    bingoAI  
    OP
       1 day ago
    你们说的是针对 model 的评测 eval 基准用例?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3868 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 00:50 · PVG 08:50 · LAX 17:50 · JFK 20:50
    ♥ Do have faith in what you're doing.