sunnysab

V2EX member #390638, joined on 2019-03-08 22:14:17 +08:00

sunnysab 提问技术话题好玩工作信息交易信息城市相关

Per sunnysab's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

sunnysab's recent replies

Mar 29

Replied to a topic by swaylq › 分享创造 › 我们用命理大赛真题做了个 AI benchmark，结果挺意外的

您好！用目前最强的 Gemini3.1Pro 和 GPT-5.4 测试了一下，仓库见 https://github.com/sunnysab/BaziQA

结果如下：
OpenAI GPT-5.4 Multi-turn 30.83%
OpenAI GPT-5.4 Structured 31.33%
Gemini-3.1-Pro-Preview Multi-turn 38.33%
Gemini-3.1-Pro-Preview Structured 33.33%

本以为新模型会好一些，但似乎 GPT5.4 并没有什么提升，而 Gemini3.1Pro 多轮测试的效果是更好的。API 使用的是 OpenRouter 官方 API 。有可能是排盘的差异（我不知道我用的库准不准，来源： https://github.com/china-testing/bazi ）

很有意思的、针对 LLM 的测试角度。从我个人经验看，在使用 AI 做推理前，可以让它回答自己过去的事，这也是测试准确性的方法。

Mar 24

Replied to a topic by idoubi › 分享创造 › 开源 WeClaw，让微信 ClawBot 接入任意 Agent

@Mzs 成功了，感谢！

Mar 23

Replied to a topic by sweeyeah › 分享创造 › 给 AI 写一个微信公众号文章反爬的 skill 到底有没有意义？

我之前缓存过一些微信公众号文章，用 cloudflare workers 做的，效果还不错，没有遇到反爬。
最近用自己的真实 ip 跑，几十几百篇都没啥问题？

---
当前是自用，抓取一百多个公众号。如果开放，可能遇到的问题会比较多。

Mar 12

Replied to a topic by Zaptain › Claude Code › 为了让 Claude Code 不再重复踩坑，我给它补了一层经验系统

似乎有点像 AI 去写博客？

Feb 8

Replied to a topic by yusf › 分享创造 › 安利下我自己从 0 到 1 100% 由 codex 编写的一个 CladueCode（有 b 站演示视频）

有没有人考虑做 claude code 、codex 这种软件的网页版哇？