codingmiao 最近的时间轴更新
codingmiao

codingmiao

V2EX 第 582929 号会员,加入于 2022-05-27 09:19:04 +08:00
今日活跃度排名 25108
codingmiao 最近回复了
@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的,没写代码😄,配下参数一行命令就跑起来了😄。
3 月 24 日
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
这个似乎是 qwen3.5 系列太喜欢过度思考了,我这几天搞了点 deepseek-r1 的数据去微调它,让它学习 ds 的思考套路,效果好了不少 https://github.com/codingmiao/qwen35-short-cot
3 月 18 日
回复了 Ayanokouji 创建的主题 Java JDK 26 发布,非 lts 版本
向量 API 还是没孵化出来,用这玩意写了个 RAG 的玩具,速度确实可以
~/.claude.json 这个下面写了 zp mcp 了吧
1 月 26 日
回复了 xiaofire 创建的主题 职场话题 有没有面试专用的 AI?
不是现在作弊还能说的这么理直气壮?我面试都问项目经验了,还是有些脑瘫在那念 AI 人机回复,纯纯浪费时间
搭车求一个数据库分析类的 skill ,读取数据库表结构和样例数据,分析某个数据应该去哪张表拿那种
1 月 7 日
回复了 zhangsimon 创建的主题 程序员 有不受任何道德约束的混乱中立 AI 吗?
@CrowCarlos 搜了一下 abliterated 我擦好多模型,这玩意怎么做出来的,拿着善良模型用邪恶样本去微调?
2025 年 11 月 28 日
回复了 fuxintong 创建的主题 程序员 Java 开发中 怎么使用 AI?都用什么模型
模型的话开发去白嫖硅基流动的免费模型,部署就用公司内部的模型。
框架方面比起 springai 我更喜欢 langchain4j ,agent 的构建比 springai 更像 spring ,而且文档那种直接把 demo 糊脸上的感觉比 springai 含糊不清的描述舒服多了。
2025 年 9 月 23 日
回复了 Ayanokouji 创建的主题 Java JDK 25 发布了, LTS 版本
向量相关的 API 哪个版本孵化出来呀。
win10 带了这么个玩意,CPU 跑的
Windows.Media.Ocr.Cli.exe
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   925 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 20:25 · PVG 04:25 · LAX 13:25 · JFK 16:25
♥ Do have faith in what you're doing.