codingmiao 最近的时间轴更新
codingmiao

codingmiao

V2EX 第 582929 号会员,加入于 2022-05-27 09:19:04 +08:00
codingmiao 最近回复了
这个中转似乎非流式请求有点问题,下面这个请求,"stream"为 false 时就没有输出"content",为 true 时是正常的

curl "https://www.hi-code.cc/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model":"gpt-5.4",
"stream": false,
"messages":[
{"role":"user","content":"你好"}
]
}'


{"id":"resp_0f935c87f6d1df2d0169e7013c67c08196abb8a696e0191e21","object":"chat.completion","created":1776746813,"model":"gpt-5.3","choices":[{"index":0,"message":{"role":"assistant"},"finish_reason":"stop"}],"usage":{"prompt_tokens":18,"completion_tokens":41,"total_tokens":59}}
1 天前
回复了 seraphlz 创建的主题 OpenAI deep research 生成的研究报告效果如何?
生成出来乍一看效果挺唬人,仔细看很多经不起推敲,我现在是让 claude code 自己去 arxiv 和 github 上搜了总结了,比直接 deep research 可控一点
@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的,没写代码😄,配下参数一行命令就跑起来了😄。
3 月 24 日
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
这个似乎是 qwen3.5 系列太喜欢过度思考了,我这几天搞了点 deepseek-r1 的数据去微调它,让它学习 ds 的思考套路,效果好了不少 https://github.com/codingmiao/qwen35-short-cot
3 月 18 日
回复了 Ayanokouji 创建的主题 Java JDK 26 发布,非 lts 版本
向量 API 还是没孵化出来,用这玩意写了个 RAG 的玩具,速度确实可以
~/.claude.json 这个下面写了 zp mcp 了吧
1 月 26 日
回复了 xiaofire 创建的主题 职场话题 有没有面试专用的 AI?
不是现在作弊还能说的这么理直气壮?我面试都问项目经验了,还是有些脑瘫在那念 AI 人机回复,纯纯浪费时间
搭车求一个数据库分析类的 skill ,读取数据库表结构和样例数据,分析某个数据应该去哪张表拿那种
1 月 7 日
回复了 zhangsimon 创建的主题 程序员 有不受任何道德约束的混乱中立 AI 吗?
@CrowCarlos 搜了一下 abliterated 我擦好多模型,这玩意怎么做出来的,拿着善良模型用邪恶样本去微调?
2025 年 11 月 28 日
回复了 fuxintong 创建的主题 程序员 Java 开发中 怎么使用 AI?都用什么模型
模型的话开发去白嫖硅基流动的免费模型,部署就用公司内部的模型。
框架方面比起 springai 我更喜欢 langchain4j ,agent 的构建比 springai 更像 spring ,而且文档那种直接把 demo 糊脸上的感觉比 springai 含糊不清的描述舒服多了。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5633 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 06:56 · PVG 14:56 · LAX 23:56 · JFK 02:56
♥ Do have faith in what you're doing.