r1mix: R1 思维链让普通 AI 更聪明

2025 年 3 月 31 日
 faceair

经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:

  1. 指令遵循的能力较差,不能完全按照要求输出
  2. 写作辞藻非常华丽和刻意,写出的文字总能一眼 R1,阅读体验和沉浸感感都比较差

其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。

根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

常见的推荐组合是:

  1. r1v3:新版 DeepSeek-V3 显著增强了代码能力和文学创作能力,在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
  2. r1claude:Claude 系列模型的代码能力是当前的 No. 1 ,在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
  3. r1grok:Grok-3 的文学创作能力是 Top 级别的,在加持 DeepSeek-R1 后故事的剧情会更加合理,表达也更富有层次感。
  4. r1gemini:Gemini 2.0 系列知识面非常广泛、能力也很全面,在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。

https://r1mix.ai

6844 次点击
所在节点    分享创造
19 条回复
maximdx
2025 年 3 月 31 日
有意思,这种多个模型搭配使用的原理是什么?
faceair
2025 年 3 月 31 日
@maximdx #1 先调用思考模型,获取到思维链以后停止请求,把思维链拼到原始请求里请求第二个模型
DigitaIOcean
2025 年 3 月 31 日
有趣,关注
xyfan
2025 年 3 月 31 日
LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
listenfree
2025 年 3 月 31 日
按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
faceair
2025 年 3 月 31 日
@listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
iyaozhen
2025 年 3 月 31 日
我充值试了下,感觉还行。不过也没解决 R1 本身的幻觉问题,就是 R1 强是强,但是不太稳定
ovtfkw
2025 年 3 月 31 日
@faceair #2 就这?岂不是很简单
pakro888
2025 年 3 月 31 日
市场上早已经有人开发出来了:
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)
rqYzyAced2NbD8fw
2025 年 3 月 31 日
@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
SkywalkerJi
2025 年 4 月 1 日
主楼说的模型特点是中文写作吗,还是说外文也一样。
Lee90
2025 年 4 月 1 日
邮箱登录好评
paopjian
2025 年 4 月 1 日
赛博换脑, r1 的思维脑接上 claude 的嘴
Seayon
2025 年 4 月 1 日
Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
anjingdexiaocai
2025 年 4 月 1 日
这就是 deepClaude 吧,很早就有了
hugowangnz
2025 年 4 月 1 日
@LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
LinSP
2025 年 4 月 1 日
这不是变形版蒸馏
flcwk
2025 年 4 月 2 日
@faceair 对的,相当于用思考模型做规划,然后让实践能力强的模型进行操作,之前的 deepclaude 和 deepgemini 都是这个思路,进一步的可以引入多个思考模型进行专家会审,效果更佳
faceair
2025 年 4 月 2 日
@flcwk #18 多思考模型的话算是 agent 的思路了,做 API 的话延迟太大了 token 数跟效果也成正比的话,用户不买账

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1122292

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX