r1mix: R1 思维链让普通 AI 更聪明

2025 年 3 月 31 日

faceair

经常体验不同大模型的朋友都知道，deepseek r1 的思维链质量非常高，脑子非常聪明并且情商高，但在实际使用的时候：

指令遵循的能力较差，不能完全按照要求输出
写作辞藻非常华丽和刻意，写出的文字总能一眼 R1，阅读体验和沉浸感感都比较差

其他的普通模型，在指令遵循和写作文风上都有更优异的表现，但是脑子又弱一点。

根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力就可以达到 SOTA 级别的效果，而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

最近我们做了一个 r1mix 的模型混合的网站，可以让你用 deepseek-r1 去加持任意的模型，不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

常见的推荐组合是：

r1v3：新版 DeepSeek-V3 显著增强了代码能力和文学创作能力，在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
r1claude：Claude 系列模型的代码能力是当前的 No. 1 ，在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
r1grok：Grok-3 的文学创作能力是 Top 级别的，在加持 DeepSeek-R1 后故事的剧情会更加合理，表达也更富有层次感。
r1gemini：Gemini 2.0 系列知识面非常广泛、能力也很全面，在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

常见的模型都有，可以根据需求自己任意组合。也可以绑定你的 openrouter 账号，使用 openrouter 上的免费模型的时候我们不收费。

https://r1mix.ai

6844 次点击

所在节点

19 条回复

maximdx

2025 年 3 月 31 日

有意思，这种多个模型搭配使用的原理是什么？

faceair

2025 年 3 月 31 日

@maximdx #1 先调用思考模型，获取到思维链以后停止请求，把思维链拼到原始请求里请求第二个模型

DigitaIOcean

2025 年 3 月 31 日

有趣，关注

xyfan

2025 年 3 月 31 日

LLM 的客户端 chatwise 好像也增加了类似的功能，调用一个模型的 thinking ，并应用于另一个模型

listenfree

2025 年 3 月 31 日

按你这样说，qwq32B+qwen2.5code 也是 SOTA 级别哟，就是不知道如何流程化试用

faceair

2025 年 3 月 31 日

@listenfree #5 我们暂时没有 qwen2.5 code 模型的供应，你可以绑定你的 openrouter 账号，然后两个模型名用加号连接就可以调用了

iyaozhen

2025 年 3 月 31 日

我充值试了下，感觉还行。不过也没解决 R1 本身的幻觉问题，就是 R1 强是强，但是不太稳定

ovtfkw

2025 年 3 月 31 日

@faceair #2 就这？岂不是很简单

pakro888

2025 年 3 月 31 日

市场上早已经有人开发出来了：
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)

rqYzyAced2NbD8fw

2025 年 3 月 31 日

@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做，莫名其妙的垃圾功能做一堆，还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发

SkywalkerJi

2025 年 4 月 1 日

主楼说的模型特点是中文写作吗，还是说外文也一样。

Lee90

2025 年 4 月 1 日

邮箱登录好评

paopjian

2025 年 4 月 1 日

赛博换脑, r1 的思维脑接上 claude 的嘴

Seayon

2025 年 4 月 1 日

Cline 在写代码的时候也是先 PLAN 后 ACT ，我现在都用 deepseek-r1 去思考计划，然后切换到 claude 再去 ACT

anjingdexiaocai

2025 年 4 月 1 日

这就是 deepClaude 吧，很早就有了

hugowangnz

2025 年 4 月 1 日

@LanhuaMa 太对了，这么流行的功能不做，目前只能自己写函数支持思维链显示了

LinSP

2025 年 4 月 1 日

这不是变形版蒸馏

flcwk

2025 年 4 月 2 日

@faceair 对的，相当于用思考模型做规划，然后让实践能力强的模型进行操作，之前的 deepclaude 和 deepgemini 都是这个思路，进一步的可以引入多个思考模型进行专家会审，效果更佳

faceair

2025 年 4 月 2 日

@flcwk #18 多思考模型的话算是 agent 的思路了，做 API 的话延迟太大了 token 数跟效果也成正比的话，用户不买账

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1122292

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX