想要一个 ai 写作助手, (例如半导体, 新能源等等最新技术分析文章), 应该直接自己训练, 还是有现成的平台提供这样的服务.

目标

一个写作助手, 需要在一个方向写出专业分析文章
专业分析新技术, 而不是写出新技术, (写新技术, 新应用的优缺点/应用点/所需条件等)

需求:

数据库要新, (GPT-4, 最新是 2023 年 4 月, 这样不符合要求, 要足够新, 例如近期的文章都需要加入)
限定行业或者方向, 缩小范围 (例如半导体, 新能源等等最新技术分析文章, 期望小而精, 例如锂电池一个库, 氢能源一个库, 都可以分开, 或者应该合并更好)

方案选择(问题)

现成的服务平台提供类似的,(目前没看到), 我们自己提供最新文章, 然后生成一些想要的文章
自己训练, 如果自己训练是不是可以考虑直接京东买一块 4090D + 合适的模型 (零基础, 平时写 Go+Python, 后端, 立刻开始试试. 虽然看到 2080ti 22g 性价比, 但是想省时省事一些,还有售后)
如果自己训练, 数据集是不是分割越小越好.例如氢能源单独一个.

模型选择

Chinese-Mixtral-8x7B (今天 twitter 看到 https://github.com/HIT-SCIR/Chinese-Mixtral-8x7B )
34B-Chat (V2ex 看到, @ShadowPower 推荐的 https://www.v2ex.com/t/1004201#reply43 )
RWKV-Runner ( 也是 @ShadowPower 推荐, https://github.com/josStorer/RWKV-Runner )

显卡

看到有货, 可以买了, 目前能自营买到最好的显卡了吧. 特供版本

七彩虹（ Colorful ） iGame GeForce RTX 4090 D Advanced GDDR6X 24G 大显存游戏电竞电脑显卡￥ 13999.00

https://item.jd.com/100081721839.html

谢谢

perfectar

2024-01-19 09:11:31 +08:00

我的理解哈，不一定对。
1. 如果是想快速对某个垂直领域（半导体-新能源等）的数据做理解、分析、总结，可以基于 ChatGPT+RAG 知识库的方式去做，可以参考 langchain 和 LlamaIndex 等框架。优点是：成本比较低，技术路线较成熟，见效快；缺点是：对生成内容的格式、风格等依赖于模型本身的能力，可能无法满足你的特定需求；
2. 如果你的垂直领域数据量足够，且能够转成指令数据集（可人工标注，或者 Self-Instruct ），也可以试试进行指令微调 SFT ，利用 LoRA 或者 QLoRA 等方式，对显存要求不太高。这种方式的优点是可以直接将知识灌入模型本身，直接对齐垂直领域使用需求，缺点是数据若更新较频繁模型的微调成本也会较高。
供参考。

laipidov

2024-01-19 10:07:01 +08:00

RAG 是靠谱的选择，目前看自己训练没法得到理想的效果，模型选型需要好一点，可以试试 qwen 和 baichuan

prompt 和解码参数也非常重要，对模型的输出结果影响很大

就是不知道 op 的写作中，是不是需要特别强的逻辑推理能力，还是说一般的写作逻辑能力就足以应对。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009866