关于 supadoc.ai 的 AI 文档生成的最新思考

338 天前
 redchamber

团队晚上开了一晚上的会,从八点开到了九点半

在考虑一个新的方法,用 AI 帮助用户写文档,具体步骤是这样的:

创建文档

  1. 用户输入一个描述。
  2. 利用 GPT 根据描述,先生成一个大纲,大纲可能是多层级的。
  3. 用户可以与生成的大纲进行互动,比如重新组织大纲结构,更改大纲标题,增加或删除大纲项,调整级别等。
  4. 用户调整完成后,将用户的初始描述和调整后的大概一起发给 GPT ,让 GPT 生成每个标题下的实际内容。

编辑文档

  1. 用户可以与当前文档的大纲进行互动,比如重新组织大纲结构,更改大纲标题,增加或删除大纲项等。
  2. 用户可以输入描述作为给 GPT 的指令,我们会将其与用户在第一步中所做的结构更改结合起来。
  3. 接着我们会让 GPT 生成每个标题下的实际内容。

我们感觉,如果按照上面的步骤操作,将整个文档的旧内容和结构一起发送给 GPT ,GPT 应该能很好地完成写作、编辑、重写文档的任务,生成的内容既正确又实用。

但也挺担心 token 的消耗...如果真的想让 GPT 对整个文档有一个全面的高层次理解,并能够对次级标题进行合适的调整,估计要用挺多 token 的。

但是描述的两个使用场景,如果能做好的,还是感觉意义很大的。

大家有什么想法可以互相交流交流吗?

谢谢啦,讨论产生碰撞,碰撞产生火花~ :)

1505 次点击
所在节点    程序员
14 条回复
maolon
338 天前
我觉得现在大模型最大的问题还是在于每次对话都是无状态的上面:
想要更全面的让他了解你的需求 =
更多的 token 消耗,
更多的 prompt input(包括 history),
更慢的响应,

想要更快速的响应,更少的 token =
使用各种 cache 技巧,
使用各种 RAG 技巧
但是信息是有损的,可能无法明白用户的意图

我觉得这两点还挺难平衡的
xuanbg
338 天前
这属于技术上没问题,业务上也走得通,甚至是最佳的路线。但实际上走不通,因为使用者能力达不到。
redchamber
338 天前
@maolon 对,这个问题,可能从技术上来看,只要上下文足够,prompt 组织好,加上思维链,one shot 这些,目前测试下来,gpt4 的能力够了,但是从一门生意的角度,不光要看能不能做到,还得看成本,看价格,得看用户的付费意愿,所以还是得实验
redchamber
338 天前
@xuanbg 能展开说说为什么使用者能力达不到吗,您预想的使用者的画像大概是什么样的呀

望不吝赐教! 谢谢🙏🙏
SillyGod
337 天前
不能支持自定义 api 嘛,尤其是第三方代理的
redchamber
337 天前
您好 @SillyGod 能详细说说自定义 API 吗?

是说,定义一个 API 端点,然后我们系统去调用这个 API 来生成文档吗?

多谢啦!
SoviaPhilo
337 天前
实际上用户的痛点是产品经理 自己觉得自己知道是怎么回事
但是就是写不下来。


大概试了一下, 看起来确实是有模有样的,但是严重依赖用户输入。
能好好说话这个还得专门学提示词工程,还得每次都细致地考虑业务场景的细节

太吃产品经理的配置了
SoviaPhilo
337 天前
一个模块能用的功能描述估计是要写上千个字的小作文,
如果项目不追求文档完备,这功能我觉得不太会有人乐意掏钱
redchamber
336 天前
@SoviaPhilo

多谢您的尝试,我们现在其实是有个前提假设的,这个前提假设就是,当前的 GPT-4 ,如果在思维链和 one shot 的加持下,已经可以作为文档创作的主力,碳基生物只需要提供修改建议,调整结构等等给 GPT ,GPT-4 的能力,是可以写出有实际价值的文档的。

现在我们还在实验阶段,后续准备将多轮交互也实现了,这样,整个系统的实际意义就会大大增强。

但我们的出发点还是,硅基生命是文档的主创,而碳基生命只是文档的需求提出方,只告诉 GPT 应该怎么写。这和现在几乎所有的文档编辑器,相关软件的出发点和交互方式,都是有差异的。

让我们拭目以待吧!

再次多谢您的反馈。给你点赞👍🏻👍🏻 如果需要更多 Credit ,可以把用户名私信我,我这边手动为您处理
redchamber
336 天前
@SoviaPhilo 对的,所以我们也在困扰,其实 valid 的场景有

1. 要给客户交付文档,其实文档本身实际意义不大的场景
2. 大企业合规要求很严格,这些文档都需要存档的场景
3. 个人水文,写点年终总结,党员的学习报告,知识分享报告啥的

上面 3 点,1 和 2 是有付费意愿的,但是用户宣传要有针对性,这个我们还没摸出路子来,3 可能付费意愿很小,所以我们计划,是可以作为推广宣传的,比如默认模板上,有个网址链接,或者有个二维码,帮我们宣传,就可以免费用。

不知道你对这些场景有没有什么洞见哈~~

多谢多谢
SillyGod
336 天前
@redchamber
我说的是 OpenAI 的 API 啦,可能误解了
比如 openai 的 chat endpoint 是
https://api.openai.com/v1/chat/completions
第三方代理的是
https://api.b3n.fun/v1/chat/completions
我的意思就是能开放出来这个,不过你们应该是很大部分是要靠 api 差价来赚钱的吧,不能接受就算啦
SoviaPhilo
336 天前
@redchamber 这个场景最麻烦的问题在于铁罐子要恰到好处地帮裸猿考虑既有的业务模型的潜在风险点, 事无巨细就不乐意看,有疏漏就要骂娘,感觉也只能靠反复对话来引导裸猿把自觉理所当然不用讲的部分,所谓"知识的诅咒"的部分说出来

能实现多轮交互确实是很赞的,容我期待一个
redchamber
336 天前
@SillyGod 我们其实提供的价值是

1. 预设计的,针对每种文档场景的思维链
2. one shot
3. 生成的 word 模板中内置的最佳实践

至于说 API 的差价,其实不是我们的核心,我们每生成一份文档,大概至少要调用 10 到 30 次的 API ,还蛮贵的。

不过你说的倒确实可以考虑,还是蛮好的一个点子,不用我们的 API 接口,那确实可以收费便宜不少

多谢啦,新的思路,挺赞的
redchamber
336 天前
@SoviaPhilo 想请教下,对于多轮交互的交互方式,您有什么想法或者期待吗?

现在通用的很多就是采用编辑器的一个插件的形式提供,提供一个聊天窗口,或者选中一段文字,弹出命令列表,重写,优化,扩充等等。

我们觉得,这些功能当然很好,但本质上,还是将 AI 定位在人类的助手这个角色,而 GPT4 的能力,已经不仅仅是一个助手了,人家可以当大哥了的。

所以我们设想,应该让 GPT4 当主创,这个中间交互怎么设计,其实蛮讲究的,也没有太多先例,所以一直在讨论、调研、收集用户的想法。

非常感谢您的回帖和提供的想法。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1001806

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX