大家好,我是 Orion ,Ries 的 founder 。
我是一个十年的产品经理,最近用 AI 编程工具(主要是 Windsurf 配合 Claude )把自己的一个想法实现成了应用。大约 50%的代码是 AI 生成的,后期也有一位联合创始人加入。
上周,因为我们初期技术方案不成熟,一些热情的 V 站朋友体验后,服务器直接宕机了。
能亲手实现想法感觉很棒,但也因为我是技术新手,这次服务器宕机就是个教训,暴露了架构上的许多问题。
简单说,这个应用是为了解决英语学习中“接触太少”的问题,核心思路是“实时创造英语接触”。
它会在用户日常浏览中文内容(如 V2EX )或观看视频(如 B 站、YouTube )时,根据用户的英语水平,智能地将少量中文替换为英文或补充英文表达,帮助用户在无痛、无感、不中断娱乐的情况下,逐步拓宽英语边界。
(如果想了解应用细节,可以参考我之前的介绍帖,这里主要求助就不赘述了:https://www.v2ex.com/t/1134678
)
目前最大的技术瓶颈是构建一个动态、准确的“用户语言图谱”。我们需要这个图谱来了解:
我们已经实现了初步方案,但效果不够准确。
因此,真心请教各位技术大佬:
我作为技术“门外汉”,很多方面确实力不从心。任何方向性的指点、相关的关键词、或者成熟方案的提示,对我来说都至关重要。
如果恰好有朋友对这个领域(个性化语言学习、用户建模)感兴趣,或认同我们想做的事情,非常欢迎各种形式的交流,乃至“技术共创”。
联系方式: 微信:OrionTyce (欢迎探讨技术问题或交个朋友)
再次感谢大家花时间看完我的求助!希望能得到宝贵的建议。
![]() |
1
ujfj1986 OP 在线求大佬支招~
|
2
AmandaloveYang 44 天前
数据与建模可以学习市面上所有的英语学习 app ,几乎殊途同归。
|
3
WispZhan 44 天前
交个朋友,另外提一个功能需求: 希望能支持 YouTube 自动字幕,类似 Dualsub 这种的,它是可以根据自动(auto-generated)字幕做双语。 但是目前 Ries 好像还不支持 auto-generated 形式的字幕? 反正我每次用都是 disabled ,打不开。也可能是插件冲突。
|
![]() |
4
ujfj1986 OP @WispZhan 感谢反馈,Youtube 的字幕增强是可以的啊?难道有什么异常,我们今天会更新一版,之前 Youtube 有时候在提取字幕做改造的时候会被判定成 bot ,拿不到字幕,我们优化了一下获取方式~
|
![]() |
5
ujfj1986 OP @AmandaloveYang 英语学习 app ?指哪些呀?我们也不知道他们具体的底层做法呀。。
|
![]() |
6
0xLittleFi 44 天前 ![]() 好像挺不错的,我老婆也是英语培训的老师,先试试产品
|
![]() |
7
th00000 44 天前
产品想法不错,但是试用过之后还是用回沉浸式翻译了
提两点建议把,谢谢 OP 的产品可以免费体验 一方面是崩溃确实很影响体验,是有消费冲动的想法的,但是止于崩溃 一方面体验过后发现 AI 给我标注的 “生词” 并不 “生”,而且一些专业词汇其实并不需要被翻译,翻译了反而不知道他是什么东西了,导致我需要反复切换原文,很容易打断看文档的节奏,反而降低了效率 可能针对每个人 AI 还是需要慢慢调教吧,调教个一两个月没准就准了,但是考虑到 OP 的技术水平可能我调教了两个月,直接给弄没了也是很正常的。 |
8
linshuizhaoying 44 天前
有 bug 我想禁用某个站点 网页 不生效
|
![]() |
9
ujfj1986 OP @0xLittleFi 太好了,试试试试~
|
![]() |
10
ujfj1986 OP @linshuizhaoying 可能数据同步存在某些问题,您是什么浏览器呀?您可以在 settings 里设置一下~
|
![]() |
11
ujfj1986 OP |
12
linshuizhaoying 44 天前
@ujfj1986 #10 chrome
|
![]() |
13
sss15 44 天前
1. 浏览器的 A 链接无法进行选中,即无法划词,有没有考虑过在下划线上悬浮后能触发划词翻译呢?
2. 划词翻译中,音标后面希望能加入语音朗读,考虑一下不会认音标的人群。(这样我就可以卸载豆包翻译插件了) |
![]() |
15
ujfj1986 OP @linshuizhaoying Chrome 不应该呀。。您试试在 settings 里添加看看呢。。我也测试一下,可能数据同步确实有点问题,block 后可能没存上,您也可以尝试一下白名单增强模式
|
18
linshuizhaoying 44 天前
@ujfj1986 #15 就有点麻烦了 其实对用户来说 我更新一键开关而不是去每次配东西
|
![]() |
19
ujfj1986 OP 话说,有没有算法或模型大佬能给指指路,怎么搞高质量的个性化的语言图谱😂😂
|
![]() |
20
ujfj1986 OP @linshuizhaoying 嗯嗯,这个 bug 我们会检查一下尽快给修复了~
|
21
hytex 44 天前
1.在 B 站使用的时候,字幕和视频本身的字幕有一定的差异。
2.有些站我并不想翻译,但是没有第一时间找到关闭翻译的按钮/入口(上方插件栏我习惯不显示,不知道在插件栏里是否有关闭选项) 3.另外,翻译的字幕由于背景的原因,直接挡住了原视频(被迫学习了属于是/doge) |
![]() |
22
ujfj1986 OP @hytex 感谢反馈!!
关于您提到的问题,是这样的: 1. 我们是基于 B 站提供的字幕做的改造,可能确实会有一些谐音错别字出现。。很难完全避免。。 2. 您可以试试我们的快捷键进行手动增强或显示原文的切换,另外我们有提供黑名单和白名单,以及完全手动增强 3 种增强方式,您可以在 settings 里看看哦,选择您合适的~ 3. 这个遮挡您指的是字幕的背景太黑太大了么?还是说我们的遮罩功能给挡住了?可以给我说说我看看怎么优化交互体验~ |
![]() |
24
jiezaichan 44 天前 ![]() 想法不错的 给你点赞
|
![]() |
26
ujfj1986 OP @jiezaichan thanks!!
|
![]() |
27
ujfj1986 OP 感谢 V2EX 让我今天遇到了 3 个超级好的站友~哈哈哈
|
![]() |
28
ninjaJ 43 天前
1 、“如何更有效地通过用户行为数据” 我之前听说过一种根据用户滚动速度/滚动距离/停留时长来分析用户对哪些内容感兴趣的做法。
2 、语言图谱这个东西底层就是一个图数据库,构建不是一步到位,有点像 LLM 的缓存机制,边用边更新,命中率越来越高。查词和生词本是很多语言学习都有的功能,就是因为它能带来增量反馈。但是话说回来,我感觉您说的这个“图谱”可能不是“那个图谱”。 3 、性能问题,我理解的 MVP 是越小越好,越快越好,边开车边换轮子做架构升级。软件是一棵有生命力的树,你没办法刚种下他就决定它长什么样,它只要在生长,就需要不停地修剪。但是按照我的经验,您现在的用户量完全到不了需要考虑性能的程度(没有任何损 OP 的意思)。 另外,用大模型太吃性能(性能=成本)了,可以考虑换个思路,其实在大模型出来之前,很多传统算法已经能做很好了,再不济还有专门的小模型,并且在某些专业领域,小模型的输出质量一定是高于大模型的。 我之前简单用过您的产品,没有太深入,当时脑子里的第一个问题就是您提到的最核心问题,如果决定翻译哪些单词或者句子。当时您的帖子说用的大模型 API ,我的第二个问题是:那得多费钱呀! ![]() ![]() ![]() |
![]() |
29
wqhui 43 天前
有意思,不过有点卡
|
30
qocja 43 天前
1. 确实如楼上 ninjaJ 所说,你们的语言图谱可能不是个图谱,可能更像一个用户画像,是不是做个单词本/短语本就好了
2. 目前确实没考虑到合适的,可以先用大模型做评估,积累到用户数据之后再自己做 Fine-tuning ,这里面核心的问题是用户画像如何给到模型做评估,这里倒是可以参考 RAG 的思路 3. 这个确实不是现阶段要考虑的问题 |
![]() |
31
ujfj1986 OP @ninjaJ 是挺费钱的。。但既然是要做 AI 产品,肯定得用 LLM 做驱动呀。。不然未来可玩性就很低了,其实我们也试过不用大模型,直接用翻译引擎做。。基本没法用,非常生硬,而且还只能做极少数的 1 ,2 个效果,实时的短语,俚语注解啥的就都做不了。。
|
![]() |
33
ujfj1986 OP @qocja 你的这个 opinion 非常的正确! RAG 是我们已经使用的 trick ,但核心问题是提供什么样,什么形态的数据或 context 来尽可能准确的让 model 明白用户的图谱或者“画像”
核心的问题是用户画像如何给到模型做评估 |
![]() |
36
airfans 43 天前
感觉要做口语相关的更好,阅读其实对于咱们来说并不是什么困难
|
![]() |
39
sss15 37 天前
我冲了一个 Plus 版的年费,才用 2 天 2 万积分就用了 16%了,一天 8%,那就顶多能用 12 天,消耗太大了
|
![]() |
40
ujfj1986 OP @sss15 😂😂我们的产品特性导致我们的处理请求量确实比较大,我们目前还专注在优化体验,成本优化上用户自己本地 cache 是一个可能性,但由于我们人手有限,所以可能需要您稍微多等我们一下,实在抱歉~
|
42
jefferyJQ 37 天前 ![]() 产品很不错,有考虑过支持安卓手机的 app 吗?比如抖音,个人感觉对于这块使用时长会久一些
|