V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ujfj1986
V2EX  ›  创业组队

求技术合伙人一名!(副业可选) - 我的 MVP 产品已有上千用户正在使用

  •  
  •   ujfj1986 · 44 天前 · 3240 次点击
    这是一个创建于 44 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景:一个非技术 PM 用 AI 工具( Windsurf+Claude )搭建了 Ries 的应用

    大家好,我是 Orion ,Ries 的 founder 。

    我是一个十年的产品经理,最近用 AI 编程工具(主要是 Windsurf 配合 Claude )把自己的一个想法实现成了应用。大约 50%的代码是 AI 生成的,后期也有一位联合创始人加入。

    上周,因为我们初期技术方案不成熟,一些热情的 V 站朋友体验后,服务器直接宕机了。

    能亲手实现想法感觉很棒,但也因为我是技术新手,这次服务器宕机就是个教训,暴露了架构上的许多问题。

    应用简介(为求助提供上下文):

    简单说,这个应用是为了解决英语学习中“接触太少”的问题,核心思路是“实时创造英语接触”。

    它会在用户日常浏览中文内容(如 V2EX )或观看视频(如 B 站、YouTube )时,根据用户的英语水平,智能地将少量中文替换为英文或补充英文表达,帮助用户在无痛、无感、不中断娱乐的情况下,逐步拓宽英语边界。

    (如果想了解应用细节,可以参考我之前的介绍帖,这里主要求助就不赘述了:https://www.v2ex.com/t/1134678

    [核心求助] AI 已不足以支持下一步,卡在“用户语言图谱”构建上了:

    目前最大的技术瓶颈是构建一个动态、准确的“用户语言图谱”。我们需要这个图谱来了解:

    • 用户当前认识哪些词汇、短语、句式?
    • 用户对一句话的理解程度如何?
    • 基于此,应用应如何智能调整内容的替换/补充策略?

    我们已经实现了初步方案,但效果不够准确。

    因此,真心请教各位技术大佬:

    1. 数据与建模:如何更有效地通过用户行为数据(如对替换内容的反馈、查词记录、收藏等),更准确、及时地构建和更新这个“语言图谱”?
    2. 算法选择:在算法层面,是否有更先进或更适合此类场景的模型/方法,能帮我们精确评估用户的语言边界和理解程度?(比如,需要考虑哪些关键特征?如何平滑学习曲线?)
    3. 工程与性能:这个图谱既要保证准确性,又不能过于复杂导致计算资源消耗过大,尤其用户量增长后,如何平衡准确性、实时性和系统性能?(例如,有没有轻量级且有效的图谱构建或更新机制?)

    我作为技术“门外汉”,很多方面确实力不从心。任何方向性的指点、相关的关键词、或者成熟方案的提示,对我来说都至关重要。

    如果恰好有朋友对这个领域(个性化语言学习、用户建模)感兴趣,或认同我们想做的事情,非常欢迎各种形式的交流,乃至“技术共创”。


    联系方式: 微信:OrionTyce (欢迎探讨技术问题或交个朋友)

    再次感谢大家花时间看完我的求助!希望能得到宝贵的建议。

    43 条回复    2025-06-13 11:46:07 +08:00
    ujfj1986
        1
    ujfj1986  
    OP
       44 天前
    在线求大佬支招~
    AmandaloveYang
        2
    AmandaloveYang  
       44 天前
    数据与建模可以学习市面上所有的英语学习 app ,几乎殊途同归。
    WispZhan
        3
    WispZhan  
       44 天前
    交个朋友,另外提一个功能需求: 希望能支持 YouTube 自动字幕,类似 Dualsub 这种的,它是可以根据自动(auto-generated)字幕做双语。 但是目前 Ries 好像还不支持 auto-generated 形式的字幕? 反正我每次用都是 disabled ,打不开。也可能是插件冲突。
    ujfj1986
        4
    ujfj1986  
    OP
       44 天前
    @WispZhan 感谢反馈,Youtube 的字幕增强是可以的啊?难道有什么异常,我们今天会更新一版,之前 Youtube 有时候在提取字幕做改造的时候会被判定成 bot ,拿不到字幕,我们优化了一下获取方式~
    ujfj1986
        5
    ujfj1986  
    OP
       44 天前
    @AmandaloveYang 英语学习 app ?指哪些呀?我们也不知道他们具体的底层做法呀。。
    0xLittleFi
        6
    0xLittleFi  
       44 天前   ❤️ 1
    好像挺不错的,我老婆也是英语培训的老师,先试试产品
    th00000
        7
    th00000  
       44 天前
    产品想法不错,但是试用过之后还是用回沉浸式翻译了
    提两点建议把,谢谢 OP 的产品可以免费体验
    一方面是崩溃确实很影响体验,是有消费冲动的想法的,但是止于崩溃
    一方面体验过后发现 AI 给我标注的 “生词” 并不 “生”,而且一些专业词汇其实并不需要被翻译,翻译了反而不知道他是什么东西了,导致我需要反复切换原文,很容易打断看文档的节奏,反而降低了效率

    可能针对每个人 AI 还是需要慢慢调教吧,调教个一两个月没准就准了,但是考虑到 OP 的技术水平可能我调教了两个月,直接给弄没了也是很正常的。
    linshuizhaoying
        8
    linshuizhaoying  
       44 天前
    有 bug 我想禁用某个站点 网页 不生效
    ujfj1986
        9
    ujfj1986  
    OP
       44 天前
    @0xLittleFi 太好了,试试试试~
    ujfj1986
        10
    ujfj1986  
    OP
       44 天前
    @linshuizhaoying 可能数据同步存在某些问题,您是什么浏览器呀?您可以在 settings 里设置一下~
    ujfj1986
        11
    ujfj1986  
    OP
       44 天前
    @th00000 您说的崩溃是什么呀?页面停止响应吗?

    专业词汇不需要翻译这个。。感谢反馈,确实忘记考虑到这个点了,请问是什么类型的,能给我个 url 样本么~
    linshuizhaoying
        12
    linshuizhaoying  
       44 天前
    @ujfj1986 #10 chrome
    sss15
        13
    sss15  
       44 天前
    1. 浏览器的 A 链接无法进行选中,即无法划词,有没有考虑过在下划线上悬浮后能触发划词翻译呢?
    2. 划词翻译中,音标后面希望能加入语音朗读,考虑一下不会认音标的人群。(这样我就可以卸载豆包翻译插件了)
    bojue
        14
    bojue  
       44 天前
    @th00000 这个需求很好,虽然我不搞这类产品
    ujfj1986
        15
    ujfj1986  
    OP
       44 天前
    @linshuizhaoying Chrome 不应该呀。。您试试在 settings 里添加看看呢。。我也测试一下,可能数据同步确实有点问题,block 后可能没存上,您也可以尝试一下白名单增强模式
    ujfj1986
        16
    ujfj1986  
    OP
       44 天前
    @bojue 佬,如果有技术思路也可以指一下路哟~
    ujfj1986
        17
    ujfj1986  
    OP
       44 天前
    @sss15 that's on the way, bro. 排队开发中,hover 解释+发音
    linshuizhaoying
        18
    linshuizhaoying  
       44 天前
    @ujfj1986 #15 就有点麻烦了 其实对用户来说 我更新一键开关而不是去每次配东西
    ujfj1986
        19
    ujfj1986  
    OP
       44 天前
    话说,有没有算法或模型大佬能给指指路,怎么搞高质量的个性化的语言图谱😂😂
    ujfj1986
        20
    ujfj1986  
    OP
       44 天前
    @linshuizhaoying 嗯嗯,这个 bug 我们会检查一下尽快给修复了~
    hytex
        21
    hytex  
       44 天前
    1.在 B 站使用的时候,字幕和视频本身的字幕有一定的差异。
    2.有些站我并不想翻译,但是没有第一时间找到关闭翻译的按钮/入口(上方插件栏我习惯不显示,不知道在插件栏里是否有关闭选项)
    3.另外,翻译的字幕由于背景的原因,直接挡住了原视频(被迫学习了属于是/doge)
    ujfj1986
        22
    ujfj1986  
    OP
       44 天前
    @hytex 感谢反馈!!

    关于您提到的问题,是这样的:
    1. 我们是基于 B 站提供的字幕做的改造,可能确实会有一些谐音错别字出现。。很难完全避免。。
    2. 您可以试试我们的快捷键进行手动增强或显示原文的切换,另外我们有提供黑名单和白名单,以及完全手动增强 3 种增强方式,您可以在 settings 里看看哦,选择您合适的~
    3. 这个遮挡您指的是字幕的背景太黑太大了么?还是说我们的遮罩功能给挡住了?可以给我说说我看看怎么优化交互体验~
    hytex
        23
    hytex  
       44 天前
    @ujfj1986 #22 好的,那我回复下第三个回答。
    是的,字幕的背景太黑太大了,直接挡住了视频本身
    jiezaichan
        24
    jiezaichan  
       44 天前   ❤️ 1
    想法不错的 给你点赞
    ujfj1986
        25
    ujfj1986  
    OP
       44 天前
    @hytex ok ,了解了~我记录一下,支持一下个性化调整字幕大小~

    感谢佬的反馈
    ujfj1986
        26
    ujfj1986  
    OP
       44 天前
    @jiezaichan thanks!!
    ujfj1986
        27
    ujfj1986  
    OP
       44 天前
    感谢 V2EX 让我今天遇到了 3 个超级好的站友~哈哈哈
    ninjaJ
        28
    ninjaJ  
       43 天前
    1 、“如何更有效地通过用户行为数据” 我之前听说过一种根据用户滚动速度/滚动距离/停留时长来分析用户对哪些内容感兴趣的做法。
    2 、语言图谱这个东西底层就是一个图数据库,构建不是一步到位,有点像 LLM 的缓存机制,边用边更新,命中率越来越高。查词和生词本是很多语言学习都有的功能,就是因为它能带来增量反馈。但是话说回来,我感觉您说的这个“图谱”可能不是“那个图谱”。
    3 、性能问题,我理解的 MVP 是越小越好,越快越好,边开车边换轮子做架构升级。软件是一棵有生命力的树,你没办法刚种下他就决定它长什么样,它只要在生长,就需要不停地修剪。但是按照我的经验,您现在的用户量完全到不了需要考虑性能的程度(没有任何损 OP 的意思)。
    另外,用大模型太吃性能(性能=成本)了,可以考虑换个思路,其实在大模型出来之前,很多传统算法已经能做很好了,再不济还有专门的小模型,并且在某些专业领域,小模型的输出质量一定是高于大模型的。
    我之前简单用过您的产品,没有太深入,当时脑子里的第一个问题就是您提到的最核心问题,如果决定翻译哪些单词或者句子。当时您的帖子说用的大模型 API ,我的第二个问题是:那得多费钱呀!
    wqhui
        29
    wqhui  
       43 天前
    有意思,不过有点卡
    qocja
        30
    qocja  
       43 天前
    1. 确实如楼上 ninjaJ 所说,你们的语言图谱可能不是个图谱,可能更像一个用户画像,是不是做个单词本/短语本就好了
    2. 目前确实没考虑到合适的,可以先用大模型做评估,积累到用户数据之后再自己做 Fine-tuning ,这里面核心的问题是用户画像如何给到模型做评估,这里倒是可以参考 RAG 的思路
    3. 这个确实不是现阶段要考虑的问题
    ujfj1986
        31
    ujfj1986  
    OP
       43 天前
    @ninjaJ 是挺费钱的。。但既然是要做 AI 产品,肯定得用 LLM 做驱动呀。。不然未来可玩性就很低了,其实我们也试过不用大模型,直接用翻译引擎做。。基本没法用,非常生硬,而且还只能做极少数的 1 ,2 个效果,实时的短语,俚语注解啥的就都做不了。。
    ujfj1986
        32
    ujfj1986  
    OP
       43 天前
    @wqhui 卡?哪里卡呀。。貌似我这儿还好呀。。
    ujfj1986
        33
    ujfj1986  
    OP
       43 天前
    @qocja 你的这个 opinion 非常的正确! RAG 是我们已经使用的 trick ,但核心问题是提供什么样,什么形态的数据或 context 来尽可能准确的让 model 明白用户的图谱或者“画像”
    核心的问题是用户画像如何给到模型做评估
    wqhui
        34
    wqhui  
       43 天前
    @ujfj1986 #32 选中词看翻译大概要几秒,初次设置个人英语水平那几步也是,也可能是我网络问题吧
    ujfj1986
        35
    ujfj1986  
    OP
       43 天前
    @wqhui 哦哦,划词翻译这个目前是访问的一个外部服务,速度是有点慢,我们正在优化,准备做到本地,hover 直接出来
    airfans
        36
    airfans  
       43 天前
    感觉要做口语相关的更好,阅读其实对于咱们来说并不是什么困难
    ujfj1986
        37
    ujfj1986  
    OP
       43 天前
    @airfans 口语竞争有点激烈,不过未来也必然需要做~
    HanMeiM
        38
    HanMeiM  
       39 天前
    合不合伙人的暂且不说,先来点年付优惠好吗哥 @ujfj1986
    sss15
        39
    sss15  
       37 天前
    我冲了一个 Plus 版的年费,才用 2 天 2 万积分就用了 16%了,一天 8%,那就顶多能用 12 天,消耗太大了
    ujfj1986
        40
    ujfj1986  
    OP
       37 天前
    @sss15 😂😂我们的产品特性导致我们的处理请求量确实比较大,我们目前还专注在优化体验,成本优化上用户自己本地 cache 是一个可能性,但由于我们人手有限,所以可能需要您稍微多等我们一下,实在抱歉~
    ujfj1986
        41
    ujfj1986  
    OP
       37 天前
    @HanMeiM 有啊,你加我一下给我说一下账号~
    jefferyJQ
        42
    jefferyJQ  
       37 天前   ❤️ 1
    产品很不错,有考虑过支持安卓手机的 app 吗?比如抖音,个人感觉对于这块使用时长会久一些
    ujfj1986
        43
    ujfj1986  
    OP
       36 天前
    @jefferyJQ 额,mobile 我们正在研究如何做~ 我们希望能覆盖尽可能多的日常生活场景~
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2471 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 15:43 · PVG 23:43 · LAX 08:43 · JFK 11:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.