V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  elron  ›  全部回复第 1 页 / 共 2 页
回复总数  40
1  2  
121 天前
回复了 ShaoLongFei 创建的主题 健康 咽口水好像吞刀片一样,我是不是复阳了
猛喝热水,但不要太烫
121 天前
回复了 loganovo 创建的主题 问与答 有注册 claude 的好路子吗? 邮箱被 ban 了
买张国外卡
121 天前
回复了 raullf 创建的主题 Python 服务 10 多秒才返回是什么情况
最基础的 debug 技能
赚黑心钱
前端时间正好研究过,模型方面综合下来腾讯的 musetalk 效果最好,也支持实时流式推理,推理速度也挺快,但是比较吃资源。实测下来 4070 也只能达到 25fps 。如果效果不满意,可以基于腾讯公布的数据集+自己的素材再训练一套。

也可以用 er-nerf 模型训练,这个效果上我觉得不如腾讯,但是推理起来不吃什么资源。

另外,如果有声音克隆方面的需求,可以上 gpt-Sovit 或者最新的 fish-speech 也可以,声音方面没要求的话直接上 edge-tts 完事。

关于推流,直接考虑 webrtc 即可,搭建一个 srs 推流服务器,推理过程可以流式传输给 srs ,再由客户端通过 ws 拉取。如果想做到数字人和 LLM 实时问答对话,你要考虑一下文本切割了。
kimi 可以 response_format 参数
op 目前对这个方向的研究有进展吗
celery 和 apscheduler 都能满足,而且 apscheduler 支持动态添加周期任务,celery 更偏向生产-消费模型
这还不跑吗
135 天前
回复了 kxg3030 创建的主题 V2EX 这个站的评论到底怎么看
136 天前
回复了 hoveyLee00 创建的主题 问与答 怎么今天那么多跨域问题
都没事干闲的
137 天前
回复了 Lyn321 创建的主题 问与答 有没有感觉年纪越大越爱喝水了?
查查血糖
能换背景吗
145 天前
回复了 whyrookie 创建的主题 问与答 深夜写代码,休息讨论一下
没必要内耗自己
150 天前
回复了 WhiteSJ 创建的主题 汽车 有小孩真的需要一辆车吗?
150 天前
回复了 craftx 创建的主题 问与答 这样的“AI”是怎么创建出来的?
外挂的知识库不行
我配吗? v 站这些人配吗?
你要先问问你媳妇, 银联的支付密码是不是开锁密码
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2708 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 123ms · UTC 10:05 · PVG 18:05 · LAX 02:05 · JFK 05:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.