V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Motorola3
V2EX  ›  问与答

既然能实现人与人对话的实时翻译,能不能翻译视频?

  •  
  •   Motorola3 · 3 天前 · 335 次点击

    比如 搬运视频的 给视频翻译成中文再拿英文的声音训练然后再生成中文音频 再去对照字幕时间,是不是可以省事?

    up 主做视频 出一版自己习惯的音频后,剩下的就直接转

    5 条回复    2024-06-27 00:05:06 +08:00
    LLaMA2
        1
    LLaMA2  
       3 天前
    技术上可行
    现成的一条龙服务的轮子还没见到

    视频 》提取音频》音频时间打点 》 音频转文字 》文字翻译 》 翻译后文字转音频》根据打点生成和原始音频时长一样的音频 》 合成视频
    jianchang512
        2
    jianchang512  
       3 天前
    有一条龙服务,开源,不过不是实时的

    原理:视频拆分音频--whisper 识别文字--翻译文字--合成语音--语音+字幕--嵌入视频

    https://github.com/jianchang512/pyvideotrans
    Motorola3
        3
    Motorola3  
    OP
       3 天前
    @LLaMA2 对我这两天思考了一下是可行的只是似乎没人做 或者是没开源

    @jianchang512 我觉得对于视频来说应该也不需要实时的 我有时间了研究研究
    medivh
        4
    medivh  
       3 天前 via iPhone
    其实你只需要把视频上传到 YouTube 它会自己生成字幕 把字幕提取出来就行
    Motorola3
        5
    Motorola3  
    OP
       2 天前
    @medivh 这个是的 但是字幕要对应时间,所以可能需要字幕文件 不过这个我看有一些插件是可以实现的 应该是有办法的

    其次用原先视频作者的声音去训练模型来生成其他语言的声音 这样可以极大程度的还原原视频,且对其他语种的人听起来没有那么强的割裂感,不然比如英语差的人去看英语的教程 眼睛大部分时间在字幕上
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2274 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:20 · PVG 20:20 · LAX 05:20 · JFK 08:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.