V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cs3230524
V2EX  ›  程序员

发个包,做个 demo。

  •  
  •   cs3230524 · 312 天前 · 2651 次点击
    这是一个创建于 312 天前的主题,其中的信息可能已经有所发展或是发生改变。

    上传视频,分离音轨,音轨翻译,字幕合成,最后合并回视频。 音轨分离合并:ffmpeg 音轨转文字:whisper 文字翻译:Azure Translator 文字转音频:Azure text2speech

    用 Python ,费用 2k ,不能预支,能搞的留下 base64 。

    yueji
        1
    yueji  
       312 天前   ❤️ 2
    上传视频,分离音轨,音轨翻译,字幕合成,合并视频
    ffmpeg 音轨转文字
    whisper 文字翻译
    Azure text2speech
    每一个功能接包都值 2k.
    nikenidage1
        2
    nikenidage1  
       312 天前
    费用 2k
    psklf
        3
    psklf  
       312 天前
    加个 0 吧
    danbai
        4
    danbai  
       312 天前 via Android   ❤️ 9
    谁在这留联系方式我看不起谁
    iorilu
        5
    iorilu  
       312 天前
    需求也不清楚

    写个脚本凑合用

    和写一个能用的软件带 UI 的差远了
    gzlock
        6
    gzlock  
       312 天前   ❤️ 2
    ffmpeg -i input-video.avi -vn -acodec copy audio.aac
    whisper audio.aac --model medium --output_format vtt -o .
    Azure Translator 没用过
    Azure text2speech 也没用过,话说把翻译后的字幕转音频是啥需求?帮视频配音?
    正巧前两个需求我都用过,帮楼主省了有 1k 吧,[滑稽
    shalingye
        7
    shalingye  
       312 天前 via Android
    没什么难度,不过为啥非得 Python 写界面,还有楼上一堆嘲讽的看不懂
    iorilu
        8
    iorilu  
       312 天前
    @shalingye 难度是不高

    这活其实问下 chatgpt 基本就完成 70%工作量, 剩下调试下脚本就通了

    但 lz 估计是要搞个网页的, 那活就没底了, 还得搞页面,css ,html , 前端一堆玩意
    xiangyuecn
        9
    xiangyuecn  
       312 天前
    @shalingye 2k ≈ 打发要饭的,除非拿来练手 打发时间🐶 尤其是:不能预支 == 画饼,订金 预付款都没有,说白嫖都不为过 陌生人。
    iorilu
        10
    iorilu  
       312 天前
    @gzlock 自动配音啊

    现在自媒体搞得很多垃圾视频都是这么出来的, 先从 youtube 活什么地方搬运, 然后分离声音, 搞个字幕, 再按字幕 AI 配音, 最后再合成

    都是 AI 配音, 一个叫云溪的男的声音, 都听过把
    shxlxa
        11
    shxlxa  
       312 天前 via iPhone
    @gzlock 有一种可能是搞视频搬运,比如将 youtube 上的视频搬运到 B 站,需要将音频由英文转成中文后,再合成视频
    gpt5
        12
    gpt5  
       312 天前
    v 友平均工资几万刀,
    按业界统一标准,工资时薪两倍算,
    你这没几十万刀根本打不住。
    shalingye
        13
    shalingye  
       312 天前 via Android
    @xiangyuecn @iorilu 受教了🤣
    nightwitch
        14
    nightwitch  
       312 天前 via Android
    加个 0 都打不住
    x77
        15
    x77  
       312 天前
    其实不用这么麻烦,Azure Speech 可以直接从音频到音频,不需要 STT 再 TTS ,流程如下:

    Video --> (FFmpeg) Audio Track --> (Azure Speech Service) Speech Translation --> (FFmpeg) Audio Track 2 --> Video 2

    当然,如果楼主非要要 AI TTS 播音就另外当别论了
    jackge0323
        16
    jackge0323  
       312 天前
    这种一看就是搞国外教程的,udemy 的教程拖回来,翻译成中文,再拿出去卖。
    ndk2023
        17
    ndk2023  
       312 天前
    预算翻一倍叫我。
    wusheng0
        18
    wusheng0  
       312 天前 via Android
    @ndk2023 翻一倍也不能预支,完事给钱()
    murmur
        19
    murmur  
       312 天前
    自动洗稿?有这技术早自己干了
    murmur
        20
    murmur  
       312 天前
    @shalingye python 没有什么加密方法,你给了 demo 也能反编译出来,楼主不是说了没有定金么
    cs3230524
        21
    cs3230524  
    OP
       312 天前
    @gzlock 你就理解为以后看动作片有中文字幕和中文配音了!
    nmap
        22
    nmap  
       312 天前
    侮辱性定价
    shalingye
        23
    shalingye  
       312 天前
    @murmur 😂直接白嫖
    xylophone21
        24
    xylophone21  
       311 天前
    来围观需求描述的认知偏差了.

    像 @gzlock 这样的 4 条命令行, 2k 并不少吧, 毕竟他都送了 2 条了.
    c2const
        25
    c2const  
       311 天前
    建议把预算提高到 2k dollar
    再签好合同,提前预付部分款项
    ----------------
    looveh
        26
    looveh  
       311 天前
    就知道一个 ffmpeg ,其他的都没听过(꒦_꒦)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2812 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 15:03 · PVG 23:03 · LAX 08:03 · JFK 11:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.