想问下如何将 srt 字幕文本自动剪接生成一个完整语句啊?

203 天前
 summerlv

比如通过一些软件生成了 srt 字幕文本,但是这些字幕文本都比较零散,可以通过写一个解析 srt 文本的程序让它们自动剪接生成一句完整的话吗?然后剪切合并后的语句的时间戳信息也自动合并!没想出啥思路可以解决,想用 Python 来写,搜了下有 srt 相关的库,但是具体的解析思路还没有!

还请相关前辈指导一些思路?不胜感激,^_^

3523 次点击
所在节点    程序员
27 条回复
naminokoe
203 天前
如何定义什么叫做一句完整的话?
dji38838c
203 天前
中文吗
中文还是比较好搞的,做过
summerlv
203 天前
@naminokoe 这个也是要思考的问题,😄
summerlv
203 天前
@dji38838c 英文,想把英文弄成一句完整的话,然后翻译为中文,英文就是比较多语气词或者停顿的话就不好弄,而且最要命的是可能会有对话形式
summerlv
203 天前
@dji38838c 中文的思路是怎么弄啊?是用到啥库吗,或者解析步骤是咋样的?
gaobh
203 天前
扔给 gpt 直接组合就好了,不放心就用工作流就行了,这么简单的问题
summerlv
203 天前
@gaobh 有尝试过喂给 GPT ,但是效果不是很好,特别是遇到长文本的时候,工作流是什么啊
summerlv
203 天前
@summerlv GPT 说着说着就自动编造其他的话了,都不是原文了
mumbler
203 天前
用 whisper 重新去识别生成字幕,prompt 告诉它按完整句子断句
summerlv
203 天前
@mumbler 可以再细说下吗?
mumbler
203 天前
@summerlv 再细就要帮你做了,你适合花 20 美金买个 chatgpt plus ,跟 gpt4 聊聊你的疑问
gaobh
203 天前
@summerlv #7 工作流都不知道用 gpt 算白花钱了,工作流就是分步推理然后串联理解吧
XCFOX
203 天前
OP 用的什么什么软件生成的 srt ? 正常的语音识别输出的不就是一个完整的语句吗?

https://www.xfyun.cn/services/lfasr
https://help.aliyun.com/zh/dashscope/developer-reference/paraformer-speech-recognition/
https://www.volcengine.com/product/asr
summerlv
203 天前
@gaobh 太菜了,我看了下 whisper ,感觉可以用它的 Python 库试试
summerlv
203 天前
@XCFOX 剪映,用的剪映的智能字幕识别,识别出来的其实还蛮准确的, 但是就是因为对话形式的字幕,导致有些单词不能成句,然后就需要手动调,感觉比较麻烦,所以想着能不能解析下 srt 文本,然后能够自动调整下成句
javaluo
203 天前
有 Whisper 识别英文,说不定识别之后效果就么已经不错,没有那种断来断去的问题我
sm1314
203 天前
需要多模态视频理解,字幕信息量太少了
sm1314
203 天前
你就是想做视频解说吧,别想了,难度很大
matthewzhong
203 天前
剪映有个有智能剪口播的功能,可以快速剔除不要的,卡顿的、语气词的部分。

[字幕工具箱 - 免费的在线字幕工具集合]( https://zm.i8k.tv/)
thinkm
203 天前
这个比较难,目前没有好的方案

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1037383

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX