比如给一个旅游攻略视频/游戏讲解视频等,可以输出总结性的文字内容吗?
比如给一个旅游攻略视频/游戏讲解视频等,可以输出总结性的文字内容吗?
1
lifei6671 Nov 3, 2025
感觉应该是提取视频音轨,调用声音转文字工具,再把文字扔给大模型进行总结吧。
不知道现在有没有直接识别视频的大模型。 |