在用 whisper 把自己录制的一些视频提取出字幕方便快速看, 他竟然有一个 prompt 的功能, 如果用默认的 tiny 模型, 结果是繁体中文的,因为 openAI 是这么训练的, 但是如果在 prompt 里加入"对话为简体中文", 结果就给你转成简体中文了. 如果我在 prompt 里加入"主题是代码开发" 那里面一些乘除之类的文字也会写对.
还测试了一下模型问题,tiny 问题太多,好多文字是同音的但是不正确, medium 好很多, large 速度慢很多有些错误竟然比 tiny 还离谱, "零元购"给出的是"0 元够",感觉是训练词库里缺了?
whisper 这算不算是一个小语言模型了, 给出 prompt 后,他竟然会根据指令去调整给出的结果, 好像还能自动翻译,这真的惊到我了
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/1092205
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.