自制软件卖到 148 一年, 分享一个财富密码, 个人软件月收入达到 3000 元每月

2023-07-16 10:37:17 +08:00
 iorilu

https://v2ex.com/t/930940

最强 AI 字幕软件来了,V2sub - AI 字幕机

https://www.aizimuji.com 官方网站

https://buy.aizimuji.com 注册码销售网站

V2sub 是基于最新 ASR (自动语音识别)技术开发的一款 AI 智能字幕生成软件, 可将任意音频, 视频转换为各种语言的字幕, 软件操作简单, 任何人可以轻松一键生成。 从此看剧学外语不用愁, 支持十几种语言, 支持 GPU 加速 , 支持 ChatGPT 翻译字幕 。 AI 智能生成的字幕准确度极高, 基本达到专业级字幕水准。

===========

以上是广告, 具体功能可看官网

开始正题

先说结论, 利用现在开源的 AI 相关软件或功能, 包装一个简单的桌面软件, 提供一个还凑合的 UI , 基本就能赚钱了(如果你认为利用 github 东西拿来赚钱是不道德的, 那就不用看了), 当然最好还是符合相关的作者版权, 比如我用的这个基于 Whisper , 按版权协议来说是可以商用的

起初, 我只是想自制一个自己玩玩, 因为这个确实有用, 比如看外语的视频, 或者你懂的日本 lsj 视频, 是不太可能找得到现成字幕的, 其实很多年前我就希望有这种东西, 现在既然有了, 当然要利用下

刚开始有想法是过年的时候, 那时候无意中看到这个, 后来我就想可以开发个基于这个的桌面软件, 顺便学习下 ,因为大部分人应该都没有开发桌面软件的经验, 我这个也是基于 pyside (和 pyqt 基本一样, 就是版权不一样, 可商用免费)开发的, 实际效果我认为还不错

我都是基于 window 开发, 然后 windows 上编译一次, 再到 macos 上编译一次, 基本无需改动,当然还有一些细节不一样, 反正我记得 macos 我专门弄了个 mac-dev 分支, 大概也就不到 100 行不一样

4 月初我开始发布出来, 后来也不断更新, 一直也有一定的用户, 而且还有相当一些用户买了一年的注册码, 这也给了我一些动力继续弄下去

目前版本, 我认为基本就语音到字幕而言也比较完善, 翻译利用 chatgpt 也比较完美了, 后面提高除非是模型本身更新了, 遗憾的是, 自从 3 月后,openai 的 whisper 开源模型没有再更新过, 很可能以后也不会更新了, 毕竟他也提供线上 api 版本

结论: 你如果想做点软件(桌面或手机软件), 最佳方式是在 GitHub 上发掘一些有作用的 AI 相关的技术, 然后利用此技术包装出一个桌面和手机软件, 大概率不会差, 这就是我说的财富密码

反正我目前也在物色其他技术, 有合适的可以再开发其他有关 AI 的软件, 大家有兴趣也可讨论

提一下, 目前这个 v2sub 我基本平均每天收入百元左右, 当然也不敢说多成功, 但至少值得一试

21465 次点击
所在节点    程序员
155 条回复
iorilu
2023-07-16 12:25:56 +08:00
@shalingye 模型肯定不完美, 但我估计 openai 也不放放出完美的开源模型了
milukun
2023-07-16 12:42:56 +08:00
你的这个 Whisper 本地运行速度怎么样?有优化吗
我自己本地搭建弄了一下,处理一个 1 小时的音频,速度太慢了,字幕基本是很久才出来一行。M1 ,16G
iorilu
2023-07-16 12:45:27 +08:00
@milukun win 上有 gpu 很快的, 用 3060 的话一小时大概 15 分钟左右完成

mac 是比较慢的,毕竟不支持加速
sm1314
2023-07-16 12:55:41 +08:00
@iorilu 多谢分享,想问一下服务端的硬件是怎样的呢,就是 wisper 本地部署同时服务大量用户的话,用几台 3060 服务器?并发高的时候,有排队的策略吗
ll0504
2023-07-16 13:00:02 +08:00
觉得去可以去抖音活着小红书做一波营销
ll0504
2023-07-16 13:00:39 +08:00
运营好肯定不只这点钱
Exgirlfriends
2023-07-16 13:03:02 +08:00
做自媒体的应该很需要。。
lion9527
2023-07-16 14:03:17 +08:00
我之前也想过,针对动作片做实时字幕的。后面发现实时功能很难实现,就放弃了🤣
mintist
2023-07-16 14:07:39 +08:00
可以的,学习了楼主
iorilu
2023-07-16 14:19:12 +08:00
@sm1314 你可能误会了, 我这软件目前模型运算是再本地

用户下载软件自带模型, 本地运行 whisper
HFcbyqP0iVO5KM05
2023-07-16 14:37:33 +08:00
这种涉及到分发软件进行售卖盈利的模式,如果有用到开源代码的话,尤其是 GPL 协议的,还挺麻烦的。
vivianLi7
2023-07-16 14:46:44 +08:00
看了下官网视频,现在逻辑是串行的,先转完全部文字,再去翻译。可以考虑下改成并行,比如生成一句就可以去翻译了,这样子整体的耗时应该更短

再者说,如果改成上述那样子,理论上就可以实现一边看视频一边生成字幕了
sparkpark
2023-07-16 15:10:09 +08:00
楼主这人能处,有钱赚是真的带上兄弟们
goodspb
2023-07-16 15:11:28 +08:00
@iorilu 哦,那用户本地运行的时候才将 model 下载到本地?毕竟有 6+G 的模型,不可能直接内置到模型当中吧?
iorilu
2023-07-16 15:21:15 +08:00
@goodspb 软件包自带小模型

其他模型可另外下载安装

小模型几百 M , 软件包总共 1.5G
o99o
2023-07-16 15:26:30 +08:00
@iorilu #35 你用的是最小模型的那个版本吗?
iorilu
2023-07-16 15:29:49 +08:00
@o99o 不太明白你的意思

软件下载默认自带小模型

需要其他模型可以自行下载安装, 安装后可用小中大模型都可以
goodspb
2023-07-16 16:01:31 +08:00
@iorilu 看到了,base 模型就 130M
bihui
2023-07-16 16:11:44 +08:00
大哥,你这个软件太大了吧,1.4g ??
iorilu
2023-07-16 16:34:23 +08:00
@bihui AI 相关软件都大, 模型都很大的, 支持 GPU 的库也很大

除非是调用线上 api

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/957105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX