wx 读书的插件外包

想做一个浏览器插件（或者 python 实现以下功能），报价大概多少？本来想自己搞，最近忙看看外包价格多少啦。

问题描述
有些微信读书中的书因版权原因不可以使用微信读书自带的 AI 朗读，并且微信读书自带的 AI 朗读可能存在不好听的问题。

目标
为了解决以上问题，打算自制一个插件，可以将微信读书中的内容读出来。插件将通过 Azure 的朗读接口实现。

功能需求
支持在“微信读书”中的墨水屏网页版上安装使用。
插件必须在 Azure 上调用朗读接口实现读取微信读书内容的功能。
插件应实时显示读取进度，并支持暂停和继续功能。
插件应支持以可调节的语速、音量和音色输出读取结果。
插件应支持在常见浏览器上使用，如 Chrome ，Firefox 等。

场景：
一些不太烧脑的杂志闲书，听可以解决问题，不然眼睛太累了。
不太喜欢真人读，希望把书原汁原味读出来，不需要加入书评和朗读人的情感。

v：d25qYWNreQ==

tommyzhang

2023-04-24 21:45:42 +08:00

算了下一口价 13w

wdwwtzy

2023-04-24 21:51:06 +08:00

我 14w 可以做

rapperx2

2023-04-25 08:55:08 +08:00

我只要 20w

xieren58

2023-04-25 14:41:59 +08:00

5w 内差不多了...

Tdy95

2023-04-26 01:43:49 +08:00

我 9w

ys7723

2023-04-26 07:38:51 +08:00

我只要 100 万

rozbo

2023-04-26 11:17:48 +08:00

我觉得楼上各位在整活儿的原因是....

> 本来想自己搞，最近忙看看外包价格多少啦。。。

这种语气让人感觉不太舒服呢。
但实际上如果你自己真的尝试搞过就知道这不是一个随便可用外包的小活儿，作为一个做过类似实现(爬取内容生成字幕 AI 朗读合成视频)的人来说说这里面的技术难点：
1. 网页是强反爬手段的，比如浏览器指纹、ip 、还有字体之类的，如果是是插件可能别的没啥大问题，但字体这个就是一个很麻烦的事情，假如通过 dom 之类的解析，自然得到一串毫无意义的乱码，这种情况下怎么朗读？这种情况下你可能想到人工重新映射字体，但实际上这种映射关系是会变的。唯一可用的方式可能是截图然后 ocr ，不过这种方案也有其他的坑。总之获取文字这一步都没有那么简单。
2. AI 朗读时，你如何知道当前读到哪一句？语音和文字怎么对应？标点符号怎么办？考虑 stream 模式下没有断句，这里可能需要对源文字重新加工，可能要用到一些文字处理方便的知识
3. Azure 接口是收费的，一般可用用 edge 浏览器自带的“朗读”功能实现，这个不要钱，而且简单方便，这里可能要实现一个 rpc 去调用

ps：python 怕是写不了浏览器插件吧

Jackyxiaoc

2023-04-26 12:39:23 +08:00

如果有让大家不舒服，抱歉了。
@rozbo 感谢回复，这段话是口述给 chatgpt 整理的，没调整过来，细看语气确实欠妥，和各位说一声抱歉。其实浏览器 edge 中将 ua 改成 kindle 已经是可以朗读的了，主要是实现读完自动翻页即可。python 脚本可以实现满足翻页需求也可。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/935125

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.