amery2010

amery2010

V2EX 第 69793 号会员,加入于 2014-08-04 11:29:33 +08:00
今日活跃度排名 8748
根据 amery2010 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
amery2010 最近回复了
@cyio 我底层的 tts 库是接入的免费的服务 api ,可选择的角色较少。
设置-语音服务
合成声源与语音合成是联动的,你可以先选择目标语言,然后选择对应的合成声源

如果对应语言下的合成声源列表中没有你想要的语音包,那就没办法了,毕竟用的是免费的 api
@cyio
1 、文件都是通过后端服务中转或者直接上传 Google AI Drive ,文件上传后只有查看 mata 信息的权限无法访问和下载源文件。
2 、你问的跨语言是只文本在朗读过程中使用多种语言?还是你问的是中文,希望他用英文朗读文本?如果是后者可以通过设置页面进行语音合成语言类型的设置,前者的话没办法,底层调用的是微软的 edge-tts 服务。
web 页面的代理地址与服务端的代理地址的设置是分开的,这是故意为之,避免造成转发接口的泄漏,别其他人恶意盗刷流量。
@SGRRYRS
@coter 有计划做,可能要等几个版本
@woorz Google AI studio 的 key 可以免费申请,每天 1500 次,个人使用完全足够,注意不要使用计费模式下的 key 就可以。
@SGRRYRS vercel 和 netfily 两个平台 edge 环境的文件的上传大小分别限定为 4.5MB 和 4MB ,这个是平台限制。

下周一我会发布新版本,通过几天的努力,新版本在 vercel 平台上已经支持大文件上传了。

当前版本你可以参考常见问题中的解决方案,利用 cf worker 代理来上传大文件
@SGRRYRS 我今天在开发过程中可能复现了你的问题,我遇到的问题是浏览器在发送请求时由于 CORS 问题导致请求发送失败,这个在使用代理 api 时需要注意中转服务器是否允许跨域请求。我为这个项目写了一个专门的 worker ,在 GitHub 仓库最后的常见问题部分可以找到链接
@SGRRYRS 语音交互可以参考 GitHub 仓库最后的常见问题部分,如果你的浏览器不支持浏览器语音识别接口或者无法正常访问浏览器自带的语音识别接口( chrome 浏览器是需要网络正常访问 Google 网站)。这个问题因浏览器差异很大。视频上传的问题你可以看一下浏览器 console 面板是否报错,如果未正常上传,应该会有错误提示。
@bestkayle 是的,不需要额外申请,Google 这是是对所有开发者 key 都开放了访问权限,即不需要额外申请就可以使用最新的模型
@cyio 好的,我会考虑在后续版本中加入的,这个功能在已有的对话模式基础上实现起来很方便
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2913 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 12:56 · PVG 20:56 · LAX 05:56 · JFK 08:56
Developed with CodeLauncher
♥ Do have faith in what you're doing.