这是一个创建于 88 天前的主题,其中的信息可能已经有所发展或是发生改变。
因手里有一些项目团队目前人员忙不过来,我们正在寻找多位算法小伙伴加入远程兼职团队。作为核心成员,您将深度参与前沿的计算机深度学习项目,运用 CUDA 技术为各种复杂场景提供精确高效的 AI 模型解决方案。
必:有良好的职业素养
必:沟通主动积极
必:有良好的工作习惯和团队意识
## 数字人直播同传模型开发:
1.负责端到端语音翻译模型,将原始的音频流经过 S2ST 转换成目标语言的翻译音频流,确保翻译准确、流畅,满足直播场景的实时性要求。
2.开发唇形同步模型,实现数字人口型与语音的完美匹配,将翻译的音频流作为参考信号,结合图像流,输出最终的直播视频流,提升直播的真实感与互动性。
3.对其他辅助模型进行开发与调优,如音频长度匹配、语音克隆质量、翻译后的嘴型匹配、背景音问题开发优化等,以全面提升数字人直播同传系统的性能。
## 宠物情绪识别模型开发:
1.基于宠物声音开发情绪识别模型。
2.对接 APP 端,将识别结果以直观、友好的方式呈现给用户,增强用户体验。
## 任职要求:
1. 熟练掌握 CUDA 编程,并具备扎实的理论基础与实践经验,熟悉语音识别、语音合成、情感分析等技术者优先;
2. 熟练掌握 Python 、TensorFlow 、PyTorch 等主流开发框架与工具,并有过模型的实际开发和应用经历;
3. 具备出色的沟通能力和团队协作精神,能够主动沟通、积极配合团队工作,适应远程办公环境;
4. 对新技术充满热情,自我驱动,具备良好的问题分析与解决能力,能够在快节奏的环境中高效工作。
联系方式
微信:Star040913 添加时请备注 V2EX 算法