人工智能-远程-1个月
¥18-500K/月
技能要求:
经验要求: 5-10年经验
程序员客栈
2026-04-25 09:48
工作描述:
项目编号:【42844】
实时数字人管线工程师
Real-time Digital Human Pipeline Engineer (Freelance / Remote)

我们的客户正在打造下一代实时AI数字分身。团队已完成后端大模型的构建,现在需要一位专家,为这个大脑装上会说话、有表情的“面孔”。你将负责的是整个产品视觉呈现的最后、也是最关键的一环。

核心职责 / What You'll Do

搭建实时推理管线:接收来自大模型的音频流或文本Token,实时生成克隆声音,并驱动虚拟形象的口型和表情,最终输出为视频流。
搞定音画同步:确保嘴型和声音在任何网络抖动下都严丝合缝。
克隆声音与形象:用少量样本数据,完成特定人的声音克隆和面部形象建模。
性能压榨到极致:做到端到端延迟 < 2秒,让对话体验像真人一样自然。

硬性要求 / Must Have:

亲手搭建并部署过实时数字人管线,产品上过线或有效果真实的POC。
精通音频驱动面部动画等方案的核心原理、工程陷阱和魔改方法有深入了解。
声音克隆实战经验:亲手训练和部署过类似项目,懂微调。
流式处理与高性能推理:精通熟练使用处理流式数据。
全栈交付能力:能独立写 Python 后端服务

Nice to Have:

懂一点前端(写个简单Web页面展示效果)
有 CUDA 编程经验,熟悉 Unity/Unreal 实时渲染,能让最终呈现更好看
对声音本身有审美,调出来的TTS不机械

详细请联系: zxie@hiredgesolutions.com
公司信息

立即沟通