职位

职业角色

全部

后端

移动端

前端

DBA

设计师

产品经理

高端技术职位

更多

全部

Vibe Coding

人工智能

国内地区

全部

北京

上海

深圳

广州

杭州

成都

南京

更多

工作方式

全部

兼职

驻场

人工智能
¥6-12K/月

openCV

图像处理

5-10年经验

1个月

项目编号:【42885】 内容: 1、OCR算法优化:负责优化现有的OCR识别模型,重点解决复杂场景(如模糊、倾斜、光照不均)下的文字漏识别和错误识别问题,提升识别准确率。 2、版面分析与还原:研发或优化版面分析算法,精确识别图片中的文本行、段落、表格及图片区域。 3、图像修复与文字渲染:解决翻译后的文字回填问题。负责开发图像处理算法(如Inpainting/去字),去除原文,并根据原始排版风格,将翻译后的文字以合适的字体、大小和位置渲染回图片,保持视觉一致性。 4、全流程效果调优:针对“识别-翻译-还原”的全链路进行效果评估与调优,解决文字截断、重叠、字号不匹配等视觉问题。 简介: 我们公司是做AI文档翻译软件,这个岗位需要解决翻译后的文字回填问题。负责开发图像处理算法(如Inpainting/去字),去除原文,并根据原始排版风格,将翻译后的文字以合适的字体、大小和位置渲染回图片,保持视觉一致性。客户遇到的问题和我们需要针对系统处理的问题是:①内容提取遗漏;②内容识别错误;③原文抹除效果不稳定;④译文回填的时候格式比较乱。我们公司是没有图像算法工程师的岗位,所以需要的一个可以处理以上问题的熟手
人工智能
¥1-6K/月

5-10年经验

1个月

项目编号:【42862】 优化 openClaw 响应速度
人工智能
¥18-500K/月

5-10年经验

1个月

项目编号:【42844】 实时数字人管线工程师 Real-time Digital Human Pipeline Engineer (Freelance / Remote) 我们的客户正在打造下一代实时AI数字分身。团队已完成后端大模型的构建,现在需要一位专家,为这个大脑装上会说话、有表情的“面孔”。你将负责的是整个产品视觉呈现的最后、也是最关键的一环。 核心职责 / What You'll Do 搭建实时推理管线:接收来自大模型的音频流或文本Token,实时生成克隆声音,并驱动虚拟形象的口型和表情,最终输出为视频流。 搞定音画同步:确保嘴型和声音在任何网络抖动下都严丝合缝。 克隆声音与形象:用少量样本数据,完成特定人的声音克隆和面部形象建模。 性能压榨到极致:做到端到端延迟 < 2秒,让对话体验像真人一样自然。 硬性要求 / Must Have: 亲手搭建并部署过实时数字人管线,产品上过线或有效果真实的POC。 精通音频驱动面部动画等方案的核心原理、工程陷阱和魔改方法有深入了解。 声音克隆实战经验:亲手训练和部署过类似项目,懂微调。 流式处理与高性能推理:精通熟练使用处理流式数据。 全栈交付能力:能独立写 Python 后端服务 Nice to Have: 懂一点前端(写个简单Web页面展示效果) 有 CUDA 编程经验,熟悉 Unity/Unreal 实时渲染,能让最终呈现更好看 对声音本身有审美,调出来的TTS不机械 详细请联系: zxie@hiredgesolutions.com
Vibe Coding
¥6-12K/月

Caffe

5-10年经验

1个月

项目编号:【42830】 慢病预警算法
Vibe Coding
¥1-6K/月

Caffe

5-10年经验

1个月

项目编号:【42829】 慢病预警算法
人工智能
¥18-500K/月

Python

5-10年经验

1个月

项目编号:【42793】 需要做一个text to query的AI 工具。 表有几百张,但是有每张表的字段说明和ER图。 需要有相关经验的。 请面试的工程师介绍一下过去的经验和做这个项目的计划。
兼职招聘
兼职招聘正式上线!40W+程序员、7000+企业方,急速触达!

我要找兼职

我要招聘