技能要求:
经验要求:
5-10年经验
工作描述:
项目编号:【186049】
1.梳理现有应用程序中调用AI模型(小模型、大模型)的相关代码,包括输入输出、预处理/后处理逻辑、异常处理等。梳理模型部署代码(如推理服务、模型加载、环境配置)及模型API接口文档。
2.根据目标平台(如新的云环境、推理框架或硬件)确定具体迁移方案(例如:从TensorFlow Serving迁移到vLLM,或从自建GPU集群迁移到云推理服务)。
3.负责迁移后的单元测试、集成测试,确保模型推理结果与原环境一致(或误差在可接受范围)。配合业务应用端完成端到端联调,解决性能、延迟、资源占用等问题。
4产出迁移方案文档、改造说明、测试报告及运维注意事项。