技能要求:
经验要求:
5-10年经验
工作描述:
项目编号:【182501】
项目概述
我们正在开发一款新型智能交互设备。现需为其开发云端AI交互系统,作为设备的“大脑”。该系统需整合大语言模型、长期记忆与语音合成服务,并配备管理后台。您将负责整个后端服务的设计、开发、测试与部署。
核心功能需求
1. AI对话引擎与长期记忆系统
大模型集成:接入国内稳定的大语言模型API(如DeepSeek、Moonshot等),实现高质量对话。
长期记忆实现:使用向量数据库(如ChromaDB或Pinecone),存储和检索用户对话中的关键信息(如人物关系、偏好、过往事件),实现跨会话的连续性记忆与个性化回复。
角色与上下文管理:支持通过系统指令(Prompt)配置AI的固定人设与回复风格,并有效管理对话上下文。
2. 语音合成服务集成
语音克隆API对接:集成高拟真度的语音合成服务API(如ElevenLabs、Azure AI Speech等)。
音频处理中间件:开发服务模块,接收AI生成的文本,调用语音API合成为指定声音的音频文件,并返回给硬件设备播放。
3. 设备通信与数据接口
通信协议:设计并实现硬件设备与云端服务间的稳定、低延迟通信方案(建议使用WebSocket或MQTT)。
统一API网关:提供统一的RESTful API接口,供硬件设备调用,处理语音上传、对话请求、状态上报等。
4. 管理后台开发
Web管理后台:开发一个简洁的Web管理界面,支持以下功能:
AI角色与人设的配置与管理。
查看已连接设备的状态与基础日志。
用户数据管理模块(需设计严格的隐私保护与数据安全流程)。
系统运行状态监控。
5. 云端部署与运维
系统部署:将完整系统部署至国内云服务器(如阿里云、腾讯云)。
部署文档:提供完整的系统部署、运维及备份指南
技术要求与交付物
技术栈建议:
后端:Python(FastAPI/Django)或 Node.js。
数据库:PostgreSQL(业务数据)+ 向量数据库(记忆存储)。
前端:Vue.js/React(管理后台)。
交付物清单:
完整、注释清晰的后端源代码及前端管理后台源代码。
全套API接口文档、数据库设计文档。
系统部署手册、运维手册。
一个可远程访问的、功能完整的测试环境。
五、验收标准
第一阶段(中期验证):提供可访问的测试接口,演示核心对话与记忆功能(例如:告知AI“我喜欢蓝色”,后续提问时能准确回答)。
第二阶段(最终验收):
全链路演示:模拟硬件设备上行语音,系统完成从语音识别、AI对话生成、语音合成到返回音频的全流程,且对话体现记忆能力。
管理后台演示:展示后台配置AI角色、查看数据等核心功能。
文档交付:审核所有交付的技术文档是否完整、清晰。