技能要求:
经验要求:
5-10年经验
工作描述:
项目编号:【42898】
1. 项目背景
我司为传统行业企业,拥有数千份存量历史文档(技术方案、商务合同、行业规范等,格式多为 PDF/DOCX/XLSX)。
目前公司研发团队以 Java/传统开发 为主,缺乏大模型应用(LLM Ops)及 AI Agent 编排的工程经验。
我们需要引入外部专家团队,协助我们搭建一套基于私有化知识库的智能文档处理系统,并实现自动化内容生成。
2. 核心目标
知识处理:实现对非结构化文档的智能解析、切片、向量化及知识图谱构建。
智能体应用:构建具备“反思-纠错-重试”能力的 AI Agent,能根据知识库历史数据,自动生成新的技术方案与商务文档。
技术转移(重中之重):交付物必须让不懂 Python/AI 的 Java 团队能维护。 我们需要的不只是一个跑起来的 Demo,而是一套可落地的工程化方案。
3. 技术栈硬性要求
❌ 拒绝低代码/无代码平台:严禁使用 Dify、Coze、n8n 等可视化拖拽平台作为核心底座。我们需要的是代码级可控的系统,以便于版本管理和二次开发。
✅ 代码级 Agent 框架:必须使用企业生产级编排框架。候选方案包括但不限于:
LangGraph (首选,因其状态机能力强)
CrewAI (次选,适合角色分工明确的场景)
AutoGen (适合需要代码执行的场景)
Spring AI / LangChain4j (如果团队更偏向 JVM 生态)
✅ AI 辅助开发(AI IDE):乙方在开发过程中,需展示如何使用 Cursor / Trae / Claude Code 等现代 AI 编程工具。我们要求学习这种高效的开发模式。
4. 具体工作内容
4.1 架构设计与 MVP 开发
设计“文档摄取 -> 知识库构建 -> Agent 编排 -> 文档导出”的整体架构。
针对我方“存量文档多、生成逻辑复杂”的特点,设计最优的 RAG(检索增强生成)策略。
4.2 核心模块开发
文档解析器:开发针对复杂表格、扫描件的解析模块。
Agent 工作流:实现多步骤的智能体逻辑(例如:先分析需求 -> 检索知识库 -> 生成初稿 -> 合规审查 -> 最终定稿)。
自动化生成引擎:开发 Word/Excel 自动化填充功能,能将大模型生成的结构化数据精准回填至企业模板中。
4.3 项目陪跑与 Java 团队赋能(核心交付)
结对编程(Pair Programming):我方 Java 开发人员将全程参与。乙方需通过 AI IDE 远程结对,手把手教学如何将 AI 应用于传统业务。
工程化交付:交付标准的 Python 项目结构(或 Java 项目结构),包含 Docker 容器化部署、环境变量管理、日志监控。
Prompt 工程培训:教会我方人员如何编写和维护高质量的系统提示词(System Prompt)。
5. 乙方资质要求
必须有 代码级 Agent 框架(LangGraph/CrewAI/Spring AI) 的真实落地案例(请提供 GitHub 或脱敏演示视频)。
必须具备“传统开发团队赋能”的经验。能听懂 Java 开发者的痛点,并能用他们听得懂的语言进行技术交接。
6. 交付物清单
全套源代码(Git 仓库访问权限)。
一键部署脚本(Docker Compose / K8s YAML)。
《AI Agent 架构设计文档》(包含状态流转图)。
《AI IDE 高效开发指南》(针对我方团队的定制化教程)。
售后支持:为期 1 个月的远程答疑与技术支持群。