后端其他-远程-1个月
¥6-12K/月
技能要求:
经验要求: 5-10年经验
程序员客栈
2025-12-11 17:12
工作描述:
项目编号:【181759】
开发一个轻量级、可私有化部署的AI工具。核心功能是读取客户Excel中的物料数据,利用AI模型自动识别语义相似的重复物料,并生成治理报告。
技术栈要求:

核心框架:Python 3.9+
AI模型:必须熟悉 sentence-transformers 库,使用开源中文Embedding模型(如 BAAI/bge-small-zh)。
向量存储:熟悉 Chroma 或 FAISS,用于本地向量相似度检索。
前端/交互:熟悉 Gradio 或 Streamlit,搭建简单的Web上传/展示界面。
数据处理:熟悉 pandas 进行Excel读写与数据清洗。
核心任务:

实现物料描述(名称+规格+材质)的文本向量化。
实现基于向量相似度的“重复物料”聚类与检索。
封装一个Web界面,支持Excel文件上传和结果展示。
代码需支持本地运行或Docker打包,不依赖公网API。
交付要求:

代码结构清晰,有基本注释。
提供 requirements.txt 和简易运行说明。
需配合进行简单的Bug修复和逻辑调整。
项目周期:

预计 2周 左右(越快越好)
公司信息

立即沟通