技能要求:
Python
经验要求:
5-10年经验
工作描述:
项目编号:【43221】
你需要独立或协作完成以下四个核心模块的开发与拼装:
1 编写高性能分布式爬虫,实时抓取并清洗政企公开招投标讯息,要求能有效对抗主流的反爬虫机制(IP 墙、滑块验证、动态 Token 逆向等)。
2 基于文本格式的 DXF 文件,编写空间几何计算脚本,自动提取多边形顶点坐标、计算闭合面积与延米,并与标准定额数据库进行映射。
3 搭建本地向量数据库(如 Chroma/Milvus),对历史标书进行切片与嵌入(Embedding);通过大模型 API(如 Qwen/GPT 等)实现技术标方案的动态调整与 python-docx 自动化排版。
4 收集历史竞标数据,利用蒙特卡洛模拟(Monte Carlo Simulation)或基础机器学习算法,对竞争对手的报价行为建模,预测最优中标报价边界。
任职要求(硬性技术指标)
语言功底: 3 年以上 Python 实际项目开发经验,代码风格规范,具备独立架构轻量级项目的能力。
技术栈要求:
熟练掌握 Playwright、Selenium 或 Scrapy 等自动化工具。
熟练使用 ezdxf 库,具备扎实的**计算几何(Computational Geometry)**或空间几何向量运算功底。
深入理解 RAG(检索增强生成) 架构,有向量数据库部署及大模型提示词调优经验。
熟练使用 NumPy、Pandas、scikit-learn 等数据科学工具,能独立编写数理统计与模拟算法。
思维特质: 具备极强的 MVP(最小可行性产品)思维。拒绝过度设计,崇尚用最少的代码、最直接的逻辑解决业务痛点,以结果交付为唯一导向。