项目编号:【40380】
远程岗位一:全栈开发者按条结算
岗位职责
AI模型代码能力评测
对模型生成的代码进行多维度、深度的专业评估,评判其正确性、效率、可读性、健壮性及代码风格。
横向对比不同模型或不同版本模型在复杂任务上的表现差异,并提供精准、结构化的评测结论。
高质量代码范例撰写
针对模型当前能力较弱的领域(如复杂算法、最新技术栈、特定领域逻辑),撰写“黄金标准”的代码范例(SFT数据)。
以“代码导师”的身份,创建高质量的指令和代码实现,直接教会模型掌握新的知识和更优的编码范式。
模型边界与缺陷分析
设计并执行具有挑战性的编程任务和边缘测试用例(Edge Case),主动探索和挖掘模型的知识盲区、逻辑漏洞和潜在缺陷。
分析模型的“幻觉”和错误模式,为算法优化提供关键的一手资料。
真实世界应用与反馈
在日常工作中深度使用我们正在开发的AI编程工具,完成真实的项目模块或开发任务。
从真实用户的视角,提供关于工具链、模型响应和人机交互的全面反馈,推动产品体验的提升。
Prompt Engineering与最佳实践沉淀
基于丰富的实践,探索并总结最高效的Prompt Engineering技巧,形成团队的最佳实践。
与产品经理、算法工程师紧密合作,将您的工程洞察和评测经验转化为可执行的需求和优化方向。
理想的专家是AI辅助编程的深度实践者,对提升模型性能充满热情,并具备扎实的工程经验。他们的核心特征包括:
精通多种编程语言 和 3年以上 的全栈代码经验,熟悉代码补全、代码生成、代码纠错、单元测试生成等常见任务。
是cursor 或类似AI编程工具的 重度用户 。
具备 注重细节、逻辑严谨、乐于分享 的个人特质。
技能要求:
- 编程语言: 精通至少两门主流编程语言(高优Python, JavaScript/TypeScript, 低优 Go, Java, C++),对语言的细微差别和最佳实践有深入理解。熟悉代码补全、代码生成、代码纠错、单元测试生成等常见任务。
- 开发经验: 拥有3年以上软件开发经验,主导或深度参与过中大型项目,具备丰富的代码调试、重构和性能优化经验。(对标T4T5)
- AI工具使用: 是cursor 或类似AI编程工具(如 GitHub Copilot)的重度用户(日均使用>1小时),熟悉其优势与局限,并有自己独特的 Prompt Engineering 技巧,有过使用这些AI编程工具构建项目的经历
- 学历: 本科及以上
职业背景:
- 来自知名科技公司、独角兽或顶级开发工作室的资深工程师、架构师。
- 活跃在开源社区的资深贡献者或知名技术博主。
- 在特定领域(如算法、数据科学、前端/后端开发)有深厚积累的技术专家。
个人特质:
- 注重细节: 对代码质量有洁癖,能够发现并修正细微的逻辑错误或不规范的写法。
- 逻辑严谨: 具备优秀的分析和归纳能力,能够清晰、一致地应用评测标准。
- 乐于分享: 愿意分享自己的见解和经验,有帮助他人成长的意愿。
- 好奇心强: 对AI技术充满好奇,愿意探索和评测前沿的编程模型。