高级AI系统开发工程师（大模型与RAG方向）(A18742)招聘_洪山区高级AI系统开发工程师（大模型与RAG方向）(A18742)招聘

当前位置：首页>职位列表>职位详情

高级AI系统开发工程师（大模型与RAG方向）(A18742) 25000-30000元

武汉洪山区

应届毕业生

本科

小米科技有限责任公司

2026-02-25 09:12:21

3578人关注

已申请立即申请收藏职位

职位描述

职位描述： 1. 主导大模型系统架构设计：负责RAG系统的整体架构设计，包括存储层、检索层、推理层与缓存层的技术选型与实现。构建高可用、低延迟的分布式推理服务框架，支持向量数据库集成（如Milvus、Elastic）、知识库管理与多模态检索优化。设计并实现Agent工作流编排框架，支持工具调用（MCP协议）、任务规划与自动化执行。 2.模型部署与性能优化：负责大模型（LLM/VLM）的本地化部署、量化压缩、动态批处理与推理加速，优化GPU/CPU异构算力利用率。 3. AI服务平台开发：基于Java/Go/Python构建高并发、可扩展的AI微服务，与现有业务系统深度集成，实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作：指导中级工程师，制定技术方案，并主导技术攻关。与产品、算法、基础设施团队协作，定义需求并推动工程落地。职位要求： 1.计算机科学、人工智能或相关领域本科及以上学历，5年以上大型服务端开发经验，3年以上AI系统相关项目经验 2.有牵头大型AI工程项目经验，具备一定的团队管理或技术领导经验 3. 具备扎实的 Java 编程基础，熟悉常用的 Java 开发框架，包括不限于Spring，SpringMvc、SpringBoot、Spring Cloud，有高并发分布式系统开发经验 4. 熟悉常用数据库，包括不限于Mysql、MongoDB、ES、Redis等，熟悉常用的消息中间件 5. 熟悉python/GO开发语言，能进行一般的python/Go项目开发 6. 能够快速理解业务需求，具备良好的沟通能力，将业务需求准确转化为技术方案 7. 善于学习和总结，有团队合作精神和较强执行力，较强的问题解决能力、跨团队沟通能力和技术规划能力。【加分项】 1. 精通Transformer架构、RAG技术栈、向量数据库优化与多模态检索策略者优先。 2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一种模型部署方法，掌握模型量化、算子融合、投机采样等优化技术者优先。 3. 对AI技术前沿（如Agent、多模态）有持续跟踪热情者优先。

联系方式

点击查看

注：联系我时，请说是在今日招聘网上看到的。