职位描述
职位描述:
1. 主导大模型系统架构设计:
负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。
构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。
设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。
2.模型部署与性能优化:
负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。
3. AI服务平台开发:
基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。
4.技术领导与跨团队协作:
指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。
职位要求:
1.计算机科学、人工智能或相关领域本科及以上学历,5年以上大型服务端开发经验,3年以上AI系统相关项目经验
2.有牵头大型AI工程项目经验,具备一定的团队管理或技术领导经验
3. 具备扎实的 Java 编程基础,熟悉常用的 Java 开发框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并发分布式系统开发经验
4. 熟悉常用数据库,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中间件
5. 熟悉python/GO开发语言,能进行一般的python/Go项目开发
6. 能够快速理解业务需求,具备良好的沟通能力,将业务需求准确转化为技术方案
7. 善于学习和总结,有团队合作精神和较强执行力,较强的问题解决能力、跨团队沟通能力和技术规划能力。
【加分项】
1. 精通Transformer架构、RAG技术栈、向量数据库优化与多模态检索策略者优先。
2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一种模型部署方法,掌握模型量化、算子融合、投机采样等优化技术者优先。
3. 对AI技术前沿(如Agent、多模态)有持续跟踪热情者优先。