职位描述:
1、设计与开发分布式模型训练和模型推理等核心模块,确保系统高可用性和高性能。
2、负责模型训练与推理过程的优化,提高效率,降低资源消耗。
3、开发和维护API,满足AI应用接入需求,确保接口易用性与兼容性。
4、负责Kubernetes上的API Server、运行时构建及微服务架构的开发与优化。
5、与AI应用开发团队紧密合作,持续优化平台性能与工具链体验。
职位要求:
1、硕士及以上学历,计算机科学、人工智能等相关专业,扎实的计算机基础知识。
2、5年以上人工智能、机器学习领域的平台开发经验,熟悉主流AI框架和工具。
3、精通Golang或Python,有AI框架训练和推理过程优化经验优先。
4、熟悉分布式系统、容器化技术,具备Kubernetes微服务开发经验。
5、优秀的沟通表达与团队合作能力,能够与跨职能团队高效协作。
6、出色的问题解决能力,具有持续学习和自我提升的意愿与能力。