职位描述
团队介绍:
作为中国先进的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。
为何加入我们?
挑战世界技术难题,追求智能上限
用AI驱动国民级APP的产品迭代和颠覆式创新
我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。
主要职责:
1、多模态大模型研发:开发业界前沿的图文多模态大模型,实现高质量场景理解和内容生成;
2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等);
3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地;
4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
职位描述
1、3年及以上工作经历,计算机科学、人工智能等相关专业硕士及以上学历;
2、熟悉多模态领域的重要算法和模型(如Qwen-VL、CLIP、Stable Diffusion等),掌握LoRA、SFT、RL等训练方法,有实际项目经验者优先;
3、熟练使用pytorch/deepspeed/transformers/ms-swift等框架,具备扎实的Python或C 编程能力;
4、在学术头部会议(如CVPR、ICLR、NeurIPS等)发表过相关论文者优先;
5、具备较强的学习能力,能够快速掌握新技术,对新技术充满好奇心,具备高度的自驱力和韧性。