职位描述
岗位职责:
1. 业务定义:把商业问题翻译成可量化的视觉算法问题,输出技术路线、数据方案、评价指标、上线标准。
2. 算法研发:端到端设计、训练、调优、部署 CV/多模态大模型,涵盖检测、分割、识别、追踪、生成、3D、视频理解、OCR、NERF、Diffusion、VL 等全栈方向。
3. 数据闭环:搭建“采标—训练—评测—回流—自监督”一体化系统,让数据成为持续增长引擎。
4. 性能优化:在精度、速度、功耗、内存、成本之间做最优权衡,推动算法在端边云全场景落地;主导模型蒸馏、量化、剪枝、NAS、框架级算子重写。
5. 前沿预研:跟踪 CVPR/ICCV/NeurIPS/ICLR/3DV 等顶会,每半年输出≥1 篇专利或论文,并转化为业务护城河。
6. 团队管理:负责团队培训、任务分解与进度跟踪,营造共享知识、共担责任、共享成果的合作氛围,打造一支有战斗力的AI团队。
任职要求:
1. 8 年以上计算机视觉研发经验,主导过日活千万级或营收过亿级的视觉相关项目,并作为核心算法负责人解决过重大技术难题,具备从0到1的完整项目落地经验。
2. 精通 Python 和 C ,具备高性能的代码编写和系统设计能力,并能够使用 CUDA 进行核心算子的开发和优化,以极致提升算法效率。
3. 深入掌握 PyTorch 框架和生态,精通 TensorRT 及 ONNX 模型转换与部署的全流程,熟悉模型量化、剪枝等优化技术,并有基于 MindSpore 或其他国产框架的开发经验者优先。
4. 对现代计算机视觉核心架构有深刻理解,包括但不限于 CNN、Transformer、Diffusion Model、NeRF 及 3D Gaussian Splatting,不仅限于理论推导,更能手写其核心算子并进行定制化改进与优化。
5. 在目标检测领域具备专家级能力,对 YOLO 系列架构(如 v3, v5, v7, v8, v9, YOLOX)的演进、细节实现和实战调优有极其丰富的经验,能够针对特定场景进行模型深度定制与迭代。
6. 精通多目标追踪(MOT)技术,熟练掌握并应用过 SORT、DeepSORT、ByteTrack、OC-SORT、BoT-SORT 等主流算法,拥有处理复杂场景(如严重遮挡、快速运动、目标形变)下追踪问题的成功经验。
7. 熟悉主流芯片平台(NVIDIA、高通、海思、苹果 NPU、ARM GPU)的底层推理特性与性能瓶颈,具备丰富的模型在不同硬件平台上的部署、调试和性能优化经验。
8. 拥有大规模数据并行训练的实际项目经验,能够熟练运用 DeepSpeed、FSDP 或 Horovod 等分布式训练框架解决训练过程中的稳定性、收敛性和扩展性问题。
9. 具备流畅的英文论文阅读和复现能力,能快速跟进 CVPR、ICCV、ECCV 等顶级会议的最新研究成果,并具备将论文算法进行复现、迭代并应用于业务实现二次创新的能力。
10. 具备较好的团队管理能力,具备高效沟通能力、自我驱动力强,对于技术有强烈的探索欲望;