职位描述
工作职责:
1、模型研发与优化:负责大模型的算法设计、训练、调优(含预训练、指令微调、强化学习)。
2、 国产化适配:基于国产芯片(如华为昇腾)及配套框架,进行大模型的高效移植与性能优化。
3、行业应用落地:将通用大模型适配到应急、工业等垂直领域,提供解决方案。
4、前沿技术探索:研究稀疏化、量化、模型蒸馏等轻量化技术,并紧跟AGI前沿动态。
5.、多模态与Agent开发:负责多模态融合、智能体(Agent)在复杂任务中的应用研发。
岗位要求:
1、硕士及以上学历,计算机、人工智能等相关专业,精通PyTorch/TensorFlow框架,熟悉Transformer、MoE等模型架构。
2、工程能力:熟悉大模型分布式训练(DeepSpeed等),有CUDA/算子优化经验更佳,有国产芯片开发经验。
3、算法能力:深入理解大模型训练全流程及前沿技术,具备扎实的数据处理和算法基础。
4、加分项,大模型算法部署经验。
招聘人数:1人