职位描述
职责描述:
1.主导大模型技术(语言大模型、多模态大模型等)在家电垂直领域的落地应用,并解决落地过程中的技术难题,包括但不限于算法整体方案规划、模型设计调优、数据建设、模型部署与加速推理等;
2.负责大模型应用的关键技术突破和优化,在实际业务场景落地并沉淀通用的解决方案,包括但不限于企业内部 AI 提效、家电产品 AI交互等方向;
3.和产品、运营等深度合作,洞悉业务痛点,提出专业且有建设性的观点,推进项目高质量按时完成;
4.持续跟进业界算法前沿技术,包括大模型预训练、微调、强化学习等方向,打造外部技术影响力;
5.负责技术团队梯队建设和管理。
任职要求:
1.硕士及以上学历,5年以上深度学习、NLP/NLU领域算法工作经验,相关专业博士学历优先;
2.掌握业界领先大模型的基本原理和训练以及微调方法,如GPT 系列、LLaMA、ChatGLM 等的RLHF三阶段训练及LoRA微调等;
3.熟练掌握TensorFlow、PyTorch、Megatron、DeepSpeed等框架,了解各种并行策略,并具备大规模分布式训练的经验;
4.具备良好的团队协作、沟通和统筹管理能力以及优秀的应变能力和工作目标的达成能力,有异地协作办公以及 AI团队管理经验者优先;
5.具备百亿量级大模型的预训练、微调和强化学习等方向的技术应用经验优先。