职位描述
岗位职责
1. 负责大模型(LLM)应用的开发、部署及优化,包括与DeepSeek等第三方大模型接口的对接与集成;
2. 基于业务需求开发智能化功能模块,如自动审批系统、设计图生成(AI生成设计)、目标检测(CV方向)等;
3. 参与大模型服务端部署,优化模型推理性能及资源占用,确保高并发场景下的稳定性;
4. 设计并实现与大模型相关的数据预处理、结果后处理及业务逻辑整合;
5. 跟踪大模型领域技术动态,探索多模态(文本、图像)场景下的创新应用。
任职要求
1. 学历、经验
本科及以上学历,计算机科学、人工智能、数学等相关专业;1-2年算法开发或AI应用开发经验,优秀应届生可放宽。
2. 技术能力
熟练掌握Python,熟悉至少一种深度学习框架(PyTorch/TensorFlow,有Hugging Face Transformers等大模型工具使用经验;
熟悉RESTful API开发,具备大模型接口(如DeepSeek、GPT、文心一言等)对接经验者优先;
了解模型部署技术(TensorRT/ONNX/Docker),熟悉云平台(AWS/阿里云/腾讯云)服务部署;
熟悉计算机视觉(目标检测、图像生成)或自然语言处理(NLP)任务,有YOLO、Diffusion模型、OCR等实践经验者优先。
3. 项目经验
参与过AI系统开发项目,如自动化审批、智能设计生成、图像识别等;
熟悉多模态模型(文本 图像)应用场景,能独立完成数据准备、模型调优及效果验证。
4.加分项
了解大模型微调(Fine-tuning)、Prompt Engineering或LangChain框架;
有开源项目贡献或AI竞赛(Kaggle、天池等)获奖经历优先。