职位描述
岗位职责:
1. 负责构建和优化基于向量检索、图谱检索和重排序模型的RAG系统,提升信息检索的准确性与效率。
2. 基于智能体编排平台(如Dify、Coze、n8n、LangFlow)设计、开发和部署AI智能体,实现自动化任务处理(如客服、数据分析、故障处置)。
3. 使用LoRA、Adapter等方法对大模型(如LLaMA、GPT、ChatGLM)进行领域适配微调,提升模型在垂直场景(审计)的表现。探索模型量化、蒸馏等技术,优化推理效率与成本。
4. 大模型训练与优化
- 参与参数大模型的训练、调优及部署,探索模型压缩、分布式训练等技术优化路径。
- 研究大模型与智能体结合的范式(如Agent-tuning、MemoryAugmented架构),提升智能体的长期学习与适应能力。
5. 前沿技术落地
- 与产品团队协作,将技术转化为高可用性、低延迟的整体级解决方案。
- 跟踪AI Agent领域最新进展(如AutoGPT、MetaGPT等开源框架),快速实现技术验证与迭代。
任职要求:
1. 技术背景
- 计算机科学、人工智能、数学等相关专业硕士及以上学历,2年以上AI研发经验;
- 精通Python语言,熟悉TensorFlow/PyTorch/JAX等深度学习框架;
- 具备大语言模型(LLM)、强化学习(RL)、知识图谱等领域的实战经验,有分布式训练或模型部署经验优先。
2. 领域专长
- 深入理解AI Agent技术栈:规划(Planning)、记忆管理(Memory)、工具调用(Tool Use)等核心模块;
- 熟悉自然语言处理关键技术:文本生成、对话系统、指令理解与对齐;