职位描述
职位描述:
1.设计和实现数据ETL管道,处理结构化和非结构化数据,为LLM应用提供高质量数据支持
2.开发和维护mcp服务接口,支持LLM和Agent系统的数据交互需求
3.参与RAG(检索增强生成)系统的构建,包括向量数据库集成、文档处理和检索优化
4.编写和优化网络爬虫程序,收集和整理训练数据或知识库内容设计和优化Prompt模板,提升LLM在特定场景下的表现
5.协助构建和维护Agent系统的数据流转机制,确保数据管道的稳定性和可靠性参与技术文档编写和知识分享
职位要求:
1.本科及以上学历,硕士优先;国内985/211高校或海外高校背景优先
2.熟练掌握Python编程,能够编写清晰、高效且可维护的代码
3.熟悉至少一种主流数据库(MySQL、MongoDB、Redis等)
4.具备数据ETL基础经验,能独立完成数据清洗、转换与加载任务,对数据质量有敏感性
5.对GPT等大语言模型有深入了解,具备prompt engineering实践经验
6.了解RAG(检索增强生成)技术原理和应用场景