基础信息
所属部门:
淘天集团
学历:
硕士
工作年限:
3 年
职位描述
1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力
2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测;
3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料;
4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力;
5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
职位要求
1. 计算机相关专业本科及以上学历,研究方向为自然语言处理、机器学习、深度学习等相关方向,或者在该领域有相关工作经验,精通Python编程,熟悉Java/C++中至少一门语言
2. 能够从复杂的业务场景中进行问题抽象、算法选型、算法优化以及不断提升效果,有较强的自我驱动力;
3. 了解阅读理解、序列标注、文本生成、文本分类等传统NLP任务,精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发流程
4. 深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChain、AutoGen等Agent开发框架,有完整智能体系统搭建经验者优先
5.有代码生成/知识图谱构建/智能问答系统/图计算等相关项目背景优先
6.了解Deepspeed和Megatron-LM等分布式训练框架,并有一定的多机多卡分布式训练与debug经验优先
7. 在ACL、EMNLP、KDD、SIGIR、ICML、ICLR、NeurlPS等相关顶会有论文发表者优先
举报职位