基础信息

所属部门:

淘天集团

学历:

硕士

工作年限:

2 年

职位描述

1. 负责将多模态大模型技术整合到小蜜智能问答系统中，不断提升系统的智能化水平和用户体验； 2. 研究并应用最新的多模态理解技术，如图像识别、自然语言处理和语音识别等，以实现系统对各种类型输入的处理能力，或将图像生成能力用于离线知识生产和实时问答； 3. 深入挖掘商品的图片、视频、文本介绍等各个模态中包含的有价值信息，理解并提炼商品问答知识； 4. 与数据科学团队合作，设计和实施模型训练策略，针对特定领域，进行多模态模型prompt设计和调优； 5. 深入跟踪调研多模态/NLP/CV等方向的前沿技术相关内容，包括文生图、图生文等。

职位要求

1. 计算机科学相关专业（人工智能、计算机科学、电子信息工程、数学等）硕士及以上学历； 2. 有智能客服、多模态大模型、CV等背景和工作经验的，或在相关领域国际顶会发表过论文者优先； 3. 扎实的技术背景：对基于图像、视频、语音、文本等模态内容的各类算法算法有一定的理解，包括不限于图像/视频理解、图片分类、检测、分割、OCR、图像视频生成等；了解VLLM/ViT/GAN/Diffusion等主流图像模型架构，有相关的实践或研究经验，较强的论文阅读和复现的能力，独立问题分析和解决能力； 4. 熟练掌握机器学习/深度学习的基本方法，具有一定的独立问题分析和解决能力，对解决具有挑战性问题能够充满热情； 5. 熟练掌握Java/C++/python 中至少一门语言，具有扎实的数据结构功底，能够独立完成算法模块设计开发和测试。

保存申请

举报职位

淘宝平台事业部-多模态算法工程师(VLLM/CV/LLM)-商家智能服务