基础信息
所属部门:
淘天集团
学历:
硕士
工作年限:
2 年
职位描述
1. 负责将多模态大模型技术整合到小蜜智能问答系统中,不断提升系统的智能化水平和用户体验;
2. 研究并应用最新的多模态理解技术,如图像识别、自然语言处理和语音识别等,以实现系统对各种类型输入的处理能力,或将图像生成能力用于离线知识生产和实时问答;
3. 深入挖掘商品的图片、视频、文本介绍等各个模态中包含的有价值信息,理解并提炼商品问答知识;
4. 与数据科学团队合作,设计和实施模型训练策略,针对特定领域,进行多模态模型prompt设计和调优;
5. 深入跟踪调研多模态/NLP/CV等方向的前沿技术相关内容,包括文生图、图生文等。
职位要求
1. 计算机科学相关专业(人工智能、计算机科学、电子信息工程、数学等)硕士及以上学历;
2. 有智能客服、多模态大模型、CV等背景和工作经验的,或在相关领域国际顶会发表过论文者优先;
3. 扎实的技术背景:对基于图像、视频、语音、文本等模态内容的各类算法算法有一定的理解,包括不限于图像/视频理解、图片分类、 检测、分割、OCR、图像视频生成等;了解VLLM/ViT/GAN/Diffusion等主流图像模型架构,有相关的实践或研究经验,较强的论文阅读和复现的能力,独立问题分析和解决能力;
4. 熟练掌握机器学习/深度学习的基本方法,具有一定的独立问题分析和解决能力,对解决具有挑战性问题能够充满热情;
5. 熟练掌握Java/C++/python 中至少一门语言,具有扎实的数据结构功底,能够独立完成算法模块设计开发和测试。
举报职位