工作职责:
-负责小度多模态大模型的结构设计、预训练任务、模型训练和推理验证等工作,包括但不限于多模态预训练、跨模态生成与检索、多模态对话等业务应用
-跟踪多模态大模型方向前沿问题的研究
-参与建设并持续保持部门多模态技术在业界的技术先进性,保持创新的同时将业界SOTA模型在小度业务场景进行产品化落地
-负责的多模态技术涵盖视觉、语音、NLP等多个领域
任职要求:
-本科及以上学历
-对CV、NLP、多模态等相关领域有一定的理解,在其中一个或多个方向有深入的研究经历
-优秀的工程实践能力,熟悉Pytorch/Tensorflow等深度学习框架,掌握大规模并行训练技术
-优秀的分析、解决问题能力,对新技术充满好奇,敢于挑战高难度,善于提出解决方案并快速验证
-有大模型训练经验,熟悉Megatron/Deepspeed等常见大模型训练框架,对ChatGPT, GPT-4, StableDiffusion等大模型有深入研究且有实际训练经验者优先
-在国际会议发表论文者优先,包括但不限于ICLR, CVPR, ICCV, ECCV, ACL NeurIPS, ICML等会议
-实习3个月以上
