工作职责:
- 负责萝卜快跑出行场景下的大语言模型或视觉大模型的研发和优化,包括但不限于:SFT、prompt工程、知识增强、多模态信息融合等
- 负责模型算法的设计、实现和优化,包括模型选型、特征工程、模型训练、评估和部署等
- 负责大规模数据集的预处理、清洗和特征提取,为模型训练提供高质量的数据
- 深入研究大模型领域的前沿技术,提供创新性的算法支持,助力已有业务的AI原生重构
任职要求:
- 有丰富的深度学习、自然语言处理、计算机视觉等相关领域经验,熟悉大模型算法(大语言模型/视觉大模型开源算法)的设计、开发和优化
- 熟悉大模型推理加速,具备高性能推理部署经验优先
- 有分布式训练(如Deepspeed)或微调框架(如PEFT、LoRA、xtuner等)实战经验优先
- 熟悉在线服务部署、资源调度(如Kubernetes、Docker、GPU调度)者优先
- 具备良好的团队协作和沟通能力,具备强烈的求知欲和学习能力
