工作职责:
职位描述:
-负责大模型训练、对齐相关工作,包括不限于数据迭代、模型训练、模型评估。
-结合实际场景,提供全面的技术解决方案,参与PE、推理优化、数据飞轮建设,提升大模型在应用场景的效果。
-协助开发和优化 Al Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率
-探索并训练高表现力布局生成模型效果,探索前沿的建模方式、训练策路、数据策略,以达到SOTA效果;探索Al能力的极限,并赋能产品以创造价值。
任职要求:
-本科及以上学历,计算机、人工智能、自动化、数学专业优先;
-对大模型的底层原理有基本理解,能跟踪语言模型和多模态领域的最新技术动向;
-扎实的编程基础,对数据结构、算法设计基础有深度了解,熟练掌握Python/C++等主流语言一种或多种,熟练应用pytorch、 megatron、deepspeed、huggingface、transformers等深度学习框架和库;
-具备强大的工程/算法能力,能迅速迁移过往的工程/算法经验,深入理解系统底层原理并进行系统优化,能快速学习新知识;
-有ACM/O/NOI/Top Coder等算法竞赛获奖经历优先;
-深入理解 NLP、CV 等机器学习领域的知识,拥有文本、图像/视频生成或AIGC领域丰富实操经验;
-熟悉大模型相关研究的前沿进展,能快速复现业界最新研究成果,有顶会论文、ACM等编程竞赛获奖者优先。
-责任心强,积极主动,有良好的沟通和合作能力。
