工作职责:
-负责多模态数据解析、知识加工、RAG等算法的实现,针对落地场景中遇到的实际问题进行算法改进与效果提升
-负责大模型(语言模型、多模态模型、CV大模型等)后预训练/微调/对齐等场景的数据工程;根据项目需求,研发训练数据处理的算子和Pipeline,以用于模型的训练和效果验证
-作为大模型技术专家,为ToB企业提供大模型服务,尤其是与数据相关的行业know-how
-对前沿技术和需求敏锐洞察,通过技术创新推动产品成长
任职要求:
-计算机视觉CV/自然语言处理NLP相关专业。有相关算法及项目经验,对大模型训练Pipline熟悉的优先;有数据清洗、挖掘、合成等相关经验的优先;对大模型后训练(SFT等)过程了解的优先
- 熟悉计算机视觉/自然语言处理相关算法,对深度学习算法有深刻理解,有过顶会论文发表,参加过CV/NLP领域有影响力的竞赛并取得较好名次优先
-熟悉主流深度学习框架,编程能力强(Python、C++)
-有大数据处理经验,熟悉Spark,Ray等分布式工具优先