加入我们

多模态大模型算法工程师(J97347)

申请职位
| 社会招聘 | 北京市,上海市
发布时间:2026-05-01

工作职责:

-大模型落地与演进: 主导多模态大语言模型(MLLM/VLM)在垂直业务场景的落地。负责构建从数据合成、SFT 到 RLHF 的自动化演进闭环,解决长尾场景下的模型泛化与持续迭代难题
-前沿感知算法攻坚: 负责视频动作识别、时空行为分析及具身感知等核心算法的预研与突破。结合业务痛点,提升智能体在复杂物理环境中的理解与决策能力,刷新业务 SOTA
-极致工程化与部署: 负责算法模型在**端侧(Edge)**与云端的高性能部署。通过算子优化、模型量化及异构计算适配(TensorRT/NPU),打造高吞吐、低延迟的推理引擎,支撑产品规模化商用
-技术沉淀与影响力: 负责关键技术难点的攻关与复盘,沉淀通用算法资产与行业解决方案。通过高质量专利、技术白皮书及顶会论文,推动技术标准建设,提升团队行业影响力

任职要求:

-基础素质: 计算机、自动化或相关专业硕士及以上学历,3 年以上 AI 算法研发与落地经验
-编程能力: 具备扎实的 Python/C++ 编程基础,熟练掌握 PyTorch/TensorFlow 等深度学习框架,具备优秀的系统设计与代码工程能力
-深刻理解 Transformer 架构,有 VLM (如 LLaVA/GPT-4V)、视频理解或动作识别相关项目的全流程研发经验
-具备极强的问题解决能力(Problem Solving)和自驱力,对**数据闭环(Data-Centric AI)**有深刻认知,善于在资源受限条件下寻求最优解