工作职责:
-技术方案主导:负责千帆私有化项目的方案设计、报价、POC、招投标技术应答;亲自下场跑 POC、调推理参数、出 benchmark
-架构与选型决策:主导算力规格(GPU 型号 / 卡数 / 网络)、模型组合(Base 模型 / 微调 / 蒸馏)、配套组件(向量库、Agent、知识库、推理框架)的私有化选型,对性能、成本、可行性三个维度的承诺负责到签约
-技术深度对接:能与客户算法 / 平台 / 基础架构团队对等技术对话——客户问 vLLM/SGLang 选型、问 RAG 召回率优化、问长上下文方案、问 MoE 推理成本
-AI 工程化沉淀:在政务、非能源央企、教育三大赛道沉淀可复用方案模板,以 skill / prompt / MCP 等可执行形式沉淀(不是 Word),同行业第二单复用率 ≥60%
-跨团队协同:在售前阶段作为研发、交付、产品的对内唯一接口人;签约后向交付完成方案交接
-AI Native 工作方式:以 Dumate / Claude Code / Cursor / 同类 agent harness 为日常工作底座,标书与方案首稿由 agent 起草、人审核;具备客户现场用 agent 现场起草方案 / 竞品对比 / SOW 片段的能力
任职要求:
-本科及以上,计算机 / 软件工程 / AI / 数学 / 物理等技术类专业优先;5 年以上技术工作经验,至少 2 年大模型 / AI 平台 / 分布式系统方向
-必须具备的技术深度(任三项以上熟悉、其中至少一项精通)
-大模型推理与部署:vLLM / SGLang / TensorRT-LLM / TGI 至少一个,能独立调优 throughput / latency / 显存占用;
-微调与对齐:SFT / LoRA / RLHF 流程能跑通,能向客户解释参数与产出影响
-RAG 与 Agent 工程:向量库选型、召回链路设计、Function Calling / MCP 接入
-算力与基础设施:NVIDIA / 国产卡(昆仑、昇腾、海光、寒武纪等)至少熟悉一种,了解集群组网、容器化部署
-大模型平台产品工程经验:千帆 / 百炼 / 火山方舟 / 盘古中至少一个的产品体系熟悉
-代码能力:Python 熟练,能独立写 demo、读懂开源模型代码、改 prompt 工程脚本;面试会有现场 coding 环节
-熟练使用 Dumate / Claude Code / Cursor / 同类 agent harness,面试会要求现场用 agent 起草标书段落 + 跑一个最小 RAG / Agent demo
-沟通能力优秀,能与客户 CIO / 算法负责人 / 基础架构团队对等对话
