工作职责:
-设计并实现基于大语言模型(LLM)和 RAG 架构的 AI 应用系统,涵盖知识问答、智能对话、Agent 应用等场景
-负责从数据解析、文本切分、embedding、向量化存储到召回与生成的全链路能力建设
-深度参与向量检索引擎的集成与优化
-探索并实现基于思维链(Chain of Thought, CoT)的方法,提升模型复杂任务处理能力
-与产品、算法团队紧密合作,推动 AI 应用从原型到落地部署
-关注业界前沿技术,优化现有系统性能与架构
任职要求:
-本科及以上学历,计算机、人工智能、数据科学等相关专业
-熟悉 RAG 技术栈:文本切分、向量化、索引构建、Prompt 设计等
-理解向量数据的基本原理与应用,具备 embedding、相似度搜索、索引结构(如 HNSW、IVF)等经验
-熟悉思维链(CoT)原理,有多步推理、任务拆解等实践经验
-熟练使用 Python,有 LangChain、Transformers、LlamaIndex、Faiss 等工具经验
-熟悉常见大模型(如 GPT、Qianfan、DeepSeek、Claude、InternLM),并具备调用与落地经验
-有良好的工程实践能力,熟悉 FastAPI / Flask / gRPC 等服务框架
-具备良好的沟通能力和团队协作意识,能够独立推进项目
