工作职责:
工作职责
1. 深入调研百度核心产品,构建用户行为分析框架,量化评估用户满意度关键指标。
2. 聚焦搜索用户体验评估场景,设计LLM能力融合方案,创建自动化的体验评估工具,优化百度搜索用户体验。
3. 基于对LLM业务应用的深入洞察,发现并分析当前模型及机制的主要问题,确定相应的优化方向与迭代路径。
4. 结合对LLM底层技术的理解,制定切实可行的算法优化方案,对模型进行微调后上线应用。
任职要求:
专业背景:计算机、统计、数据科学或者相关专业背景,硕士及以上学历,具备较强的学习能力。
LLM与编程能力:具备扎实的编程能力,熟悉LLM基础原理,了解LLM能力边界,能够基于LLM构建应用示例,有系统化的 Prompt Engineering 经验者优先。
大模型评估经验:熟悉大模型主流评估基准及评估方法,具备构建自动化测评集、设计数据打分标准或开发 AI 辅助评估(LLM-as-a-Judge)工具的相关项目经验。
算法基础:熟悉常用机器学习算法和深度学习算法框架,对前沿技术保持敏锐度。
综合素质:善于沟通,工作积极主动,有主人翁意识,责任心强,具备良好的团队协作能力与承压能力。
学术能力:具有论文书写能力,能够沉淀评估方法论或模型优化经验,辅助完成学术论文的编写及发表。
