加入我们

SRE运维开发工程师(J73254)

申请职位
| 社会招聘 | 北京市
发布时间:2024-06-18

工作职责:

-负责金融联合建模产品各类在线服务和自动化工具开发,保障服务可靠、稳定、高效运行,保障服务稳定性和数据质量,保障产品SLA
-基于百度已有基础设施设计金融联合建模相关在线服务稳定性解决方案,包括预防、止损、降级、容量管理、弹性部署、故障分析、流量分配、性能调优等方案
-参与金融联合建模产品各类在线服务和各类模型产品部署运行架构设计,主导服务可靠性相关自动化系统的实现,满足严格的质量与效率要求
-利用百度已有基础设施和开源技术设计和实施产品监控系统、容灾策略和灾难恢复预案,响应和处理生产环境中的紧急事件,最小化服务中断
-关注业界前沿技术动态,负责大规模机器学习模型在线预测系统优化,演进和新接入技术探索和应用

任职要求:

-全日制本科以上,专业不限,包含不仅限于计算机、通信、网络、安全等专业
-至少3年以上以上大型互联网公司或者公有云SAAS服务工作经验,有服务稳定性建设和数据质量建设经验优先
-深入理解Linux操作系统,具备较好的计算机网络和体系结构基础
-熟练掌握Java/Python/Shell等至少一种主流编程语言,能够使用脚本语言开发自动化任务
-熟悉Kubernetes/Docker/Chart/Prometheus/Grafana等云原生相关技术,有实际开发解决问题经验
-良好的逻辑思维和分析能力,热衷于解决问题、追求极致
-强烈的责任心、进取心、团队合作精神和Ownership