工作职责:
1. 负责奥创引擎AI模型服务的部署、监控与运维;
2. 搭建模型服务化平台,⽀持外部模型的快速接⼊与版本管理;
3. 监控模型调⽤性能、资源使⽤与成本,设计⾃动化告警与扩缩容策略;
4. 管理GPU/CPU资源,优化推理效率与成本控制;
5. 构建CI/CD流⽔线,⽀持算法模型的快速迭代与发布。
任职资格:
1.本科及以上学历,计算机、运维相关专业,3年以上运维或MLOps经验;
2.熟悉Docker/K8s,有云上AI平台运维经验;
3.了解模型部署⼯具(如Triton、TensorFlow Serving);
4.掌握监控⼯具(Prometheus/Grafana),具备脚本开发能⼒;
5.具备良好的系统稳定性意识与故障排查能⼒。