Site Reliability Engineer | Remote

Crossing Hurdles

📍 ciudad de méxico, ciudad de méxico, Mexico

Full-time Redes y sistemas Posted June 04, 2026

Apply Now Similar Jobs

Job Description

Design, implement, and maintain scalable infrastructure using Linux and Kubernetes. 
Monitor system performance using Prometheus and address potential issues proactively. 
Automate operational processes to improve system reliability and efficiency. 
Respond to incidents, perform root cause analysis, and implement improvements. 
Collaborate with development teams to ensure smooth deployments and high availability. 
Create and maintain documentation, runbooks, and operational guidelines. 
Promote best practices in reliability, security, and system performance. 
Requirements  
Strong experience with Linux system administration and troubleshooting. 
Strong expertise in Kubernetes cluster management and orchestration. 
Strong experience using Prometheus for monitoring and alerting. 
Proficiency in scripting languages such as Bash or Python. 
Strong problem-solving and in...
                

Ready to Apply?

Take the next step in your AI career. Submit your application to Crossing Hurdles today.

Submit Application

Job Details

Location

ciudad de méxico, ciudad de méxico, Mexico

Job Type

Full-time