Job Description
Buscamos un/a
Site Reliability / Infrastructure Engineer
para participar en la implementación y operación de una plataforma crítica con requerimientos de alta disponibilidad (24/7).
El rol estará enfocado en diseñar, desplegar y mantener una arquitectura tolerante a fallos basada en clústeres de múltiples nodos, replicación de datos y failover automático, garantizando continuidad operativa sin pérdida de información.
La plataforma interactúa con dispositivos físicos y requiere operación ininterrumpida, por lo que se valorará especialmente experiencia en sistemas productivos críticos y entornos on-premise.
Responsabilidades
- Diseñar, implementar y mantener
clústeres de alta disponibilidad de múltiples nodos. - Configurar mecanismos de failover automático, fencing y recuperación ante fallos.
- Implementar almacenamiento distribuido con replicación y consistencia fuerte.
- Administrar bases de datos replicadas
(MariaDB/...
Ready to Apply?
Take the next step in your AI career. Submit your application to HitOcean today.
Submit Application