Job Description

Buscamos un/a
Site Reliability / Infrastructure Engineer
para participar en la implementación y operación de una plataforma crítica con requerimientos de alta disponibilidad (24/7).

El rol estará enfocado en diseñar, desplegar y mantener una arquitectura tolerante a fallos basada en clústeres de múltiples nodos, replicación de datos y failover automático, garantizando continuidad operativa sin pérdida de información.

La plataforma interactúa con dispositivos físicos y requiere operación ininterrumpida, por lo que se valorará especialmente experiencia en sistemas productivos críticos y entornos on-premise.

Responsabilidades

  • Diseñar, implementar y mantener
    clústeres de alta disponibilidad de múltiples nodos.
  • Configurar mecanismos de failover automático, fencing y recuperación ante fallos.
  • Implementar almacenamiento distribuido con replicación y consistencia fuerte.
  • Administrar bases de datos replicadas
    (MariaDB/...

Ready to Apply?

Take the next step in your AI career. Submit your application to HitOcean today.

Submit Application