Job Description
Lo que harás en el día a día
- Desarrollar y optimizar pipelines de datos en Scala, Python o PySpark, ejecutando procesos en Spark o Databricks, garantizando rendimiento, calidad y escalabilidad.
- Diseñar y construir arquitecturas de Data Lake y Data Warehouse en entornos Cloud (Azure, AWS o GCP).
- Transformar datos a gran escala mediante Spark, aplicando buenas prácticas de procesamiento distribuido.
- Optimizar queries y almacenamiento en Databricks, asegurando eficiencia en el consumo de datos y reducción de costos.
- Integrar múltiples fuentes de datos, garantizando su calidad, consistencia y trazabilidad.
- Colaborar con equipos multidisciplinares, impulsando la mejora continua en procesos de ingesta, transformación y explotación de datos.
- Sólida experiencia en desarrollo con Scala, Python o PySpark sobre Spark para procesamiento distribuido.
- Experiencia con Databricks y cono...
Ready to Apply?
Take the next step in your AI career. Submit your application to Bluetab, an IBM today.
Submit Application