DevOps / SRE - Prometheus, Grafana

hace 4 semanas


Municipio de Rincón de los Sauces, Argentina Whitestack A tiempo completo

Resumen Buscamos profesionales con experiencia en monitoreo de infraestructuras cloud para unirse a nuestro equipo. El objetivo principal del cargo es implementar y evolucionar herramientas que permitan un monitoreo automatizado y eficiente, proporcionando la información necesaria para detectar y corregir errores, y así garantizar el funcionamiento óptimo y continuo de nuestras plataformas en la nube. En este rol, tendrás el desafío de asegurar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas, mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores críticos. Formarás parte de un equipo que da soporte a centros de datos de gran escala, esenciales para nuestras aplicaciones e infraestructura crítica. Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú. Responsabilidades Diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud. Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos. Garantizar el correcto funcionamiento de entornos cloud productivos, especialmente basados en tecnologías open-source como Kubernetes y OpenStack. Atender y escalar incidencias críticas de plataforma al equipo de ingeniería senior o desarrollo de productos. Supervisar y administrar entornos de desarrollo y testing. Desarrollar, implementar y operar pipelines y herramientas de CI/CD para supervisión y actualización de imágenes en entornos productivos. Requerimientos Título en Ingeniería Informática, Ingeniería de Sistemas, Computación o carrera afín. Al menos 3 años de experiencia en gestión, monitoreo y optimización de infraestructuras cloud especialmente en tecnologías como Kubernetes y OpenStack en entornos productivos. Experiencia en el diseño e implementación de soluciones de monitoreo y en la gestión de incidentes críticos. Experiencia con herramientas de monitoreo: Prometheus, Grafana , Elasticsearch, Kibana. Experiencia en la administración y operación de clusters Kubernetes. Automatización con Bash y/o Python. Uso y administración de Linux (nivel intermedio) Uso y creación de contenedores con Docker (nivel intermedio). Inglés intermedio (lectura y escritura). Autonomía y disciplina. Capacidad de autoaprendizaje. Pensamiento analítico y conceptual. Orientación al cliente. Habilidad para el trabajo en equipo. Deseables Experiencia en cloud público (AWS, GCP, Azure) o privado (OpenStack). Familiaridad con metodologías ágiles (Scrum, Kanban). Capacidad de adaptar herramientas open-source. Certificaciones en Linux, Kubernetes y/o OpenStack. Contribución o integración de proyectos open-source. Conocimientos básicos de redes (networking). Sobre nosotros Whitestack es una empresa líder en Latinoamérica especializada en soluciones en la nube e infraestructura digital híper‑escalable. Trabajamos con tecnología de código abierto y los más altos estándares de la industria para impulsar la transformación digital en toda la región. Somos un Great Place to Work , donde la innovación, la colaboración y el desarrollo personal son parte de nuestra esencia. ¿Por qué unirte a Whitestack? Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países.⚖️Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito. Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología.Salud primero: Seguro médico privado para ti y tu familia. Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones. Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras. Tecnología en tus manos: Renovamos tu equipo cada 3 años… y es tuyo al finalizar el período Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos. Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo.



  • Municipio de Rincón de los Sauces, Argentina GenIT A tiempo completo

    Una empresa de tecnología busca un Analista de Monitoreo & Observabilidad en Neuquén. El candidato ideal debe tener más de 4 años de experiencia con herramientas de monitoreo como Zabbix y Grafana, así como conocimientos en SRE y DevOps. Ofrecemos un ambiente de trabajo colaborativo, beneficios atractivos como Swiss Medical cubierto al 100% y...


  • Municipio de Rincón de los Sauces, Argentina Talent Connect A tiempo completo

    4 days ago Be among the first 25 applicants Get AI-powered advice on this job and more exclusive features. Overview MLOps / DevOps Engineer (AI/ML & GenAI) | Ubicación: España (Latam Talent). Ubicación: España (remoto o híbrido, desde España). Contrato: Full-time. Idioma: Inglés B2+ (requerido). Requisito: NIE España, o Pasaporte EU, residir o...

  • Analista Devops

    hace 2 semanas


    Municipio de Esquel, Argentina Accusys A tiempo completo

    Accusys Buenos Aires, Buenos Aires Province, Argentina Participar en la definición de arquitecturas para los clientes internos o externos. Diseñar, implementar y optimizar pipelines de CI/CD y otros tipos de automatizaciones, garantizando calidad, escalabilidad y monitoreo continuo en entornos cloud y on-premise. Fomentar el conocimiento compartido y el...

  • Senior DevOps

    hace 3 semanas


    Municipio de Rincón de los Sauces, Argentina EMCD A tiempo completo

    Senior DevOps Engineer We're seeking a Senior DevOps Engineer. You will contribute to building a reliable and automated platform that streamlines delivery across development teams. This is a hands‑on position with real impact on architecture, automation, and platform evolution. We are hiring DevOps engineers to cover Asia, Europe, and Latin America time...


  • Municipio de Esquel, Argentina Capgemini Engineering A tiempo completo

    Site Reliability Engineer (SRE) – Observability Capgemini Engineering is the world leader in engineering services. We bring together a global team of engineers, scientists, and architects to help the world’s most innovative companies unleash potential. Key Responsibilities Implement telemetry (logs, metrics, traces, events) for applications and data...

  • Senior DevOps Engineer

    hace 3 semanas


    Municipio de Rincón de los Sauces, Argentina MOREAN A tiempo completo

    Design and Implement Cloud Infrastructure Architect and deploy scalable cloud infrastructure using Infrastructure as Code (IaC) principles to support our Data Mesh platform. Experience with major cloud providers (AWS/Azure) and modern IaC tools (Terraform, CloudFormation) is essential. Build Automation Pipelines Develop and maintain CI/CD pipelines for data...

  • DevOps Engineer

    hace 2 semanas


    Municipio de Rincón de los Sauces, Argentina Canals A tiempo completo

    Senior DevOps Engineer Remote – Latin America | Full-Time | Canals AI About Canals Canals is a bootstrapped, profitable startup transforming wholesale distribution—a trillion-dollar industry—with AI. Our platform integrates directly with the systems distributors already use, automating tedious workflows and removing failure points in the global...

  • Lead DevOps Engineer

    hace 2 semanas


    Municipio de Rincón de los Sauces, Argentina Search Atlas A tiempo completo

    Lead DevOps Engineer Join to apply for the Lead DevOps Engineer role at Search Atlas. Fully Remote Timezone: GMT+1 or EST/CST Please upload your resume in English Hi, we’re Search Atlas! We’re a rapidly growing SEO software company and full‑service digital agency that helps websites improve their Google performance. From Fortune 500 companies to...


  • Ciudad Autónoma De Buenos Aires, Argentina Werben HR A tiempo completo

    Responsabilidades Provisionar y escalar clústeres AKS/EKS con GPU para inferencia y fine-tuning de modelos, usando módulos Terraform reutilizables. Automatizar CI/CD de aplicaciones y pipelines LLM con GitHub Actions y Azure DevOps, incluyendo tests de seguridad, performance y validación de prompts. Implementar observabilidad de extremo a extremo (traces,...

  • SRE Specialist

    hace 3 semanas


    Municipio de Rincón de los Sauces, Argentina Prex A tiempo completo

    En Prex tenemos como propósito de derribar fronteras financieras y simplificar la vida cotidiana de las personas. Queremos ser la plataforma líder en LATAM donde cada persona pueda resolver todas sus necesidades financieras desde un solo lugar. Para lograrlo, innovamos todos los días y construimos experiencias únicas con impacto real: Más de 4 millones...