Middle/Senior Site Reliability Engineer

Siamo alla ricerca di Sistemisti IT in grado di garantire affidabilità e uptime dei servizi critici attraverso observability avanzata e automazione dei processi operativi.

Stack Tecnologico di riferimento

Core Observability: Prometheus, Grafana (Custom Dashboards & Metrics)
APM & Tracing: Dynatrace, Datadog
Automation & Coding: Python (Advanced), Shell/Bash Scripting
System & Cloud (plus): Linux Internals (Systemd, Kernel tuning), AWS/Azure/GCP, TCP/IP Networking
Incident Management (plus): PagerDuty/OpsGenie, Jira Service Management

Responsabilità Chiave

Observability Architecture: Progettare e manutenere l’intero stack di monitoraggio, definendo SLI, SLO e Error Budgets
Incident Response: Gestire incidenti critici e condurre Blameless Post-Mortems per prevenire ricorrenze
Toil Reduction: Sviluppare script e tool in Python per automatizzare task manuali ripetitivi e auto-remediation
Capacity Planning: Analizzare i trend di utilizzo delle risorse (CPU, RAM, I/O) per prevedere le necessità infrastrutturali

Cosa ti offriamo?

CCNL Metalmeccanico Confapi;
Ambiente di lavoro giovane e stimolante;
Pacchetto Welfare (Ticket Restaurant 7€, Hiring Bonus, Assicurazione medico-sanitaria, Ticket Compliments).
Piani di crescita e sviluppo formativo;

Rextart non è solo lavoro: organizziamo periodicamente eventi e feste aziendali, attività di team building e tanto altro ancora…

Sede di assunzione: Roma/Milano/Torino

Modalità di lavoro: Hybrid

Il presente annuncio è rivolto ad entrambi i sessi, ai sensi delle leggi 903/77 e 125/91, e a persone di tutte le età e tutte le nazionalità, ai sensi dei decreti legislativi 215/03 e 216/03.

Inviare CV a recruitment@rextart.com