Middle/Senior Site Reliability Engineer
Siamo alla ricerca di Sistemisti IT in grado di garantire affidabilità e uptime dei servizi critici attraverso observability avanzata e automazione dei processi operativi.
Stack Tecnologico di riferimento
- Core Observability: Prometheus, Grafana (Custom Dashboards & Metrics)
- APM & Tracing: Dynatrace, Datadog
- Automation & Coding: Python (Advanced), Shell/Bash Scripting
- System & Cloud (plus): Linux Internals (Systemd, Kernel tuning), AWS/Azure/GCP, TCP/IP Networking
- Incident Management (plus): PagerDuty/OpsGenie, Jira Service Management
Responsabilità Chiave
- Observability Architecture: Progettare e manutenere l’intero stack di monitoraggio, definendo SLI, SLO e Error Budgets
- Incident Response: Gestire incidenti critici e condurre Blameless Post-Mortems per prevenire ricorrenze
- Toil Reduction: Sviluppare script e tool in Python per automatizzare task manuali ripetitivi e auto-remediation
- Capacity Planning: Analizzare i trend di utilizzo delle risorse (CPU, RAM, I/O) per prevedere le necessità infrastrutturali
Cosa ti offriamo?
- CCNL Metalmeccanico Confapi;
- Ambiente di lavoro giovane e stimolante;
- Pacchetto Welfare (Ticket Restaurant 7€, Hiring Bonus, Assicurazione medico-sanitaria, Ticket Compliments).
- Piani di crescita e sviluppo formativo;
Rextart non è solo lavoro: organizziamo periodicamente eventi e feste aziendali, attività di team building e tanto altro ancora…
Sede di assunzione: Roma/Milano/Torino
Modalità di lavoro: Hybrid
Il presente annuncio è rivolto ad entrambi i sessi, ai sensi delle leggi 903/77 e 125/91, e a persone di tutte le età e tutte le nazionalità, ai sensi dei decreti legislativi 215/03 e 216/03.
Inviare CV a recruitment@rextart.com