Site Reliability Engineer

Palermo 18-07-2025

Site Reliability Engineer

JR Italy Palermo 18-07-2025
Riassunto

Località

Palermo

Divisione Aziendale

Tipo di contratto

Data di pubblicazione

18-07-2025

Descrizione Lavoro

Siamo alla ricerca di un Site Reliability Engineer motivato a contribuire alla scalabilità e all’ottimizzazione di una complessa infrastruttura Cloud in produzione su Azure.Si tratta di un sistema distribuito progettato per raccogliere, gestire e distribuire grosse moli di dati in tempo reale. Include componenti connessi “at the edge” che devono essere in grado di operare in scenari “offline” e garantire “eventual consistency” dei dati. La lingua di lavoro principale è l’inglese, dato che il sistema è utilizzato da clienti internazionali.Il ruolo richiede un forte focus sull’affidabilità, la scalabilità, la sicurezza e la resilienza dell’infrastruttura, con un utilizzo intensivo di Azure Kubernetes Service (AKS) , Azure Database for PostgreSQL , MongoDB Atlas ed Apache Kafka .Il candidato deve inoltre essere disponibile a partecipare alla turnazione on-call, ovviamente remunerata e concordata per essere distribuita equamente nel mese, per la gestione di emergenze e incidenti fuori orario lavorativo standard.Non è necessario avere esperienza approfondita su tutti i tool utilizzati: siamo pronti a offrire formazione tramite corsi e “training on the job” per colmare eventuali lacune e supportare la crescita professionale.Responsabilità principaliMigliorare la resilienza ed ottimizzare il cluster Kubernetes (AKS su Azure), assicurando performance, scalabilità, sicurezza ed alta affidabilità dei servizi deployatiConfigurare ed ottimizzare i database relazionali (PostgreSQL su Azure) e non relazionali (MongoDB Atlas) per garantire performance, affidabilità e sicurezza dei datiGestire e ottimizzare Apache Kafka (su AKS) per la raccolta e distribuzione di dati in tempo realeAutomatizzare processi operativi per ridurre il “toil” e migliorare l’efficacia dei team (Platform team e Product team)Partecipare alla turnazione on-call per garantire una rapida risposta agli incidenti e alle emergenzeSviluppare pipeline di monitoraggio e alerting per identificare e debuggare rapidamente problemi operativiIdentificare prontamente la “root cause” di problemi bloccanti, sviluppando documentazione tecnica dettagliata ed automazioni per evitare che problemi noti si verifichino nuovamenteCollaborare con il team di sviluppo per il miglioramento continuo del ciclo di vita dello sviluppo software (SDLC), garantendo pratiche solide e coerentiOpportunità di lavorare su infrastrutture cloud-native moderne, resilienti e scalabili, in un contesto di stream processing ed edge computingForte attenzione alla cura delle persone, guidata dai nostri valori aziendali di intraprendenza, curiosità, cura e onestàAmbiente collaborativo e stimolante, “remote friendly” , orientato alla crescita professionale e personale
#J-18808-Ljbffr

Condividi

Come Candidarsi

Per maggiori informazioni e per candidarti, clicca il pulsante.