(Senior) Site Reliability Engineer - STACKIT Control Plane (m/w/x)
- Du bringst mehr als 3 Jahre Erfahrung in Site Reliability Engineering, DevOps oder Platform Engineering mit, wobei dein Fokus auf dem Betrieb großer verteilter Systeme in Produktionsumgebungen liegt.
- Du besitzt Expertenwissen über die Interna der Kubernetes Control Plane, einschließlich API Server, Controller Manager, Scheduler und etcd.
- Du beherrschst Go sicher und schreibst produktionsreifen Code, um Automatisierungstools, Kubernetes Operatoren oder Integrations-Code zu entwickeln.
- Du verfügst über fundierte Erfahrung mit Infrastructure as Code und Container-Infrastrukturen sowie tiefgehende Kenntnisse in Linux-Interna (Kernel-Tuning, Memory Management) und Networking (TCP/IP, CNI, Load Balancer, eBPF).
- Du bringst Erfahrung im Betrieb von Datastores (z.B. PostgreSQL, Redis) und Messaging-Systemen (z.B. Kafka, NATS) in skalierbaren Umgebungen mit.
- Du gehst Problemen auf den Grund, um daraus zu lernen, automatisierst dich selbst aus dem Job und verlässt dich nicht auf das Prinzip Hoffnung.
- Du arbeitest eng mit den Entwicklungsteams zusammen, um die "Time-to-Detect" zu verkürzen, indem du unsere Monitoring- und Alerting-Infrastruktur verbesserst und die Einhaltung der SLOs sicherstellst.
- Deine Arbeit ist entscheidend für die kontinuierliche Optimierung der "Time-to-Mitigation"; dies erreichst du durch das Erstellen klarer Playbooks, das Design von Dashboards für First Responder und die Sicherstellung umfassender Telemetriedaten (Logs und Metriken).
- Du agierst als Reliability Consultant für die Entwicklungsteams, vermittelst Wissen über Reliability-Patterns und unterstützt den "Shift Left"-Ansatz, um ein Modell der geteilten Verantwortung zu etablieren.
- Du gestaltest und optimierst Entwicklungsprozesse wie CI/CD-Pipelines, um Progressive-Delivery-Strategien (z. B. Canary Releases und Blue/Green Deployments) zu unterstützen und Updates sicher und risikoarm auszurollen.
- Du analysierst proaktiv die Skalierbarkeit der Control Plane und behebst Engpässe in Bereichen wie Distributed Consensus, Datenbank-Durchsatz und Kernel-Level-Networking.
- Du nimmst an einer vergüteten On-Call-Rotation teil, leitest Incident Responses und moderierst Post-Mortems sowie Root Cause Analysen.
Einleitungstext
Schwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Gleichzeitig agieren wir als unabhängiger Anbieter am externen Markt, um Unternehmen in ganz Europa bei ihrer digitalen Transformation zu unterstützen. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Trage auch du zur digitalen Entscheidungsfreiheit in Europa bei.
Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe.
Deine Aufgaben
Empfohlene Jobs
Inklusionsfachkraft im Inklusionsfachkräftepool für Kitas (m/w/d)
Die katholische Kirche in Stuttgart – mit 12 Gesamtkirchengemeinden und 17 Gemeinden für Katholiken anderer Muttersprache schaffen wir einen Ort für Glaube und Gemeinschaft für Menschen aus aller Wel…
Software-Tester (m/w/d) mit Schwerpunkt SAP®
Denkbar wäre, dass SAP®-Prozesse im Finanz- und Rechnungswesen vollständig automatisiert sind und unsere Kunden sich nie mehr mit lästigen Aufgaben herumschlagen, oder? Auf geht‘s, dann packen wir da…
Technischer Produktdesigner / Zeichner (m/w/d)
Technischer Produktdesigner / Zeichner (m/w/d) Vollzeit Freiburg - Stuttgart - Ulm - München - Nürnberg - Rosenheim 25-5238-UU Bereit für den nächsten Karriereschritt? ibb house of enginee…
Network Security Engineer - Utilities
Are you a skilled Network and Security Engineer looking for your next challenge in a critical infrastructure environment? Join a company with more than 135 years of history as a pioneer in energy, …
Security Analyst 1st Level (m/w/d)
Bei CANCOM erwartet dich ein innovatives, agiles und nachhaltiges Umfeld: Mehr als 5.300 Mitarbeiter arbeiten tagtäglich daran, mit Hilfe moderner IT-Lösungen die Zusammenarbeit und den Austausch in …
Montagemitarbeiter Einzelgeräte (m/w/d) in Stuttgart
Montagemitarbeiter Einzelgeräte (m/w/d) in Stuttgart gesucht! Du willst deinen Beitrag zur Zukunft leisten und hast ein Auge für Details? In Stuttgart bieten wir dir die Gelegenheit, in einem spannen…
Choreleve*in (Akademist*in) im Stimmfach Tenor, Bass, Alt oder Sopran für den Staatsopernchor
Wir sind rund 1.400 Beschäftigte aus mehr als 50 Nationen und mit den Sparten Oper, Ballett und Schauspiel das größte Drei-Sparten-Theater Europas. Mit etwa 1.000 Vorstellungen pro Jahr erreichen wir…
Praktikant*in MB.CHARGE Public Europe & Renewable Charging (Pflicht-Praktikum)
Tätigkeitsbereich: Marketing / Vertrieb / Kommunikation Fachabteilung: MB.CHARGE Public, Europe & Renewable Charging Gesellschaft: Mercedes-Benz AG Standort: Stuttgart Startdatum: 01.10.2…
Oberbauleiter (m/w/d)
Oberbauleiter (m/w/d)24.05.2026 BREMER Süd GmbH Stuttgart Weitere passende Anzeigen: Jobmailer Ihre Merkliste / Mit Klick auf einen Stern in der Trefferliste können Sie sich die Anzeige me…
Personalsachbearbeiter (m/w/d) in Stuttgart
+++ DIREKTVERMITTLUNG in Festanstellung (keine Zeitarbeit) / Vermittlungsgutscheine (AVGS) werden akzeptiert +++ Bei Fragen einfach unverbindlich anrufen: 03048479484 oder einen Rückruf vereinbaren…