Site Reliability Engineer (m/w/d) Schwerpunkt Observability & Security

Site Reliability Engineer (m/w/d) Schwerpunkt Observability & Security

München Vollzeit Kein Homeoffice möglich
M

Für unsere Münchener Direktion suchen wir Dich als
Site Reliability Engineer (m/w/d) Schwerpunkt Observability & Security


Komm in unser 10-köpfiges DevOps-, Netzwerk- und Plattform-Team und unterstütze uns, unsere eingesetzten Technologien State-of-the-Art zu halten und uns in den Bereichen Ausfallsicherheit, Systemtransparenz und Applikationssicherheit voranzubringen! Unser Team entwickelt skalierbare und sichere Lösungen mit einem hohen Automatisierungsgrad für die IT-Anwendungen des Münchener Vereins. Um den sicheren, stabilen und performanten Betrieb unserer modernen Anwendungsumgebung weiter zu optimieren, wollen wir unser Team um Dich erweitern.


Aufgaben

Observability, Systemtransparenz & SLA/SLO-Steuerung

  • End-to-End Monitoring: Du nutzt moderne Observability-Tools, um die Performance, Verfügbarkeit und den Zustand unserer Applikationen im Live-Betrieb transparent zu machen
  • Anomalieerkennung & Security Monitoring: Du nutzt unsere Tools, um unautorisierte Zugriffsversuche, Performance-Einbrüche oder Abweichungen im Plattform-Verhalten frühzeitig, automatisiert und proaktiv zu erkennen
  • Systemzusammenhänge verstehen: Du analysierst die komplexen Abhängigkeiten und Wechselwirkungen zwischen unseren containerisierten Anwendungen, identifizierst Engpässe und beschleunigst die Root Cause Analysis
  • Etablierung von SRE-Metriken: Du unterstützt das Team bei der Definition und Überwachung von SLIs und SLOs zur Sicherung unserer Systemqualität

SRE-driven Security & Automatisierung

  • Sichere Interkonnektivität & Secrets Management: Du sorgst für eine sichere und verschlüsselte Kommunikation zwischen unseren vernetzten Applikationen und automatisierst die sichere Bereitstellung von Zugangsdaten im laufenden Betrieb
  • Plattform-Sicherheit & Guardrails (Security as Code): Du definierst und automatisierst Sicherheitsleitplanken direkt auf Plattform-Ebene
  • Resilienz & Self-Healing: Du konzipierst und implementierst ausfallsichere Muster (z. B. Rate Limiting, Circuit Breaking) und begleitest den Entwurf von automatisierten Recovery-Prozessen

Beratung & Strategie

  • Schnittstellenfunktion (DevSecOps): Du berätst und unterstützt andere (IT-)Teams bei der ausfallsicheren Architektur, dem sicheren Deployment sowie der optimalen Überwachung neuer IT-Systeme

Profil
  • Für uns zählen vor allem Deine Fähigkeiten, nicht Dein Ausbildungshintergrund – wir wissen, dass viele Wege in die IT führen
  • Kenntnisse der folgenden Technologien erleichtern Dir den Einstieg in unser Team. Wenn Du nicht alle mitbringst – kein Problem, wir unterstützen Dich dabei, den Rest zu lernen:
    • SRE- & Security-Fokus: Erfahrung im Bereich Site Reliability Engineering (SRE), DevOps oder in der Systemadministration mit starkem Fokus auf Automatisierung, Plattform-Sicherheit und Systemzuverlässigkeit
    • Observability-Expertise: Praktische Erfahrung mit Monitoring- und APM-Tools, idealerweise Elastic APM und CheckMK
    • Modernes Stack-Verständnis: Fundiertes Verständnis von Container-Orchestrierung (OpenShift/Kubernetes) sowie Java-basierten Laufzeitumgebungen (Quarkus, RedHat EAP)
    • Automatisierung & Infrastructure as Code: Sicherer Umgang mit Versionsverwaltung (Git), Automatisierungs-Tools (Ansible) sowie grundlegendes Verständnis von CI/CD-Pipelines (GitLab CI/CD, Jenkins)
    • Programming/Scripting: Gute Kenntnisse in mindestens einer Programmier- oder Skriptsprache (z. B. Python, Go, Java oder Bash) zur Automatisierung von sich wiederholenden Aufgaben (Toil)
  • Du hast den Anspruch an Dich, proaktiv Verantwortung für Themen zu übernehmen und eigene Ideen erfolgreich mit dem Team umzusetzen
  • Du bist ein Teamplayer, der Lust hat mit seiner Erfahrung und Analysestärke unser DevOps-Team zu bereichern
  • Nicht zuletzt: Neben Deutsch sprichst Du auch fließend Meme und Gif

Wir bieten
  • Team & Arbeitsplatz
    • Unsere teameigene Slushy-Maschine (bevorzugt Waldmeister-Sirup)
    • Ein moderner Arbeitsplatz im Herzen Münchens (5 Minuten vom Hauptbahnhof)
  • Flexibilität & Vergütung
    • Flexibilität durch hybrides Arbeitsmodell mit Homeoffice und Gleitzeit
    • Ausgezeichnete Vergütung inkl. Urlaubs- und Weihnachtsgeld
    • Zahlreiche Sozialleistungen – u.a. JobRad, unsere Betriebskantine, Fahrtkostenzuschuss, betriebliche Altersvorsorge, betriebliche Krankenversicherung, Massageangebote, unsere exklusive Wohnungsbörse und vieles mehr
  • Entwicklung & Verantwortung
    • Eine spannende Aufgabe mit eigenverantwortlicher Aufgabenorganisation im Team
    • Wir ermöglichen einen großen Spielraum für Deine persönliche Entwicklung – unter anderem auch durch den Besuch von Fachkonferenzen

M

Kontaktdaten:

Münchener Verein Versicherungsgruppe Recruiting-Team