Senior Site Reliability Engineer (m/f/d)

Senior Site Reliability Engineer (m/f/d)

Vollzeit 60000 - 80000 € / Jahr (geschätzt) Homeoffice (teilweise)
J

Auf einen Blick

  • Aufgaben: Gestalte und skaliere die Infrastruktur einer modernen KI-Plattform für globale Nutzer.
  • Unternehmen: Innovatives Unternehmen mit einem kollaborativen und wachstumsorientierten Umfeld.
  • Vorteile: Flexibles Arbeiten, Wellness-Programme und starke persönliche Entwicklungsmöglichkeiten.
  • Weitere Informationen: Hohe Auswirkungen auf die Systemzuverlässigkeit und Teamfähigkeiten in einem schnell wachsenden Tech-Umfeld.
  • Warum dieser Job: Sei Teil eines dynamischen Teams und forme die Zukunft der Cloud-Infrastruktur.
  • Qualifikationen: Mindestens 5 Jahre Erfahrung in Site Reliability Engineering oder ähnlichen Bereichen.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wir suchen derzeit einen Senior Site Reliability Engineer (m/w/d) in Deutschland. Diese Rolle bietet die Möglichkeit, die Infrastruktur einer modernen, KI-gesteuerten Plattform zu gestalten und zu skalieren, die von Frontmitarbeitern in verschiedenen Branchen weltweit genutzt wird. Als Teil eines hochgradig kollaborativen Platform Squad übernehmen Sie die Verantwortung für kritische Zuverlässigkeits- und Skalierbarkeitsinitiativen und treffen architektonische Entscheidungen, die sich direkt auf die Systemresilienz und -leistung auswirken.

Sie werden an hochdurchsatzfähigen, cloud-nativen Umgebungen arbeiten, die auf Kubernetes und modernen Observability-Stacks basieren, und den Ingenieurteams helfen, effizienter und sicherer zu arbeiten. Die Position kombiniert technische Führungsverantwortung mit Mentoring-Aufgaben, was sie ideal für erfahrene Ingenieure macht, die komplexe Infrastrukturherausforderungen lösen und gleichzeitig die Fähigkeiten des Teams verbessern möchten. Sie spielen eine Schlüsselrolle bei der Definition von Plattform-Zuverlässigkeitsstandards, der Verbesserung der operativen Exzellenz und der Ermöglichung globaler Skalierbarkeit in einem schnell wachsenden Technologieumfeld. Dies ist eine hochwirksame Gelegenheit für Ingenieure, die leidenschaftlich an Automatisierung, verteilten Systemen und cloud-nativer Infrastruktur interessiert sind.

Verantwortlichkeiten:

  • Führen Sie die Architektur und Entwicklung skalierbarer Cloud-Infrastrukturen und Kubernetes-Umgebungen, die für hohe Verfügbarkeit und globales Wachstum ausgelegt sind.
  • Definieren und implementieren Sie Plattform-Zuverlässigkeitsstrategien, einschließlich Zero-Downtime-Bereitstellungen, Notfallwiederherstellung, Rollback-Mechanismen und Resilienzverbesserungen.
  • Verbessern und pflegen Sie Observability-Systeme, Überwachungsrahmen und Telemetrieinfrastrukturen zur Unterstützung der operativen Exzellenz und Systemtransparenz.
  • Bauen und optimieren Sie Infrastructure as Code und Self-Service-Plattformfähigkeiten, um den operativen Aufwand zu reduzieren und die Entwicklererfahrung zu verbessern.
  • Leiten Sie plattformbezogene Vorfallreaktionsaktivitäten, führen Sie schuldlose Nachbesprechungen durch und implementieren Sie langfristige systemische Verbesserungen.
  • Arbeiten Sie eng mit Ingenieurteams zusammen, um technische Fahrpläne, Architekturstandards und skalierbare Betriebspraktiken zu definieren.
  • Mentorieren und unterstützen Sie Teamkollegen durch technische Anleitung, Designüberprüfungen und Wissensaustauschinitiativen.
  • Fördern Sie kontinuierliche Verbesserungen in CI/CD-Pipelines, GitOps-Workflows, Automatisierungsstrategien und cloud-nativen Infrastrukturoperationen.

Anforderungen:

  • 5+ Jahre praktische Erfahrung in Site Reliability Engineering, Platform Engineering, DevOps, Cloud Infrastructure oder ähnlichen infrastrukturfokussierten Ingenieurrollen.
  • Nachgewiesene Expertise im Betrieb und der Skalierung von hochdurchsatzfähigen, hochverfügbaren Produktionssystemen.
  • Tiefe praktische Erfahrung mit Kubernetes in Cloud-Umgebungen wie Azure, AWS oder GCP.
  • Starkes Verständnis von Observability-Konzepten, einschließlich Monitoring, SLIs, SLOs, Fehlerbudgets, Logging und verteiltem Tracing.
  • Kenntnisse in Go oder Python sowie starke Softwareentwicklungs- und Automatisierungsfähigkeiten.
  • Erfahrung mit Infrastructure as Code-Tools wie Pulumi, Terraform oder OpenTofu sowie GitOps-Workflows und CI/CD-Automatisierung.
  • Starkes Wissen über cloud-native Technologien, verteilte Systeme und bewährte Verfahren im Bereich Zuverlässigkeitsengineering.
  • Nachgewiesene Erfahrung in der Leitung von Infrastrukturinitiativen, dem Schreiben technischer Vorschläge und dem Treffen von Architekturentscheidungen.
  • Starke Kommunikationsfähigkeiten mit der Fähigkeit, effektiv mit technischen Teams und Stakeholdern zusammenzuarbeiten.
  • Bereitschaft zur Teilnahme an Bereitschaftsdiensten und zum Management kritischer Produktionsvorfälle.
  • Zusätzliche Erfahrung mit Service-Meshes, API-Gateways, Kubernetes-Operatoren oder hochverfügbaren PostgreSQL-Umgebungen wird als Vorteil angesehen.

Vorteile:

  • Remote-first Arbeitsumgebung mit Flexibilität, von zu Hause aus an berechtigten Standorten zu arbeiten.
  • Gelegenheiten zur persönlichen Zusammenarbeit durch Teamevents, Workshops und Bürogemeinschaften.
  • Flexible Arbeitsarrangements, die eine starke Work-Life-Balance unterstützen.
  • Wellness- und Lifestyle-Vorteile, einschließlich Fitnessmitgliedschaften und Fahrradleasingprogrammen.
  • Inklusive, kollaborative und wachstumsorientierte Unternehmenskultur.
  • Die Möglichkeit, direkt zur Skalierung einer schnell wachsenden internationalen Technologieplattform beizutragen.
  • Zugang zu regelmäßigen Teamevents, Kulturinitiativen und Unternehmensversammlungen.
  • Möglichkeit, je nach Teamvereinbarungen remote von Standorten innerhalb der Europäischen Union zu arbeiten.
  • Starker Fokus auf persönliche Entwicklung, Eigenverantwortung und langfristiges Karrierewachstum.

Senior Site Reliability Engineer (m/f/d) Arbeitgeber: Jobgether

Als Arbeitgeber bieten wir eine flexible, remote-first Arbeitsumgebung, die es Ihnen ermöglicht, von überall in der EU zu arbeiten. Unsere inklusive und wachstumsorientierte Unternehmenskultur fördert persönliche Entwicklung und Teamzusammenhalt durch regelmäßige Veranstaltungen und Workshops. Zudem haben Sie die Möglichkeit, an spannenden Infrastrukturprojekten zu arbeiten und Ihre technischen Fähigkeiten in einem dynamischen, internationalen Umfeld weiterzuentwickeln.

J

Kontaktdaten:

Jobgether Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior Site Reliability Engineer (m/f/d) erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen Fachleuten in Kontakt zu treten. Teile deine Erfahrungen und suche nach Mentoren, die dir helfen können, deinen Fuß in die Tür zu bekommen.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe typische Fragen zu Kubernetes, Cloud-Infrastruktur und Automatisierung. Wir empfehlen, Mock-Interviews mit Freunden oder Kollegen durchzuführen, um dein Selbstvertrauen zu stärken.

Tipp Nummer 3

Zeige deine Leidenschaft für das, was du tust! Sprich über Projekte, an denen du gearbeitet hast, und wie du Herausforderungen gemeistert hast. Arbeitgeber suchen nach Menschen, die wirklich für ihre Arbeit brennen.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! So stellst du sicher, dass deine Bewerbung schnell und effizient bearbeitet wird. Außerdem kannst du sicher sein, dass du alle Vorteile unserer Plattform nutzt.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Site Reliability Engineer (m/f/d) mit Bravour zu bestehen

Site Reliability Engineering
Plattform Engineering
DevOps
Cloud Infrastructure
Kubernetes
Observability
Monitoring

Einige Tipps für deine Bewerbung 🫡

Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach echten Persönlichkeiten, die zu unserem Team passen und ihre Leidenschaft für Technologie und Infrastruktur teilen.

Betone deine Erfahrungen:Stell sicher, dass du deine relevanten Erfahrungen im Bereich Site Reliability Engineering oder ähnlichen Rollen klar hervorhebst. Zeig uns, wie du komplexe Herausforderungen gemeistert hast und welche Technologien du beherrschst – das wird uns helfen, dich besser einzuschätzen.

Mach es übersichtlich:Achte darauf, dass deine Bewerbung gut strukturiert und leicht zu lesen ist. Verwende klare Absätze und Aufzählungen, um deine Fähigkeiten und Erfolge hervorzuheben. So können wir schnell die wichtigsten Informationen erfassen.

Bewirb dich über unsere Website:Wir empfehlen dir, dich direkt über unsere Website zu bewerben. Das macht den Prozess für uns einfacher und schneller, und du kannst sicher sein, dass deine Bewerbung direkt an die richtigen Leute gelangt.

Wie man sich auf ein Vorstellungsgespräch bei Jobgether vorbereitet

Verstehe die Rolle und das Unternehmen

Mach dich mit den spezifischen Anforderungen der Position als Senior Site Reliability Engineer vertraut. Informiere dich über die Technologien, die das Unternehmen verwendet, wie Kubernetes und Cloud-Umgebungen. Zeige im Interview, dass du die Herausforderungen und Ziele des Unternehmens verstehst.

Bereite technische Beispiele vor

Sei bereit, konkrete Beispiele aus deiner bisherigen Erfahrung zu teilen, die deine Fähigkeiten in der Systemzuverlässigkeit und Skalierbarkeit demonstrieren. Erkläre, wie du in der Vergangenheit Probleme gelöst hast und welche Tools oder Strategien du eingesetzt hast, um die Betriebsabläufe zu optimieren.

Fragen stellen ist wichtig

Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Rolle und hilft dir, mehr über die Teamdynamik und die technischen Herausforderungen zu erfahren, mit denen du konfrontiert wirst.

Soft Skills nicht vergessen

Neben deinen technischen Fähigkeiten sind auch deine Kommunikations- und Teamfähigkeiten entscheidend. Sei bereit, darüber zu sprechen, wie du andere unterstützt und mentorst, und wie du in einem kollaborativen Umfeld arbeitest. Das wird dir helfen, dich von anderen Kandidaten abzuheben.