Senior Site Reliability Engineer (m/f/d)

Senior Site Reliability Engineer (m/f/d)

Berlin Vollzeit 65000 - 85000 € / Jahr (geschätzt) Homeoffice (teilweise)
F

Auf einen Blick

  • Aufgaben: Übernehme die Verantwortung für die Zuverlässigkeit unserer Plattform und leite technische Entscheidungen.
  • Unternehmen: Flip, die führende KI-gestützte Plattform für Mitarbeitererfahrungen.
  • Vorteile: Flexibles Arbeiten, E-Gym-Wellpass, Jobrad-Leasing und regelmäßige Teamevents.
  • Weitere Informationen: Remote-first Kultur mit Möglichkeiten zur persönlichen Zusammenarbeit.
  • Warum dieser Job: Gestalte die Zukunft der Arbeit für Frontmitarbeiter und mache echten Einfluss.
  • Qualifikationen: Mindestens 5 Jahre Erfahrung in SRE oder verwandten Bereichen, starke Kubernetes-Kenntnisse.

Das prognostizierte Gehalt liegt zwischen 65000 - 85000 € pro Jahr.

Unsere Mission ist es, die weltweit am häufigsten genutzte KI-Plattform für Mitarbeitererfahrungen zu sein, indem wir die Art und Weise verändern, wie Frontmitarbeiter arbeiten. Flip ist die führende KI-gestützte Plattform für Mitarbeitererfahrungen für Frontmitarbeiter. Wir transformieren, wie die Menschen, die die Welt am Laufen halten – im Einzelhandel, in der Fertigung und in der Logistik – ihre Arbeit erledigen. Eine App. Ein Touch. Alles, was sie brauchen.

Als Senior Site Reliability Engineer in unserem Platform Squad sind Sie verantwortlich für kritische Zuverlässigkeitsbereiche von Anfang bis Ende und treiben die technische Richtung innerhalb des Squads voran - führen architektonische Entscheidungen auf unserer Plattform, betreuen Teamkollegen und heben kontinuierlich die Zuverlässigkeitsstandards innerhalb des Teams an. Diese Rolle ist für einen Ingenieur mit nachweislicher Erfahrung im Aufbau und Betrieb von hochdurchsatzfähigen, hochverfügbaren Systemen gedacht, der eine senior-level technische Verantwortung und echten Einfluss durch tiefgehende Ingenieurtätigkeiten innerhalb eines kompakten, gut definierten Teams wünscht.

Was Sie bei uns erwartet:

  • Co-own the architecture: Helfen Sie, die Architektur und Evolution unserer Cloud-Infrastruktur auf Azure und unsere Kubernetes-Cluster zu gestalten - entworfen für hohen Durchsatz und höchste Verfügbarkeit - um das schnelle Wachstum von Flip weltweit zu unterstützen.
  • Drive the resilience strategy: Definieren Sie, wie wir globales Scaling, Zero-Downtime-Deployments, Rollback-Mechanismen und Notfallwiederherstellung angehen, und stellen Sie sicher, dass die Plattform rund um die Uhr verfügbar bleibt.
  • Evolve our observability stack: Verbessern Sie unseren LGTM-Stack (Loki, Grafana, Tempo, Mimir) zu einer Grundlage, der unsere Ingenieure vertrauen können.
  • Improve our IaC Platform: Beseitigen Sie unnötige Arbeiten an der Quelle und machen Sie unsere Infrastruktur wirklich selbstbedienbar für Ingenieurteams.
  • Lead in incidents: Übernehmen Sie eine führende Rolle bei plattformbezogenen größeren Vorfällen, leiten Sie fehlerfreie Nachbesprechungen für das Squad und übersetzen Sie Erkenntnisse in systematische Verbesserungen.
  • Mentor within the squad: Coachen Sie Teamkollegen, führen Sie RFCs und Design-Reviews innerhalb des Teams durch und helfen Sie Ingenieuren, stärkere SREs zu werden.
  • Shape our roadmap: Arbeiten Sie mit Ihrem Squad zusammen, um die Richtung der Plattform zu definieren.

Was Sie mitbringen:

  • Mindestens 5 Jahre praktische Erfahrung als Site Reliability Engineer (SRE), Platform Engineer, DevOps Engineer, Infrastructure Engineer, Cloud Engineer oder Backend Engineer mit starkem Fokus auf Infrastruktur.
  • Nachweisliche Erfahrung im Aufbau und Betrieb von hochdurchsatzfähigen, hochverfügbaren Systemen in der Produktion.
  • Tiefe, produktionsrelevante Erfahrung mit Kubernetes auf jedem Hyperscaler.
  • Starke Erfahrung mit modernen Observability-Stacks (z.B. Prometheus, Mimir, VictoriaMetrics, Dash0, Loki, ELK) und eine klare Sichtweise auf SLIs, SLOs und Fehlerbudgets.
  • Solide Softwareentwicklungsfähigkeiten in Go (stark bevorzugt, da unsere IaC auf Pulumi in Go läuft) oder Python.
  • Praktische Erfahrung mit Infrastructure as Code (Pulumi, OpenTofu, Terraform) und GitOps (z.B. ArgoCD) + CI/CD-Pipeline-Design.
  • Nachgewiesene Fähigkeit, komplexe Infrastrukturinitiativen vom Design bis zur Produktion zu leiten - einschließlich Schreiben von RFCs und Führen von Architekturentscheidungen innerhalb Ihres Teams.
  • Erfahrung in der Betreuung von Ingenieuren und der Erhöhung des technischen Niveaus innerhalb eines Teams.
  • Komfortabel im Umgang mit größeren Vorfällen von Anfang bis Ende und in der Umsetzung von Erkenntnissen in systematische Veränderungen.
  • Starke Kommunikationsfähigkeiten und geschäftsfließendes Englisch.
  • Bereitschaft zur Teilnahme an Bereitschaftsdiensten, um die Zuverlässigkeit unserer Plattform sicherzustellen.

Nice-to-Have Qualifikationen:

  • Produktionstaugliche API-Gateways mit Gateway API (z.B. Envoy Gateway) implementiert.
  • Multi-Cluster-Service-Meshes (z.B. Cilium, Linkerd, Istio) betrieben.
  • Kubernetes Operators (z.B. Strimzi, CNPG) bereitgestellt und gewartet.
  • Hochverfügbares PostgreSQL in der Produktion betrieben.

Was wir Ihnen bieten:

  • Arbeitsmodus: Wir sind remote-first und geben Ihnen die Flexibilität, von zu Hause aus zu arbeiten. Gleichzeitig schätzen wir die Kraft der persönlichen Zusammenarbeit. Je nach Rolle nehmen Sie an gelegentlichen Teamevents, Workshops oder Meetings in unseren Büros in Berlin oder Stuttgart teil - immer mit ausreichend Vorankündigung. Das genaue Gleichgewicht wird während Ihres Interviews besprochen.
  • Work-Life-Balance: Wir möchten nicht, dass Sie Wurzeln in Ihrem Schreibtischstuhl schlagen. Deshalb übernehmen wir die Kosten für Ihre E-Gym-Wellpass-Mitgliedschaft und bieten Jobrad-Leasing an.
  • Feiern von Erfolgen: Erwarten Sie hochmotivierte und engagierte Menschen in einer entspannten Arbeitsatmosphäre.
  • Teil von etwas Größerem sein: Sie gestalten Flip aktiv in Ihrer Rolle. Auf dem Weg sind Sie ein Ermöglicher des schnellen Wachstums eines jungen Technologieunternehmens und wachsen in Richtung Ihrer Ziele, Spaß ist garantiert.
  • Happy to be a Flipster: Freuen Sie sich auf regelmäßige Teamevents und Kulturtage, die uns als Flipsters zusammenbringen.
  • Arbeiten im Ausland: Bei Flip können Sie auch im Ausland innerhalb der Europäischen Union arbeiten. Lassen Sie uns im Interview über Remote-Arbeit sprechen.

Bei Flip ist jeder willkommen - unabhängig davon, welches Geschlecht Sie identifizieren oder wie alt Sie sind. Sexuelle Identität, Herkunft, Religion, Weltanschauung und Behinderungen beeinflussen nicht Ihr potenzielles Arbeitsverhältnis bei Flip. Das Wichtigste ist, dass SIE passen!

Senior Site Reliability Engineer (m/f/d) Arbeitgeber: Flip

Flip ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, in einem dynamischen und unterstützenden Umfeld zu arbeiten. Mit einem remote-first Ansatz und flexiblen Arbeitszeiten fördert das Unternehmen eine ausgewogene Work-Life-Balance und bietet zahlreiche Möglichkeiten zur persönlichen und beruflichen Weiterentwicklung. Die offene und inklusive Unternehmenskultur sowie regelmäßige Team-Events sorgen dafür, dass sich alle Mitarbeiter als Teil einer größeren Gemeinschaft fühlen und aktiv zur rasanten Wachstumsphase von Flip beitragen können.

F

Kontaktdaten:

Flip Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior Site Reliability Engineer (m/f/d) erhalten könnten

Tipp Nummer 1

Sei proaktiv! Nutze LinkedIn und andere Netzwerke, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Informationen über die Unternehmenskultur oder aktuelle Projekte – das zeigt dein Interesse und kann dir wertvolle Einblicke geben.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe typische Fragen zu Kubernetes, Cloud-Architekturen und Observability-Tools. Wir bei StudySmarter wissen, dass praktische Fähigkeiten entscheidend sind, also sei bereit, dein Wissen in realen Szenarien zu demonstrieren.

Tipp Nummer 3

Zeige deine Leidenschaft für das, was du tust! Teile in Gesprächen Beispiele von Projekten, an denen du gearbeitet hast, und wie du Herausforderungen gemeistert hast. Das hilft uns, deine Motivation und deinen Beitrag zum Team besser zu verstehen.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtigen Leute erreicht. Und vergiss nicht, deine Fragen zur Rolle oder zum Team während des Interviews zu stellen – das zeigt, dass du wirklich interessiert bist!

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Site Reliability Engineer (m/f/d) mit Bravour zu bestehen

Kubernetes
Cloud Infrastructure (Azure)
Hochverfügbare Systeme
Observability Stacks (z.B. Prometheus, Mimir, Grafana)
Infrastructure as Code (Pulumi, Terraform)
GitOps (z.B. ArgoCD)
Softwareentwicklung in Go oder Python

Einige Tipps für deine Bewerbung 🫡

Sei authentisch!:Wenn du deine Bewerbung schreibst, sei einfach du selbst. Zeig uns, wer du bist und was dich motiviert, Teil von Flip zu werden. Authentizität kommt immer gut an!

Betone deine Erfahrungen:Stell sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Wir suchen nach jemandem mit einem starken Hintergrund in SRE und Cloud-Technologien – lass uns wissen, was du drauf hast!

Mach es übersichtlich:Halte deine Bewerbung strukturiert und übersichtlich. Verwende klare Absätze und Aufzählungen, um deine Punkte deutlich zu machen. So können wir schnell erkennen, dass du der richtige Kandidat für uns bist.

Bewirb dich über unsere Website:Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell bei uns landet und du die besten Chancen auf eine Rückmeldung hast!

Wie man sich auf ein Vorstellungsgespräch bei Flip vorbereitet

Verstehe die Mission von Flip

Mach dich mit der Mission von Flip vertraut, die darauf abzielt, die Arbeitsweise von Frontline-Mitarbeitern zu revolutionieren. Zeige im Interview, dass du die Bedeutung von Zuverlässigkeit und Skalierbarkeit in der Plattform verstehst und wie deine Erfahrungen dazu passen.

Bereite technische Beispiele vor

Sei bereit, konkrete Beispiele aus deiner bisherigen Arbeit zu teilen, die deine Fähigkeiten als Site Reliability Engineer unter Beweis stellen. Denk an Situationen, in denen du komplexe Infrastrukturprojekte geleitet oder bedeutende Vorfälle erfolgreich gemanagt hast.

Zeige deine Mentoring-Fähigkeiten

Da das Mentoring von Teamkollegen ein wichtiger Teil der Rolle ist, solltest du Beispiele dafür parat haben, wie du andere Ingenieure unterstützt und gefördert hast. Das zeigt, dass du nicht nur technisch versiert bist, sondern auch ein Teamplayer.

Frage nach der Unternehmenskultur

Nutze die Gelegenheit, um mehr über die Unternehmenskultur bei Flip zu erfahren. Stelle Fragen zu Team-Events, der Work-Life-Balance und wie das Unternehmen seine Mitarbeiter unterstützt. Das zeigt dein Interesse an einer langfristigen Zusammenarbeit.