Auf einen Blick
- Aufgaben: Gestalte und pflege robuste Infrastruktursysteme für Millionen von Nutzern weltweit.
- Unternehmen: Innovatives Unternehmen mit einem kollaborativen Engineering-Umfeld.
- Vorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und umfassende Gesundheitsleistungen.
- Weitere Informationen: Vollständig remote Arbeit in Europa mit starken Entwicklungsmöglichkeiten.
- Warum dieser Job: Leite spannende Projekte und forme die Infrastrukturstrategie in einem dynamischen Umfeld.
- Qualifikationen: 8-10 Jahre Erfahrung in Site Reliability Engineering oder verwandten Bereichen.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Wir suchen derzeit einen Staff Site Reliability Engineer in Deutschland. Treten Sie einer hochgradig kollaborativen Ingenieurumgebung bei, in der Zuverlässigkeit, Skalierbarkeit und Automatisierung zentral sind, um erstklassige Entwicklererfahrungen in globalem Maßstab zu liefern. In dieser Rolle helfen Sie beim Entwerfen und Warten von resilienten Infrastruktursystemen, die Millionen von Nutzern weltweit unterstützen, während Sie operative Exzellenz über verteilte Cloud-Umgebungen vorantreiben.
Sie arbeiten eng mit Ingenieur- und Infrastrukturteams zusammen, um die Beobachtbarkeit zu verbessern, die Leistung zu optimieren und Automatisierungen zu erstellen, die die betriebliche Komplexität reduzieren. Diese Position bietet die Möglichkeit, Vorfälle zu leiten, Zuverlässigkeitsstandards zu gestalten und die Infrastrukturstrategie innerhalb der Organisation zu beeinflussen. Es ist eine ideale Gelegenheit für einen erfahrenen SRE-Professionellen, der in schnelllebigen Umgebungen gedeiht und gerne komplexe Herausforderungen in verteilten Systemen löst, während er Teams betreut und bewährte Ingenieurpraktiken fördert.
Verantwortlichkeiten:
- Entwerfen und Implementieren umfassender Beobachtungslösungen, einschließlich Monitoring, Logging, Tracing, Dashboards und Alarmsystemen zur Verbesserung der Sichtbarkeit in die Infrastrukturgesundheit und -leistung.
- Definieren, Verfolgen und Verbessern von Service Level Objectives (SLOs) und Service Level Indicators (SLIs) in Zusammenarbeit mit Ingenieur- und Produktteams.
- Leiten von Vorfallreaktionsmaßnahmen bei hoher Schwere, Koordinieren von Fehlersuche-Aktivitäten, Durchführen von schuldlosen Nachbesprechungen und Implementieren langfristiger präventiver Lösungen.
- Erstellen und Warten von Infrastrukturautomatisierung und Infrastructure as Code-Lösungen mit Tools wie Terraform oder Pulumi.
- Entwickeln von selbstheilenden Systemen und Automatisierungsprozessen, die den operativen Aufwand reduzieren und die Systemresilienz verbessern.
- Optimieren von großangelegten Kubernetes- und cloud-nativen Bereitstellungen mit Fokus auf Skalierbarkeit, Zuverlässigkeit, Latenzreduzierung und Kapazitätsplanung.
- Untersuchen und Lösen komplexer Probleme in verteilten Systemen über mehrere Schichten des Infrastruktur-Stacks.
- Überprüfen von Architektur- und Systemdesigns, um Zuverlässigkeit, Skalierbarkeit, betriebliche Effizienz und Sicherheitsbest Practices sicherzustellen.
- Ingenieure in verschiedenen Teams betreuen und helfen, eine zuverlässigkeitsorientierte Ingenieurkultur und betriebliche Standards zu etablieren.
- Interne Tools, Integrationen und Automatisierungs-Workflows mit Sprachen wie Python oder Go erstellen, um Plattformoperationen und Infrastrukturverbesserungen zu unterstützen.
Anforderungen:
- 8–10 Jahre Erfahrung in Site Reliability Engineering, DevOps, Infrastrukturengineering oder verwandten Bereichen.
- Starke Softwareengineering-Fähigkeiten mit praktischer Erfahrung in der Entwicklung produktionsreifer Anwendungen oder Tools in Python oder Go.
- Tiefe Expertise in der Architektur verteilter Systeme, cloud-nativen Umgebungen und serviceorientiertem Infrastrukturdesign.
- Umfangreiche Erfahrung mit Kubernetes, Container-Orchestrierung, Docker und modernen Cloud-Infrastrukturtechnologien.
- Nachgewiesene Fähigkeit, fortschrittliche Beobachtungs- und Monitoring-Ökosysteme mit Tools wie Prometheus, Grafana, Datadog oder OpenTelemetry zu entwerfen und zu warten.
- Starker Hintergrund im Incident Management, in der Ursachenanalyse, Fehlersuche und Praktiken der operativen Exzellenz.
- Praktische Erfahrung mit Infrastructure as Code und Automatisierungstools wie Terraform, Pulumi oder ähnlichen Technologien.
- Exzellente schriftliche und mündliche Kommunikationsfähigkeiten, mit der Fähigkeit, komplexe technische Themen klar über Teams und Stakeholder hinweg zu erklären.
- Nachgewiesene Führungs- und Mentoring-Erfahrung in der Zusammenarbeit mit Ingenieuren auf verschiedenen Erfahrungsstufen.
- Komfortabel im Arbeiten über den gesamten Infrastruktur-Stack und beim Lösen hochkomplexer technischer Herausforderungen in schnelllebigen Umgebungen.
- Erfahrung mit Google Cloud Platform (GCP), Hochdurchsatzsystemen, Startup-Umgebungen oder technischer Inhaltserstellung wird als großer Vorteil angesehen.
Vorteile:
- Wettbewerbsfähiges Gehaltspaket mit Aktienoptionen.
- Vollständig remote Arbeitsumgebung in ganz Europa.
- Flexible Urlaubsregelung und bezahlte Feiertage.
- Kranken-, Zahn-, Augen- und Lebensversicherungsdeckung.
- Bezahlte Eltern-, medizinische und Pflegeurlaubsprogramme.
- Deckung für kurzfristige und langfristige Behinderungen.
- Monatlicher Wellness-Zuschuss zur Unterstützung des persönlichen Wohlbefindens.
- Autonome und flexible Arbeitskultur mit starken Eigenverantwortungsmöglichkeiten.
- Vierteljährliche Teambesprechungen und gemeinsame Unternehmensveranstaltungen.
- Professionelle Ausrüstung und Unterstützung des Remote-Arbeitsplatzes.
- Gelegenheit, an globalen Infrastrukturherausforderungen mit modernen cloud-nativen Technologien zu arbeiten.
Staff Site Reliability Engineer Arbeitgeber: Jobgether
Als Arbeitgeber bieten wir eine dynamische und unterstützende Arbeitsumgebung, die auf Zusammenarbeit und Innovation setzt. Unsere Mitarbeiter profitieren von flexiblen Arbeitszeiten, einem wettbewerbsfähigen Gehaltspaket sowie umfangreichen Gesundheitsleistungen. Zudem fördern wir die berufliche Weiterentwicklung durch Mentoring-Programme und die Möglichkeit, an globalen Infrastrukturprojekten mit modernsten Technologien zu arbeiten.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Staff Site Reliability Engineer erhalten könnten
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen SRE-Profis in Kontakt zu treten. Teile deine Erfahrungen und lerne von anderen – das kann dir helfen, die richtigen Kontakte zu knüpfen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe typische Fragen zu Kubernetes, Cloud-Technologien und Incident Management. Zeige, dass du nicht nur die Theorie kennst, sondern auch praktische Lösungen anbieten kannst.
✨Tipp Nummer 3
Sei proaktiv! Wenn du eine interessante Stelle siehst, bewirb dich direkt über unsere Website. Zeige dein Interesse und deine Motivation, indem du ein paar Worte über deine Leidenschaft für SRE und Automatisierung hinzufügst.
✨Tipp Nummer 4
Mach dich sichtbar! Teile deine Projekte oder Beiträge zu Open-Source-Initiativen. Das zeigt nicht nur deine Fähigkeiten, sondern hilft auch, dich als Experten in deinem Bereich zu positionieren.
Wir glauben, dass du diese Fähigkeiten brauchst, um Staff Site Reliability Engineer mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeige deine Persönlichkeit. Wir wollen wissen, wer du bist und was dich motiviert, also lass deine Leidenschaft für Site Reliability Engineering durchscheinen!
Betone deine Erfahrungen:Stelle sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Zeige uns, wie deine 8-10 Jahre Erfahrung in SRE oder verwandten Bereichen dich zu einem idealen Kandidaten für diese Rolle machen.
Technische Fähigkeiten im Fokus:Vergiss nicht, deine technischen Fähigkeiten zu betonen! Ob es um Kubernetes, Terraform oder Python geht – wir möchten sehen, dass du die Tools beherrschst, die für die Position wichtig sind.
Bewirb dich über unsere Website:Um sicherzustellen, dass deine Bewerbung schnell und effizient bearbeitet wird, bewirb dich direkt über unsere Website. So können wir deine Unterlagen zügig prüfen und dich in den Auswahlprozess einbeziehen!
Wie man sich auf ein Vorstellungsgespräch bei Jobgether vorbereitet
✨Verstehe die Rolle und das Unternehmen
Mach dich mit den spezifischen Anforderungen der Position als Staff Site Reliability Engineer vertraut. Informiere dich über die Technologien, die das Unternehmen verwendet, wie Kubernetes, Terraform oder Python, und über deren Ansätze zur Systemzuverlässigkeit.
✨Bereite konkrete Beispiele vor
Denke an konkrete Situationen aus deiner bisherigen Berufserfahrung, in denen du komplexe Probleme gelöst hast oder erfolgreich mit Teams zusammengearbeitet hast. Sei bereit, diese Beispiele zu teilen, um deine Fähigkeiten und Erfahrungen zu untermauern.
✨Zeige deine Kommunikationsfähigkeiten
Da die Rolle auch Mentoring und Zusammenarbeit erfordert, ist es wichtig, dass du deine Fähigkeit zur klaren Kommunikation unter Beweis stellst. Übe, technische Konzepte einfach und verständlich zu erklären, damit alle Teammitglieder folgen können.
✨Frage nach der Unternehmenskultur
Nutze die Gelegenheit, um mehr über die Teamdynamik und die Unternehmenskultur zu erfahren. Stelle Fragen zu den Werten des Unternehmens und wie sie die Zusammenarbeit und Innovation fördern, um zu zeigen, dass dir eine gute Passung wichtig ist.