Auf einen Blick
- Aufgaben: Entwickle und betreibe hochverfügbare API- und Dateninfrastrukturen für globale Wissensverteilung.
- Unternehmen: Wikimedia Enterprise, ein innovatives Unternehmen mit globaler Reichweite.
- Vorteile: Remote-Arbeit, wettbewerbsfähige Vergütung und eine Kultur der kontinuierlichen Verbesserung.
- Weitere Informationen: Dynamisches, inklusives Team mit Fokus auf Automatisierung und Lernen.
- Warum dieser Job: Gestalte Systeme, die den Zugang zu Wissen weltweit revolutionieren.
- Qualifikationen: Mindestens 5 Jahre Erfahrung in SRE oder Infrastrukturengineering.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Wir suchen derzeit einen Senior Site Reliability Engineer, Wikimedia Enterprise in Deutschland. Diese Rolle befindet sich an der Schnittstelle von großflächiger Infrastrukturtechnik und technologiegetriebenen Missionen, die globale Wissensverteilungssysteme unterstützen. Sie werden helfen, hochverfügbare, leistungsstarke API- und Dateninfrastrukturen zu entwerfen, zu betreiben und weiterzuentwickeln, die die großflächige Wiederverwendung von Wikimedia-Inhalten weltweit unterstützen. Die Position umfasst eine tiefgehende technische Verantwortung für Zuverlässigkeit, Skalierbarkeit und Beobachtbarkeit kritischer Dienste. Sie arbeiten in einer vollständig verteilten, globalen Zusammenarbeit mit erfahrenen SREs, Softwareingenieuren und Plattformteams. Die Rolle kombiniert praktische Ingenieurarbeit, Vorfallreaktion und langfristige Zuverlässigkeitsstrategien. Sie bietet auch die Möglichkeit, zu Systemen beizutragen, die direkt beeinflussen, wie Wissen im Internet abgerufen und wiederverwendet wird. Sie werden in einer schnelllebigen, produktorientierten Ingenieurskultur arbeiten, die großen Wert auf Automatisierung, Experimentieren und kontinuierliche Verbesserung legt.
Verantwortlichkeiten
- Gewährleistung der Zuverlässigkeit, Skalierbarkeit und Leistung großflächiger verteilter Systeme, die Daten- und API-Dienste unterstützen.
- Definition, Verfolgung und kontinuierliche Verbesserung von SLOs, SLIs und Fehlerbudgets für kritische Dienste.
- Entwurf und Verbesserung von Beobachtbarkeitssystemen einschließlich Metriken, Protokollierung und verteiltem Tracing.
- Teilnahme an Vorfallreaktionen, Bereitschaftsdiensten und Nachbesprechungen zur kontinuierlichen Verbesserung.
- Aufbau und Wartung von CI/CD- und GitOps-Pipelines, die sichere, automatisierte und zuverlässige Bereitstellungen ermöglichen.
- Implementierung von Infrastruktur als Code und automatisierungsorientierten Praktiken zur Reduzierung des operativen Aufwands.
- Entwurf und Betrieb skalierbarer Cloud-Infrastrukturen in Produktionsumgebungen.
- Durchführung von Kapazitätsplanung, Leistungsoptimierung und Resilienztests (einschließlich Chaos-Engineering-Praktiken).
- Verbesserung der Entwicklererfahrung durch Ermöglichung von Self-Service-Infrastrukturen und optimierten Arbeitsabläufen.
- Zusammenarbeit mit Sicherheits-, Software- und Release-Engineering-Teams zur Einbettung von Zuverlässigkeits- und Sicherheitsbest Practices.
- Optimierung der Infrastrukturkosten und -effizienz unter Verwendung von FinOps-Prinzipien, ohne die Verfügbarkeit zu beeinträchtigen.
- Entwicklung und Pflege betrieblicher Metriken wie MTTR, MTTD und Vorfallhäufigkeit.
- Beitrag zu Plattformengineering-Initiativen, die die Infrastruktur über Teams hinweg standardisieren.
- Mentoring von Kollegen und Förderung von Best Practices in SRE, Automatisierung und Systemzuverlässigkeit.
Anforderungen
- Starke Expertise in Site Reliability Engineering, verteilten Systemen und Cloud-Infrastruktur.
- 5+ Jahre Erfahrung in SRE-, DevOps- oder Infrastrukturengineering-Rollen.
- Starke Erfahrung mit Infrastruktur-als-Code-Tools wie Terraform und/oder Ansible.
- Kenntnisse in mindestens einer Programmiersprache (Python, Go oder ähnlich).
- Praktische Erfahrung mit Cloud-Plattformen wie AWS, GCP oder Azure.
- Erfahrung im Aufbau und in der Wartung von CI/CD-Pipelines und GitOps-Workflows (z.B. GitLab, ArgoCD oder ähnliche Tools).
- Starkes Verständnis der SRE-Prinzipien einschließlich SLOs, SLIs und Fehlerbudgets.
- Erfahrung mit Beobachtungswerkzeugen wie Prometheus, OpenTelemetry oder gleichwertig.
- Nachgewiesene Erfahrung in der Vorfallreaktion, Bereitschaftsbetrieb und Nachanalyse.
- Fähigkeit, großflächige verteilte Systeme mit hohen Verfügbarkeitsanforderungen zu betreiben und zu optimieren.
- Starke Kommunikations- und Kollaborationsfähigkeiten in verteilten, remote-first Umgebungen.
- Fähigkeit, Systeme klar zu dokumentieren und zum gemeinsamen Ingenieurwissen beizutragen.
- Starker Ownership-Mindset mit Fokus auf Automatisierung, Zuverlässigkeit und kontinuierliche Verbesserung.
- Anpassungsfähigkeit an sich schnell entwickelnde, technologiegetriebene Umgebungen.
Vorteile
- Remote-first Arbeitsmodell mit globaler Zusammenarbeit.
- Gelegenheit, an hochwirksamen Systemen zu arbeiten, die globale Wissensplattformen unterstützen.
- Einblick in großflächige verteilte Systeme und moderne cloud-native Architekturen.
- Kultur der Ingenieurexzellenz, Automatisierung und kontinuierlicher Verbesserung.
- Starker Fokus auf Lernen, Experimentieren und offene Zusammenarbeit.
- Wettbewerbsfähige Vergütung, angepasst an Standort und Erfahrung.
- Inklusive und vielfältige Arbeitsumgebung mit globalem Teamausblick.
- Gelegenheit, zur offenen Wissensinfrastruktur beizutragen, die weltweit genutzt wird.
Senior Site Reliability Engineer, Wikimedia Enterprise Arbeitgeber: Jobgether
Wikimedia Enterprise bietet eine herausragende Arbeitsumgebung für Senior Site Reliability Engineers in Deutschland, die sich durch ein remote-first Arbeitsmodell und eine Kultur der technischen Exzellenz auszeichnet. Mitarbeiter profitieren von einer inklusiven und vielfältigen Teamatmosphäre, in der kontinuierliches Lernen und Experimentieren gefördert werden, sowie von der Möglichkeit, an hochwirksamen Systemen zu arbeiten, die den globalen Wissensaustausch unterstützen. Zudem gibt es zahlreiche Chancen zur beruflichen Weiterentwicklung und zur Mitgestaltung von Open-Knowledge-Infrastrukturen, die weltweit genutzt werden.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior Site Reliability Engineer, Wikimedia Enterprise erhalten könnten
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen SREs und Fachleuten in Kontakt zu treten. Teile deine Erfahrungen und lerne von anderen – das kann dir helfen, die richtigen Kontakte zu knüpfen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe typische Fragen zu SRE-Prinzipien, Cloud-Infrastruktur und Incident-Management. Zeige, dass du nicht nur die Theorie kennst, sondern auch praktische Lösungen anbieten kannst.
✨Tipp Nummer 3
Sei proaktiv und zeige Initiative! Wenn du ein Projekt oder eine Idee hast, die du umsetzen möchtest, sprich darüber. Arbeitgeber schätzen Kandidaten, die bereit sind, Verantwortung zu übernehmen und innovative Lösungen zu finden.
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! Das gibt dir die beste Chance, gesehen zu werden. Wir bei StudySmarter möchten sicherstellen, dass deine Bewerbung schnell und fair bearbeitet wird.
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Site Reliability Engineer, Wikimedia Enterprise mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die nicht nur die richtigen Fähigkeiten haben, sondern auch gut ins Team passen.
Betone deine Erfahrungen:Erzähle uns von deinen bisherigen Erfahrungen im Bereich Site Reliability Engineering oder ähnlichen Rollen. Zeige auf, wie du mit großen, verteilten Systemen gearbeitet hast und welche Erfolge du dabei erzielt hast.
Technische Fähigkeiten hervorheben:Vergiss nicht, deine technischen Skills zu betonen! Ob es um Infrastruktur-as-Code, CI/CD-Pipelines oder Cloud-Plattformen geht – wir wollen wissen, was du drauf hast und wie du diese Technologien eingesetzt hast.
Bewirb dich über unsere Website:Um sicherzustellen, dass deine Bewerbung schnell und effizient bearbeitet wird, bewirb dich direkt über unsere Website. So können wir dich besser kennenlernen und dir die bestmögliche Erfahrung bieten!
Wie man sich auf ein Vorstellungsgespräch bei Jobgether vorbereitet
✨Verstehe die Rolle und das Unternehmen
Mach dich mit den spezifischen Anforderungen der Position als Senior Site Reliability Engineer vertraut. Informiere dich über Wikimedia Enterprise, ihre Mission und wie sie globale Wissensverteilung unterstützen. Das zeigt dein Interesse und deine Vorbereitung.
✨Technische Fähigkeiten demonstrieren
Bereite dich darauf vor, deine Erfahrungen mit Infrastruktur-Tools wie Terraform oder Ansible zu erläutern. Sei bereit, konkrete Beispiele für deine Arbeit mit Cloud-Plattformen wie AWS oder GCP zu geben und wie du SLOs und SLIs definiert hast.
✨Fragen zur Zusammenarbeit stellen
Da die Rolle in einem globalen, verteilten Team arbeitet, ist es wichtig, Fragen zur Teamdynamik und den Kommunikationsmethoden zu stellen. Zeige, dass du an einer effektiven Zusammenarbeit interessiert bist und wie du in einem Remote-Umfeld erfolgreich arbeiten kannst.
✨Kontinuierliche Verbesserung betonen
Sprich darüber, wie du in der Vergangenheit Prozesse optimiert hast, um Effizienz und Zuverlässigkeit zu steigern. Teile Beispiele für deine Erfahrungen mit Incident Response und wie du aus Vorfällen gelernt hast, um zukünftige Probleme zu vermeiden.