Auf einen Blick
- Aufgaben: Baue und betreibe eine hochverfügbare Plattform mit AWS und Kubernetes.
- Arbeitgeber: ilert, ein innovatives Unternehmen, das DevOps-Teams unterstützt.
- Mitarbeitervorteile: Hybrid-Arbeit, 28 Tage Urlaub und subventionierter Nahverkehr.
- Warum dieser Job: Gestalte die Zuverlässigkeit kritischer Systeme und mache einen echten Unterschied.
- Gewünschte Qualifikationen: 3+ Jahre Erfahrung in SRE oder DevOps, starke AWS- und Kubernetes-Kenntnisse.
- Andere Informationen: Dynamisches Team mit Fokus auf Innovation und persönlichem Wachstum.
Das voraussichtliche Gehalt liegt zwischen 43200 - 72000 € pro Jahr.
Standort: Hybrid – Köln (Rheinauhafen) — 3 Tage im Büro, 2 remote (Di + Do)
Team: Engineering · Berichtet an den CTO
ilert hilft Tausenden von DevOps- und IT-Teams, Vorfälle schneller zu erkennen, zu beheben und zu kommunizieren. Unsere Plattform ist mission-kritisch: Kunden verlassen sich rund um die Uhr auf uns, um ihre immer aktiven Geschäfte am Laufen zu halten.
Als Site Reliability Engineer bei ilert sind Sie verantwortlich für die Zuverlässigkeit, Leistung und Skalierbarkeit unserer Kernplattform über AWS, Kubernetes, Kafka und mehr.
Aufgaben
- Aufbau und Betrieb einer hochverfügbaren Plattform
- Betreiben und Weiterentwickeln unserer AWS-basierten Infrastruktur
- Optimierung selbstverwalteter Kafka-, ClickHouse-Cluster und unseres Observability-Stacks
- Sicherstellen von Resilienz, Notfallwiederherstellung und Kapazitätsplanung über den gesamten Stack
- Verbesserung der Zuverlässigkeit und Leistung
- Erstellen und Pflegen von SLOs, SLIs, Fehlerbudgets und Observability-Dashboards
- Debuggen von Produktionsproblemen über verschiedene Schichten (Netzwerk, Kubernetes, Anwendung, DB)
- Verbesserung der Leistung unserer Ingestion-Pipeline
- Automatisierung und Tools
- Automatisieren von Operationen mit Terraform, Helm, Kubernetes-Operatoren und internen Tools
- Erstellen von Tools für sicherere Deployments, Blue/Green-Rollouts und automatisierte Überprüfungen
- Stärkung der Incident-Response-Workflows durch enge Zusammenarbeit mit unserem AI SRE-Agent-Team
- Sicherheit und Compliance
- Implementierung von Best Practices für Workload-Isolierung, Geheimnisverwaltung, IAM und Auditierbarkeit
- Unterstützung unserer ISO27001-Position durch Automatisierung von Kontrollen und Härtung unserer Infrastruktur
- Kreuzfunktionale Auswirkungen
- Zusammenarbeit mit Backend-, AI- und Produktteams zur Gestaltung zuverlässiger Dienste
- Teilnahme an der Rufbereitschaft
- Leitung von Nachbesprechungen nach Vorfällen und langfristige Förderung von Zuverlässigkeitsverbesserungen
Anforderungen
- 3+ Jahre Erfahrung als SRE, Platform Engineer, DevOps Engineer oder Infrastructure Engineer
- Starke praktische Erfahrung mit AWS, Kubernetes, Linux-Interna, Netzwerk, Leistungstuning
- Erfahrung im Betrieb selbstverwalteter verteilter Systeme, idealerweise Kafka oder ClickHouse
- Starkes Verständnis von Observability
- Erfahrung in der Automatisierung von Infrastruktur mit Terraform und CI/CD-Systemen
- Fließendes Englisch (unsere Arbeitssprache); Deutsch optional
Vorteile
- Produktzentriert - 100 % fokussiert auf die Lösung eines mission-kritischen Problems, das jedes immer aktive Unternehmen hat
- Hybridfreiheit - 2 Tage remote standardmäßig; wunderschöne Rheinauhafen-Dachterrasse, wenn Sie in der Stadt sind
- Fokus > Meetings - Wir begrenzen die Zeit für Synchronisationen, bevorzugen asynchrone Dokumente und schützen die Zeit der Entwickler
- 28 Tage Urlaub - …plus Feiertage
- Pendlervergünstigungen - subventionierter öffentlicher Nahverkehr
Site Reliability Engineer (f/m/x) Arbeitgeber: ilert GmbH
Kontaktperson:
ilert GmbH HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Site Reliability Engineer (f/m/x)
✨Netzwerken, Netzwerken, Netzwerken!
Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach informellen Gesprächen oder Meetups – oft erfährt man so von offenen Stellen, bevor sie offiziell ausgeschrieben werden.
✨Sei proaktiv bei der Kontaktaufnahme
Wenn du eine Stelle im Auge hast, zögere nicht, direkt die Teammitglieder oder den CTO zu kontaktieren. Zeig dein Interesse und stelle Fragen zur Rolle oder dem Team – das hinterlässt einen bleibenden Eindruck!
✨Bereite dich auf technische Interviews vor
Mach dich mit typischen SRE-Themen vertraut, wie AWS, Kubernetes und Performance-Tuning. Übe technische Fragen und Szenarien, die dir helfen, deine Fähigkeiten zu demonstrieren – wir wissen, dass du das drauf hast!
✨Bewirb dich über unsere Website
Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So kannst du sicherstellen, dass deine Bewerbung die richtige Anlaufstelle erreicht und du die besten Chancen hast, Teil unseres Teams zu werden!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Site Reliability Engineer (f/m/x)
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Deine Persönlichkeit und Leidenschaft für das, was du tust, sollten in deiner Bewerbung deutlich werden. Lass uns wissen, warum du dich für die Rolle als Site Reliability Engineer interessierst und was dich motiviert.
Betone deine Erfahrungen: Wir suchen nach jemandem mit soliden Erfahrungen in AWS, Kubernetes und mehr. Stelle sicher, dass du relevante Projekte und Erfolge in deinem Lebenslauf hervorhebst. Zeig uns, wie du Probleme gelöst und Systeme optimiert hast!
Mach es übersichtlich: Eine klare und strukturierte Bewerbung ist der Schlüssel! Verwende Absätze, Aufzählungen und eine einfache Sprache, um deine Punkte klar zu machen. Wir lieben es, wenn wir schnell die wichtigsten Informationen finden können.
Bewirb dich über unsere Website: Der einfachste Weg, um Teil unseres Teams zu werden, ist, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnell bearbeiten können!
Wie du dich auf ein Vorstellungsgespräch bei ilert GmbH vorbereitest
✨Verstehe die Technologie
Mach dich mit den Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie AWS, Kubernetes und Kafka. Zeige im Interview, dass du praktische Erfahrungen hast und bereit bist, diese Technologien zu nutzen und weiterzuentwickeln.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast. Sei bereit, darüber zu sprechen, wie du Probleme gelöst und die Zuverlässigkeit oder Leistung von Systemen verbessert hast. Das zeigt deine praktische Erfahrung und Problemlösungsfähigkeiten.
✨Zeige Teamgeist
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, über deine Erfahrungen in interdisziplinären Teams zu sprechen. Betone, wie du mit anderen Abteilungen zusammengearbeitet hast, um zuverlässige Dienste zu gestalten und Vorfälle zu bewältigen.
✨Fragen stellen
Bereite einige Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Unternehmenskultur und die Erwartungen an die Rolle zu erfahren. Fragen zur Incident-Response-Strategie oder zur Zusammenarbeit mit dem AI SRE-Team sind besonders relevant.