Principal Site Reliability Engineer

Jobbörse

Unternehmen

INFINITE CHOICE LLC

Principal Site Reliability Engineer

Vollzeit 60000 - 84000 € / Jahr (geschätzt) Homeoffice möglich

Auf einen Blick

Aufgaben: Leite die Entwicklung von Site Reliability Engineering und forme unsere Zuverlässigkeitskultur.
Unternehmen: InfiniteChoice - ein innovatives Unternehmen, das Erlebnisse transformiert.
Vorteile: Wettbewerbsfähige Vergütung, Aktienbeteiligung und umfassende Vorteile.
Weitere Informationen: Dynamisches Team mit einer Leidenschaft für operative Exzellenz und kontinuierliche Verbesserung.
Warum dieser Job: Gestalte die Zukunft der Zuverlässigkeit für Millionen von Nutzern in einem flexiblen, remote Arbeitsumfeld.
Qualifikationen: Über 12 Jahre Erfahrung in SRE und Führungskompetenz in technischen Teams.

Das prognostizierte Gehalt liegt zwischen 60000 - 84000 € pro Jahr.

Anforderungen

Über 12 Jahre Erfahrung in Site Reliability Engineering oder Infrastruktur Engineering
Mindestens 5 Jahre in Führungsrollen im SRE, Aufbau und Skalierung von SRE-Teams und Prozessen
Nachgewiesene Erfahrung in der Gestaltung und Implementierung von großflächigen Monitoring- und Observability-Lösungen
Tiefgehendes Wissen über verteilte Systeme, Microservices-Architekturen und cloud-native Muster
Beherrschung von Infrastructure as Code, Konfigurationsmanagement und Bereitautomatisierung
Praktische Erfahrung mit Google Cloud Platform ist zwingend erforderlich
Expertise im GCP-Monitoring- und Observability-Stack (Cloud Monitoring, Cloud Logging, Cloud Trace)
Vertrautheit mit GKE, Compute Engine, Cloud Functions und anderen wesentlichen GCP-Diensten
Verständnis von GCP-Netzwerk-, Sicherheits- und Compliance-Funktionen
Kenntnisse in Kostenoptimierung und Ressourcenmanagement innerhalb von GCP
Starke Programmierkenntnisse in Python, Go, Java oder ähnlichen Sprachen
Erfahrung mit Monitoring-Tools (Prometheus, Grafana, Datadog, New Relic usw.)
Beherrschung von Containerisierung (Docker, Kubernetes) und Orchestrierungstools
Kenntnisse über CI/CD-Pipelines, automatisierte Tests und Bereitstellungsmethoden
Verständnis der Datenbankleistungsoptimierung für sowohl SQL als auch NoSQL
Vertrautheit mit KI-gesteuerten Entwicklungstools und -methoden ist ein erheblicher Vorteil
Erfahrung mit maschinellen Lernanwendungen für AIOps, Anomalieerkennung oder prädiktive Analytik
Erfahrung mit automatisierter Vorfallreaktion und selbstheilenden Systemen
Starke analytische und Problemlösungsfähigkeiten für komplexe verteilte Systeme
Erfahrung in der Reaktion auf Vorfälle unter hohem Druck und Krisenmanagement
Detailorientiert mit einem Engagement für betriebliche Exzellenz und kontinuierliche Verbesserung
Komfortabel mit Unklarheiten und der Entwicklung von Prozessen in einem schnelllebigen Umfeld
Leidenschaft für Zuverlässigkeit, Automatisierung und bewährte Ingenieurlösungen
Nachgewiesene Fähigkeit zur Etablierung von SRE-Programmen und -Prozessen von Grund auf ist ein großer Vorteil
Abschluss in Informatik, Ingenieurwesen oder gleichwertiger beruflicher Erfahrung
Branchenzertifizierungen (z. B. Google Cloud Professional, SRE oder verwandte Zertifizierungen) sind bevorzugt

Verantwortlichkeiten

Einführung von SRE-Praktiken von Grund auf, einschließlich Definition von SLIs, SLOs, Fehlerbudgets und Zuverlässigkeitsmetriken
Entwicklung von Vorfallreaktionsprotokollen, Bereitschaftsplänen und Nachbesprechungsverfahren
Erstellung von Standards und Best Practices für Zuverlässigkeitsengineering über Engineering-Teams hinweg
Formulierung von Notfallwiederherstellungs- und Geschäftskontinuitätsplänen
Gestaltung und Implementierung von Rahmenwerken für Kapazitätsplanung und Leistungsoptimierung
Leitung architektonischer Entscheidungen für umfassende Anwendungs- und Infrastrukturmonitoring-Lösungen
Entwicklung benutzerdefinierter SRE-Tools für automatisiertes Monitoring, Alarmierung und Behebung
Aufbau von Observability-Plattformen, die detaillierte Einblicke in die Systemleistung und Benutzererfahrung bieten
Entwicklung von Automatisierungsrahmenwerken für Bereitstellung, Skalierung und Vorfallreaktion
Architektur von Protokollierungs-, Metrik- und Tracing-Systemen für verteilte Microservices-Ökosysteme
Nutzung von Google Cloud Platform-Diensten zur Schaffung einer widerstandsfähigen, skalierbaren Infrastruktur
Implementierung cloud-nativer Überwachungssysteme mit Stackdriver, Cloud Monitoring und Cloud Logging
Gestaltung von Systemen, die automatisch skalieren und sich selbst heilen, unter Verwendung von GKE, Cloud Functions und verwalteten Diensten
Optimierung der Cloud-Kosten bei gleichzeitiger Gewährleistung hoher Verfügbarkeit und Leistungsniveaus
Einrichtung von Sicherheits- und Compliance-Rahmenwerken in GCP-Umgebungen
Forschung und Integration innovativer SRE-Tools und -Methoden
Nutzung von KI und maschinellem Lernen für prädiktive Analytik, Anomalieerkennung und automatisierte Reparaturen
Erstellung von Dashboards und Berichtssystemen, die umsetzbare Einblicke für Engineering- und Geschäftsteams bieten
Entwicklung von Feedbackschleifen für fortlaufende Verbesserungen der Zuverlässigkeit und Leistung
Aktualisierung über Branchen-Best Practices und aufkommende Technologien im SRE-Bereich

Bei InfiniteChoice sind wir bestrebt, die Art und Weise zu transformieren, wie Menschen Erfahrungen entdecken. Wir suchen einen Leiter, der die Grundlage unseres Site Reliability Engineering von Grund auf etabliert und vorantreibt. Dies ist eine aufregende Gelegenheit, unsere Zuverlässigkeitskultur zu gestalten und benutzerdefinierte Tools zu entwickeln, um eine Plattform zu unterstützen, die Millionen von Nutzern dient. Wir bieten eine vollständig remote Position für in den USA ansässige Kandidaten, die Flexibilität und Autonomie bei der Definition von Prozessen und der Auswahl von Technologien ermöglicht. Unsere kollaborative Umgebung ist gefüllt mit hellen, leidenschaftlichen Ingenieuren, die sich dem Aufbau betrieblicher Exzellenz verschrieben haben. Wir bieten wettbewerbsfähige Vergütung, Beteiligung am Unternehmen und umfassende Leistungen und laden Sie ein, Teil unserer Reise zu werden, um den Bereich der Entdeckung von Erfahrungen zu revolutionieren.

Principal Site Reliability Engineer Arbeitgeber: INFINITE CHOICE LLC

InfiniteChoice ist ein hervorragender Arbeitgeber, der eine vollständig remote Arbeitsumgebung für US-basierte Kandidaten bietet, was Flexibilität und Autonomie bei der Prozessgestaltung und Technologiewahl ermöglicht. Unsere kollaborative Kultur fördert den Austausch unter talentierten Ingenieuren, die sich leidenschaftlich für betriebliche Exzellenz einsetzen. Wir bieten wettbewerbsfähige Vergütung, Beteiligungsmöglichkeiten und umfassende Sozialleistungen, um sicherzustellen, dass unsere Mitarbeiter in ihrer Karriere wachsen und sich weiterentwickeln können.

Kontaktdaten:

INFINITE CHOICE LLC Recruiting-Team

Profil von INFINITE CHOICE LLC anzeigen

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Principal Site Reliability Engineer erhalten könnten

✨Netzwerken in der IT-Community

In der IT-Consulting-Welt sollten wir regelmäßig auf Veranstaltungen wie Tech-Meetups oder Konferenzen gehen. Hier können wir nicht nur unser Netzwerk erweitern, sondern auch direkt mit potenziellen Arbeitgebern ins Gespräch kommen und unser Interesse an einer Vollzeitstelle zeigen.

✨Online-Foren und Gruppen nutzen

Sich in Online-Foren und Communities wie Stack Overflow oder LinkedIn-Gruppen umzusehen, kann uns helfen, Insider-Tipps zu erhalten und Informationen über offene Stellen in der IT-Beratung zu sammeln. Vergiss nicht, aktiv zu werden und Fragen zu stellen oder dein Wissen zu teilen – das erhöht unsere Sichtbarkeit!

✨Direkt bei INFINITE CHOICE LLC bewerben

Viele Unternehmen, wie INFINITE CHOICE LLC, stemmen ihre Vollzeitstellen bevorzugt über ihre eigenen Karriere-Webseiten. Also, lass uns regelmäßig auf deren Seite vorbeischauen und uns direkt bewerben, statt nur die üblichen Jobportale zu nutzen.

✨Überzeugende Projekte zeigen

Wir sollten unser Portfolio oder relevante Projekte gut sichtbar machen, egal ob das auf Github, persönlich oder auf LinkedIn ist. Bei IT-Consulting-Stellen kommt es oft auf praktische Erfahrungen an, also lass uns zeigen, was wir können!

Wir glauben, dass du diese Fähigkeiten brauchst, um Principal Site Reliability Engineer mit Bravour zu bestehen

Site Reliability Engineering

Infrastructure Engineering

Führung von SRE-Teams

Monitoring und Observability-Lösungen

Verteilte Systeme

Microservices-Architekturen

Cloud-native Muster

Infrastructure as Code

Konfigurationsmanagement

Deployment-Automatisierung

Google Cloud Platform

GCP Monitoring und Observability Stack

Containerisierung (Docker, Kubernetes)

CI/CD-Pipelines

Datenbank-Performance-Tuning

Einige Tipps für deine Bewerbung 🫡

Zeige deine technischen Skills!:In der IT-Beratung zählen deine technischen Kenntnisse und Fähigkeiten. Achte darauf, relevante Programmiersprachen, Tools und Systeme in deinem Lebenslauf aufzulisten. Zeig auch, wenn du Zertifikate hast, die deine Kompetenz unterstützen – das könnte dir einen echten Vorteil verschaffen!

Verstehe die Branche!:Unterstreiche in deinem Anschreiben, dass du ein gutes Verständnis für aktuelle Trends und Herausforderungen in der IT-Branche hast. Zeig, dass du nicht nur die technischen Aspekte beherrschst, sondern auch die Bedürfnisse der Kunden erkennen und lösen kannst!

Deine Projekte zählen!:Falls du bereits an IT-Projekten gearbeitet hast, verlinke diese oder beschreibe sie in deinem Lebenslauf. Praktische Erfahrungen – sei es in Form von Praktika oder privaten Projekten – sind besonders wertvoll in der IT-Beratung. Zeige uns, was du kannst!

Individuelle Bewerbung ist der Schlüssel!:Jede Bewerbung sollte individuell auf INFINITE CHOICE LLC und die ausgeschriebene Position Principal Site Reliability Engineer zugeschnitten sein. Teile uns mit, warum gerade du eine gute Wahl für unser Team bist. Das zeigt dein Engagement und deine Motivation, die über eine Standardbewerbung hinausgeht.

Wie man sich auf ein Vorstellungsgespräch bei INFINITE CHOICE LLC vorbereitet

✨Technische Vorbereitung ist alles!

Da du dich auf eine Vollzeitstelle in der IT-Beratung bewirbst, solltest du dir wirklich einen Überblick über die wichtigsten Tools und Technologien verschaffen, die in der Branche verwendet werden. Sei bereit, technische Fragen zu beantworten, die sich auf Software-Architektur oder Systemintegration beziehen könnten.

✨Praxisbeispiele parat haben

In der IT-Beratung ist es wichtig, konkrete Beispiele aus deiner bisherigen Erfahrung zu bringen. Überlege dir Projekte, bei denen du erfolgreich einen Kunden beraten hast oder Herausforderungen gelöst hast. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch in der Praxis erfolgreich sein kannst.

✨Soft Skills betonen

Ein großer Teil der IT-Beratung ist die Kommunikation mit Kunden und das Verständnis ihrer Bedürfnisse. Bereite dich darauf vor, über deine zwischenmenschlichen Fähigkeiten zu sprechen, wie du mit herausfordernden Kunden umgehst oder wie du in Teams arbeitest. Das wird den Interviewern zeigen, dass du mehr als nur technisches Wissen mitbringst!

✨Fragen zum Unternehmen vorbereiten

Schau dir spezifisch die Projekte von INFINITE CHOICE LLC an und überlege dir, welche Fragen du dazu stellen möchtest. Zeig Interesse an den aktuellen Herausforderungen, vor denen das Unternehmen steht, und wie du dazu beitragen könntest. Das hebt dich von anderen Bewerbern ab und zeigt, dass du wirklich motiviert bist.

Principal Site Reliability Engineer

INFINITE CHOICE LLC

Principal Site Reliability Engineer

Auf einen Blick

Principal Site Reliability Engineer Arbeitgeber: INFINITE CHOICE LLC

StudySmarter Expertenrat🤫

Wir glauben, dass du diese Fähigkeiten brauchst, um Principal Site Reliability Engineer mit Bravour zu bestehen

Einige Tipps für deine Bewerbung 🫡

Wie man sich auf ein Vorstellungsgespräch bei INFINITE CHOICE LLC vorbereitet

Unternehmen

Produkt

Help