Principal Site Reliability Engineer

Principal Site Reliability Engineer

Vollzeit 60000 - 84000 € / Jahr (geschätzt) Homeoffice möglich
INFINITE CHOICE LLC

Auf einen Blick

  • Aufgaben: Leite die Entwicklung von Site Reliability Engineering und forme unsere Zuverlässigkeitskultur.
  • Unternehmen: InfiniteChoice - ein innovatives Unternehmen, das Erlebnisse transformiert.
  • Vorteile: Wettbewerbsfähige Vergütung, Aktienbeteiligung und umfassende Vorteile.
  • Weitere Informationen: Dynamisches Team mit einer Leidenschaft für operative Exzellenz und kontinuierliche Verbesserung.
  • Warum dieser Job: Gestalte die Zukunft der Zuverlässigkeit für Millionen von Nutzern in einem flexiblen, remote Arbeitsumfeld.
  • Qualifikationen: Über 12 Jahre Erfahrung in SRE und Führungskompetenz in technischen Teams.

Das prognostizierte Gehalt liegt zwischen 60000 - 84000 € pro Jahr.

Anforderungen

  • Über 12 Jahre Erfahrung in Site Reliability Engineering oder Infrastruktur Engineering
  • Mindestens 5 Jahre in Führungsrollen im SRE, Aufbau und Skalierung von SRE-Teams und Prozessen
  • Nachgewiesene Erfahrung in der Gestaltung und Implementierung von großflächigen Monitoring- und Observability-Lösungen
  • Tiefgehendes Wissen über verteilte Systeme, Microservices-Architekturen und cloud-native Muster
  • Beherrschung von Infrastructure as Code, Konfigurationsmanagement und Bereitautomatisierung
  • Praktische Erfahrung mit Google Cloud Platform ist zwingend erforderlich
  • Expertise im GCP-Monitoring- und Observability-Stack (Cloud Monitoring, Cloud Logging, Cloud Trace)
  • Vertrautheit mit GKE, Compute Engine, Cloud Functions und anderen wesentlichen GCP-Diensten
  • Verständnis von GCP-Netzwerk-, Sicherheits- und Compliance-Funktionen
  • Kenntnisse in Kostenoptimierung und Ressourcenmanagement innerhalb von GCP
  • Starke Programmierkenntnisse in Python, Go, Java oder ähnlichen Sprachen
  • Erfahrung mit Monitoring-Tools (Prometheus, Grafana, Datadog, New Relic usw.)
  • Beherrschung von Containerisierung (Docker, Kubernetes) und Orchestrierungstools
  • Kenntnisse über CI/CD-Pipelines, automatisierte Tests und Bereitstellungsmethoden
  • Verständnis der Datenbankleistungsoptimierung für sowohl SQL als auch NoSQL
  • Vertrautheit mit KI-gesteuerten Entwicklungstools und -methoden ist ein erheblicher Vorteil
  • Erfahrung mit maschinellen Lernanwendungen für AIOps, Anomalieerkennung oder prädiktive Analytik
  • Erfahrung mit automatisierter Vorfallreaktion und selbstheilenden Systemen
  • Starke analytische und Problemlösungsfähigkeiten für komplexe verteilte Systeme
  • Erfahrung in der Reaktion auf Vorfälle unter hohem Druck und Krisenmanagement
  • Detailorientiert mit einem Engagement für betriebliche Exzellenz und kontinuierliche Verbesserung
  • Komfortabel mit Unklarheiten und der Entwicklung von Prozessen in einem schnelllebigen Umfeld
  • Leidenschaft für Zuverlässigkeit, Automatisierung und bewährte Ingenieurlösungen
  • Nachgewiesene Fähigkeit zur Etablierung von SRE-Programmen und -Prozessen von Grund auf ist ein großer Vorteil
  • Abschluss in Informatik, Ingenieurwesen oder gleichwertiger beruflicher Erfahrung
  • Branchenzertifizierungen (z. B. Google Cloud Professional, SRE oder verwandte Zertifizierungen) sind bevorzugt

Verantwortlichkeiten

  • Einführung von SRE-Praktiken von Grund auf, einschließlich Definition von SLIs, SLOs, Fehlerbudgets und Zuverlässigkeitsmetriken
  • Entwicklung von Vorfallreaktionsprotokollen, Bereitschaftsplänen und Nachbesprechungsverfahren
  • Erstellung von Standards und Best Practices für Zuverlässigkeitsengineering über Engineering-Teams hinweg
  • Formulierung von Notfallwiederherstellungs- und Geschäftskontinuitätsplänen
  • Gestaltung und Implementierung von Rahmenwerken für Kapazitätsplanung und Leistungsoptimierung
  • Leitung architektonischer Entscheidungen für umfassende Anwendungs- und Infrastrukturmonitoring-Lösungen
  • Entwicklung benutzerdefinierter SRE-Tools für automatisiertes Monitoring, Alarmierung und Behebung
  • Aufbau von Observability-Plattformen, die detaillierte Einblicke in die Systemleistung und Benutzererfahrung bieten
  • Entwicklung von Automatisierungsrahmenwerken für Bereitstellung, Skalierung und Vorfallreaktion
  • Architektur von Protokollierungs-, Metrik- und Tracing-Systemen für verteilte Microservices-Ökosysteme
  • Nutzung von Google Cloud Platform-Diensten zur Schaffung einer widerstandsfähigen, skalierbaren Infrastruktur
  • Implementierung cloud-nativer Überwachungssysteme mit Stackdriver, Cloud Monitoring und Cloud Logging
  • Gestaltung von Systemen, die automatisch skalieren und sich selbst heilen, unter Verwendung von GKE, Cloud Functions und verwalteten Diensten
  • Optimierung der Cloud-Kosten bei gleichzeitiger Gewährleistung hoher Verfügbarkeit und Leistungsniveaus
  • Einrichtung von Sicherheits- und Compliance-Rahmenwerken in GCP-Umgebungen
  • Forschung und Integration innovativer SRE-Tools und -Methoden
  • Nutzung von KI und maschinellem Lernen für prädiktive Analytik, Anomalieerkennung und automatisierte Reparaturen
  • Erstellung von Dashboards und Berichtssystemen, die umsetzbare Einblicke für Engineering- und Geschäftsteams bieten
  • Entwicklung von Feedbackschleifen für fortlaufende Verbesserungen der Zuverlässigkeit und Leistung
  • Aktualisierung über Branchen-Best Practices und aufkommende Technologien im SRE-Bereich

Bei InfiniteChoice sind wir bestrebt, die Art und Weise zu transformieren, wie Menschen Erfahrungen entdecken. Wir suchen einen Leiter, der die Grundlage unseres Site Reliability Engineering von Grund auf etabliert und vorantreibt. Dies ist eine aufregende Gelegenheit, unsere Zuverlässigkeitskultur zu gestalten und benutzerdefinierte Tools zu entwickeln, um eine Plattform zu unterstützen, die Millionen von Nutzern dient. Wir bieten eine vollständig remote Position für in den USA ansässige Kandidaten, die Flexibilität und Autonomie bei der Definition von Prozessen und der Auswahl von Technologien ermöglicht. Unsere kollaborative Umgebung ist gefüllt mit hellen, leidenschaftlichen Ingenieuren, die sich dem Aufbau betrieblicher Exzellenz verschrieben haben. Wir bieten wettbewerbsfähige Vergütung, Beteiligung am Unternehmen und umfassende Leistungen und laden Sie ein, Teil unserer Reise zu werden, um den Bereich der Entdeckung von Erfahrungen zu revolutionieren.

Principal Site Reliability Engineer Arbeitgeber: INFINITE CHOICE LLC

InfiniteChoice ist ein hervorragender Arbeitgeber, der eine vollständig remote Arbeitsumgebung für US-basierte Kandidaten bietet, was Flexibilität und Autonomie bei der Prozessgestaltung und Technologiewahl ermöglicht. Unsere kollaborative Kultur fördert den Austausch unter talentierten Ingenieuren, die sich leidenschaftlich für betriebliche Exzellenz einsetzen. Wir bieten wettbewerbsfähige Vergütung, Beteiligungsmöglichkeiten und umfassende Sozialleistungen, um sicherzustellen, dass unsere Mitarbeiter in ihrer Karriere wachsen und sich weiterentwickeln können.

INFINITE CHOICE LLC

Kontaktdaten:

INFINITE CHOICE LLC Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Principal Site Reliability Engineer erhalten könnten

Netzwerken in der IT-Community

In der IT-Consulting-Welt sollten wir regelmäßig auf Veranstaltungen wie Tech-Meetups oder Konferenzen gehen. Hier können wir nicht nur unser Netzwerk erweitern, sondern auch direkt mit potenziellen Arbeitgebern ins Gespräch kommen und unser Interesse an einer Vollzeitstelle zeigen.

Online-Foren und Gruppen nutzen

Sich in Online-Foren und Communities wie Stack Overflow oder LinkedIn-Gruppen umzusehen, kann uns helfen, Insider-Tipps zu erhalten und Informationen über offene Stellen in der IT-Beratung zu sammeln. Vergiss nicht, aktiv zu werden und Fragen zu stellen oder dein Wissen zu teilen – das erhöht unsere Sichtbarkeit!

Direkt bei INFINITE CHOICE LLC bewerben

Viele Unternehmen, wie INFINITE CHOICE LLC, stemmen ihre Vollzeitstellen bevorzugt über ihre eigenen Karriere-Webseiten. Also, lass uns regelmäßig auf deren Seite vorbeischauen und uns direkt bewerben, statt nur die üblichen Jobportale zu nutzen.

Überzeugende Projekte zeigen

Wir sollten unser Portfolio oder relevante Projekte gut sichtbar machen, egal ob das auf Github, persönlich oder auf LinkedIn ist. Bei IT-Consulting-Stellen kommt es oft auf praktische Erfahrungen an, also lass uns zeigen, was wir können!

Wir glauben, dass du diese Fähigkeiten brauchst, um Principal Site Reliability Engineer mit Bravour zu bestehen

Site Reliability Engineering
Infrastructure Engineering
Führung von SRE-Teams
Monitoring und Observability-Lösungen
Verteilte Systeme
Microservices-Architekturen
Cloud-native Muster

Einige Tipps für deine Bewerbung 🫡

Zeige deine technischen Skills!:In der IT-Beratung zählen deine technischen Kenntnisse und Fähigkeiten. Achte darauf, relevante Programmiersprachen, Tools und Systeme in deinem Lebenslauf aufzulisten. Zeig auch, wenn du Zertifikate hast, die deine Kompetenz unterstützen – das könnte dir einen echten Vorteil verschaffen!

Verstehe die Branche!:Unterstreiche in deinem Anschreiben, dass du ein gutes Verständnis für aktuelle Trends und Herausforderungen in der IT-Branche hast. Zeig, dass du nicht nur die technischen Aspekte beherrschst, sondern auch die Bedürfnisse der Kunden erkennen und lösen kannst!

Deine Projekte zählen!:Falls du bereits an IT-Projekten gearbeitet hast, verlinke diese oder beschreibe sie in deinem Lebenslauf. Praktische Erfahrungen – sei es in Form von Praktika oder privaten Projekten – sind besonders wertvoll in der IT-Beratung. Zeige uns, was du kannst!

Individuelle Bewerbung ist der Schlüssel!:Jede Bewerbung sollte individuell auf INFINITE CHOICE LLC und die ausgeschriebene Position Principal Site Reliability Engineer zugeschnitten sein. Teile uns mit, warum gerade du eine gute Wahl für unser Team bist. Das zeigt dein Engagement und deine Motivation, die über eine Standardbewerbung hinausgeht.

Wie man sich auf ein Vorstellungsgespräch bei INFINITE CHOICE LLC vorbereitet

Technische Vorbereitung ist alles!

Da du dich auf eine Vollzeitstelle in der IT-Beratung bewirbst, solltest du dir wirklich einen Überblick über die wichtigsten Tools und Technologien verschaffen, die in der Branche verwendet werden. Sei bereit, technische Fragen zu beantworten, die sich auf Software-Architektur oder Systemintegration beziehen könnten.

Praxisbeispiele parat haben

In der IT-Beratung ist es wichtig, konkrete Beispiele aus deiner bisherigen Erfahrung zu bringen. Überlege dir Projekte, bei denen du erfolgreich einen Kunden beraten hast oder Herausforderungen gelöst hast. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch in der Praxis erfolgreich sein kannst.

Soft Skills betonen

Ein großer Teil der IT-Beratung ist die Kommunikation mit Kunden und das Verständnis ihrer Bedürfnisse. Bereite dich darauf vor, über deine zwischenmenschlichen Fähigkeiten zu sprechen, wie du mit herausfordernden Kunden umgehst oder wie du in Teams arbeitest. Das wird den Interviewern zeigen, dass du mehr als nur technisches Wissen mitbringst!

Fragen zum Unternehmen vorbereiten

Schau dir spezifisch die Projekte von INFINITE CHOICE LLC an und überlege dir, welche Fragen du dazu stellen möchtest. Zeig Interesse an den aktuellen Herausforderungen, vor denen das Unternehmen steht, und wie du dazu beitragen könntest. Das hebt dich von anderen Bewerbern ab und zeigt, dass du wirklich motiviert bist.