Site Reliability Engineer

Site Reliability Engineer

Befristet 60000 - 80000 € / Jahr (geschätzt) Home Office möglich
Go Premium
S

Auf einen Blick

  • Aufgaben: Entwickle und pflege eine Observability-Plattform mit modernen Technologien.
  • Arbeitgeber: Innovatives Unternehmen im Bereich Site Reliability Engineering mit remote Arbeitsmöglichkeiten.
  • Mitarbeitervorteile: Attraktives Gehalt, flexible Arbeitszeiten und Weiterbildungsmöglichkeiten.
  • Andere Informationen: Dynamisches Team mit großartigen Entwicklungschancen.
  • Warum dieser Job: Gestalte die Zukunft der Überwachungssysteme und arbeite an spannenden Projekten.
  • Gewünschte Qualifikationen: Erfahrung in Programmierung, insbesondere Go, Python oder Java, und Kenntnisse in Kubernetes.

Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Job Standort: Deutschland (Remote)

Jobtyp: Befristeter Vertrag (12 Monate)

Verantwortlichkeiten

  • Entwerfen, entwickeln und warten von Komponenten der Observability-Plattform und Integrationen über Prometheus, Thanos, Grafana, OpenTelemetry und Streaming-Telemetriesysteme.
  • Beitragen zur Architektur und technischen Gestaltung skalierbarer Überwachungslösungen, die auf Kubernetes, Docker und cloud-nativen Umgebungen laufen.
  • Implementierung standardisierter Instrumentierung mit OpenTelemetry, SDKs, Sammlern, Exporteuren und Agenten über Dienste und Infrastruktur.
  • Erstellen und Optimieren von Telemetrie-Pipelines für Metriken, Protokolle und Traces unter Verwendung von Prometheus, OTEL-Sammler, Kafka/Streaming-Pipelines und Zeitreihen-Datenbanken.
  • Entwicklung fortgeschrittener PromQL-Abfragen, Aufzeichnungsregeln und AlertManager-Logik für komplexe Überwachungsszenarien.
  • Erstellen wiederverwendbarer Dashboards und Visualisierungsvorlagen mit Grafana (und Perses, falls zutreffend).
  • Automatisierung von Bereitstellungen und Konfigurationen mit Git, GitHub/GitLab, Jenkins, ArgoCD, Helm und Infrastructure-as-Code-Praktiken.
  • Fehlerbehebung und Optimierung der Leistung über Sammler, Exporteure, Speicherbackends und Abfrageschichten.
  • Unterstützung bei Leistungstests, Lastvalidierung und Zuverlässigkeitsanalysen von Observability-Komponenten.
  • Zusammenarbeit mit Ingenieur- und SRE-Teams, um Dienste zu integrieren und die Telemetrieabdeckung über Plattformen zu verbessern.
  • Dokumentation von Implementierungen, Standards und Betriebsverfahren.

Erforderliche Fähigkeiten und Fachkenntnisse

  • Starke Programmiererfahrung in Go, Python oder Java mit Fokus auf Backend- oder Plattformengineering.
  • Praktische Erfahrung mit dem Prometheus-Ökosystem (Prometheus, Alertmanager, Exporteure, Pushgateway) und PromQL.
  • Erfahrung in der Implementierung von OpenTelemetry-Instrumentierung, Sammlern, Prozessoren und Pipelines.
  • Starkes Wissen über Kubernetes, Container, Helm und Microservices-Architektur.
  • Erfahrung mit CI/CD-Tools wie Jenkins, GitHub Actions, GitLab CI oder Argo CD.
  • Verständnis von verteilten Systemen, Leistungstuning, Debugging und Profiling-Techniken.
  • Vertrautheit mit Streaming- und Messaging-Systemen (z. B. Kafka oder Äquivalente) und Zeitreihendatenbanken.
  • Erfahrung im Aufbau oder in der Integration von REST/gRPC-APIs.
  • Kenntnisse in Git-Workflows, Skripting (Bash/Python) und Automatisierungsframeworks.
  • Verständnis von SNMP, Exporteuren und der Sammlung von Infrastruktur-/Geräte-Telemetriedaten.
  • Bewusstsein für Sicherheitsanforderungen, RBAC, Geheimnisverwaltung und Compliance-Anforderungen in Plattformumgebungen.

Site Reliability Engineer Arbeitgeber: Starcom consulting limited

Als Arbeitgeber bieten wir Ihnen die Möglichkeit, in einem dynamischen und innovativen Umfeld zu arbeiten, das auf Remote-Arbeit in Deutschland ausgerichtet ist. Unsere Unternehmenskultur fördert Zusammenarbeit und kontinuierliches Lernen, während wir Ihnen durch gezielte Schulungen und Entwicklungsmöglichkeiten helfen, Ihre Fähigkeiten als Site Reliability Engineer weiter auszubauen. Darüber hinaus profitieren Sie von flexiblen Arbeitszeiten und einer ausgewogenen Work-Life-Balance, die es Ihnen ermöglicht, Ihre beruflichen und persönlichen Ziele in Einklang zu bringen.
S

Kontaktperson:

Starcom consulting limited HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Site Reliability Engineer

Tip Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen SREs und Fachleuten in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden.

Tip Nummer 2

Bereite dich auf technische Interviews vor, indem du deine Kenntnisse in Prometheus, Kubernetes und OpenTelemetry auffrischst. Mach ein paar Mock-Interviews mit Freunden oder nutze Online-Ressourcen, um dein Selbstvertrauen zu stärken.

Tip Nummer 3

Zeige deine Leidenschaft für das Thema! Sprich über deine eigenen Projekte oder Beiträge zur Open-Source-Community. Das zeigt, dass du nicht nur die Theorie beherrschst, sondern auch praktisch anwendest.

Tip Nummer 4

Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtige Anlaufstelle erreicht und du die besten Chancen hast, gesehen zu werden.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Site Reliability Engineer

Go
Python
Java
Prometheus
Alertmanager
PromQL
OpenTelemetry
Kubernetes
Docker
Helm
CI/CD
Jenkins
Git
REST APIs
gRPC

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wir wollen dich kennenlernen, also zeig uns deine Persönlichkeit! Verwende eine lockere Sprache und sei authentisch in deinem Anschreiben. Das macht einen großen Unterschied.

Pass auf die Details auf!: Achte darauf, dass dein Lebenslauf und dein Anschreiben fehlerfrei sind. Rechtschreibfehler oder unklare Formulierungen können schnell einen schlechten Eindruck hinterlassen. Lass es am besten von jemand anderem gegenlesen!

Beziehe dich auf die Stellenbeschreibung!: Nutze die Begriffe und Anforderungen aus der Stellenbeschreibung in deiner Bewerbung. So zeigst du, dass du genau weißt, was wir suchen und wie du ins Team passt.

Bewirb dich über unsere Website!: Der einfachste Weg, um Teil unseres Teams zu werden, ist die Bewerbung über unsere Website. Dort findest du alle Informationen und kannst sicherstellen, dass deine Bewerbung direkt an die richtige Stelle gelangt.

Wie du dich auf ein Vorstellungsgespräch bei Starcom consulting limited vorbereitest

Verstehe die Technologien

Mach dich mit den Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie Prometheus, Grafana und OpenTelemetry. Zeige im Interview, dass du praktische Erfahrungen hast und bereit bist, diese Technologien zu nutzen und weiterzuentwickeln.

Bereite konkrete Beispiele vor

Überlege dir spezifische Projekte oder Herausforderungen, bei denen du deine Fähigkeiten in Go, Python oder Java eingesetzt hast. Sei bereit, über deine Rolle, die Probleme, die du gelöst hast, und die Ergebnisse zu sprechen, um deine Eignung für die Position zu demonstrieren.

Fragen stellen

Bereite einige Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Rolle und dem Unternehmen. Frage nach den aktuellen Herausforderungen im Team oder wie sie die Zusammenarbeit zwischen Engineering- und SRE-Teams gestalten.

Praktische Übungen

Sei darauf vorbereitet, praktische Aufgaben oder technische Fragen zu beantworten. Übe das Schreiben von PromQL-Abfragen oder das Erstellen von Dashboards in Grafana, um deine Fähigkeiten live zu demonstrieren. Das gibt dir die Möglichkeit, deine Expertise direkt zu zeigen.

Site Reliability Engineer
Starcom consulting limited
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>