Auf einen Blick
- Aufgaben: Entwickle und pflege eine Observability-Plattform mit modernen Technologien.
- Arbeitgeber: Innovatives Unternehmen im Bereich Site Reliability Engineering mit remote Arbeitsmöglichkeiten.
- Mitarbeitervorteile: Attraktives Gehalt, flexible Arbeitszeiten und Weiterbildungsmöglichkeiten.
- Andere Informationen: Dynamisches Team mit großartigen Entwicklungschancen.
- Warum dieser Job: Gestalte die Zukunft der Überwachungssysteme und arbeite an spannenden Projekten.
- Gewünschte Qualifikationen: Erfahrung in Programmierung, insbesondere Go, Python oder Java, und Kenntnisse in Kubernetes.
Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Job Standort: Deutschland (Remote)
Jobtyp: Befristeter Vertrag (12 Monate)
Verantwortlichkeiten
- Entwerfen, entwickeln und warten von Komponenten der Observability-Plattform und Integrationen über Prometheus, Thanos, Grafana, OpenTelemetry und Streaming-Telemetriesysteme.
- Beitragen zur Architektur und technischen Gestaltung skalierbarer Überwachungslösungen, die auf Kubernetes, Docker und cloud-nativen Umgebungen laufen.
- Implementierung standardisierter Instrumentierung mit OpenTelemetry, SDKs, Sammlern, Exporteuren und Agenten über Dienste und Infrastruktur.
- Erstellen und Optimieren von Telemetrie-Pipelines für Metriken, Protokolle und Traces unter Verwendung von Prometheus, OTEL-Sammler, Kafka/Streaming-Pipelines und Zeitreihen-Datenbanken.
- Entwicklung fortgeschrittener PromQL-Abfragen, Aufzeichnungsregeln und AlertManager-Logik für komplexe Überwachungsszenarien.
- Erstellen wiederverwendbarer Dashboards und Visualisierungsvorlagen mit Grafana (und Perses, falls zutreffend).
- Automatisierung von Bereitstellungen und Konfigurationen mit Git, GitHub/GitLab, Jenkins, ArgoCD, Helm und Infrastructure-as-Code-Praktiken.
- Fehlerbehebung und Optimierung der Leistung über Sammler, Exporteure, Speicherbackends und Abfrageschichten.
- Unterstützung bei Leistungstests, Lastvalidierung und Zuverlässigkeitsanalysen von Observability-Komponenten.
- Zusammenarbeit mit Ingenieur- und SRE-Teams, um Dienste zu integrieren und die Telemetrieabdeckung über Plattformen zu verbessern.
- Dokumentation von Implementierungen, Standards und Betriebsverfahren.
Erforderliche Fähigkeiten und Fachkenntnisse
- Starke Programmiererfahrung in Go, Python oder Java mit Fokus auf Backend- oder Plattformengineering.
- Praktische Erfahrung mit dem Prometheus-Ökosystem (Prometheus, Alertmanager, Exporteure, Pushgateway) und PromQL.
- Erfahrung in der Implementierung von OpenTelemetry-Instrumentierung, Sammlern, Prozessoren und Pipelines.
- Starkes Wissen über Kubernetes, Container, Helm und Microservices-Architektur.
- Erfahrung mit CI/CD-Tools wie Jenkins, GitHub Actions, GitLab CI oder Argo CD.
- Verständnis von verteilten Systemen, Leistungstuning, Debugging und Profiling-Techniken.
- Vertrautheit mit Streaming- und Messaging-Systemen (z. B. Kafka oder Äquivalente) und Zeitreihendatenbanken.
- Erfahrung im Aufbau oder in der Integration von REST/gRPC-APIs.
- Kenntnisse in Git-Workflows, Skripting (Bash/Python) und Automatisierungsframeworks.
- Verständnis von SNMP, Exporteuren und der Sammlung von Infrastruktur-/Geräte-Telemetriedaten.
- Bewusstsein für Sicherheitsanforderungen, RBAC, Geheimnisverwaltung und Compliance-Anforderungen in Plattformumgebungen.
Site Reliability Engineer Arbeitgeber: Starcom consulting limited
Kontaktperson:
Starcom consulting limited HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Site Reliability Engineer
✨Tip Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen SREs und Fachleuten in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden.
✨Tip Nummer 2
Bereite dich auf technische Interviews vor, indem du deine Kenntnisse in Prometheus, Kubernetes und OpenTelemetry auffrischst. Mach ein paar Mock-Interviews mit Freunden oder nutze Online-Ressourcen, um dein Selbstvertrauen zu stärken.
✨Tip Nummer 3
Zeige deine Leidenschaft für das Thema! Sprich über deine eigenen Projekte oder Beiträge zur Open-Source-Community. Das zeigt, dass du nicht nur die Theorie beherrschst, sondern auch praktisch anwendest.
✨Tip Nummer 4
Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtige Anlaufstelle erreicht und du die besten Chancen hast, gesehen zu werden.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Site Reliability Engineer
Tipps für deine Bewerbung 🫡
Sei du selbst!: Wir wollen dich kennenlernen, also zeig uns deine Persönlichkeit! Verwende eine lockere Sprache und sei authentisch in deinem Anschreiben. Das macht einen großen Unterschied.
Pass auf die Details auf!: Achte darauf, dass dein Lebenslauf und dein Anschreiben fehlerfrei sind. Rechtschreibfehler oder unklare Formulierungen können schnell einen schlechten Eindruck hinterlassen. Lass es am besten von jemand anderem gegenlesen!
Beziehe dich auf die Stellenbeschreibung!: Nutze die Begriffe und Anforderungen aus der Stellenbeschreibung in deiner Bewerbung. So zeigst du, dass du genau weißt, was wir suchen und wie du ins Team passt.
Bewirb dich über unsere Website!: Der einfachste Weg, um Teil unseres Teams zu werden, ist die Bewerbung über unsere Website. Dort findest du alle Informationen und kannst sicherstellen, dass deine Bewerbung direkt an die richtige Stelle gelangt.
Wie du dich auf ein Vorstellungsgespräch bei Starcom consulting limited vorbereitest
✨Verstehe die Technologien
Mach dich mit den Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie Prometheus, Grafana und OpenTelemetry. Zeige im Interview, dass du praktische Erfahrungen hast und bereit bist, diese Technologien zu nutzen und weiterzuentwickeln.
✨Bereite konkrete Beispiele vor
Überlege dir spezifische Projekte oder Herausforderungen, bei denen du deine Fähigkeiten in Go, Python oder Java eingesetzt hast. Sei bereit, über deine Rolle, die Probleme, die du gelöst hast, und die Ergebnisse zu sprechen, um deine Eignung für die Position zu demonstrieren.
✨Fragen stellen
Bereite einige Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Rolle und dem Unternehmen. Frage nach den aktuellen Herausforderungen im Team oder wie sie die Zusammenarbeit zwischen Engineering- und SRE-Teams gestalten.
✨Praktische Übungen
Sei darauf vorbereitet, praktische Aufgaben oder technische Fragen zu beantworten. Übe das Schreiben von PromQL-Abfragen oder das Erstellen von Dashboards in Grafana, um deine Fähigkeiten live zu demonstrieren. Das gibt dir die Möglichkeit, deine Expertise direkt zu zeigen.