Auf einen Blick
- Aufgaben: Gestalte die Zuverlässigkeit und Skalierbarkeit von Netzwerksystemen für KI-Cloud-Infrastrukturen.
- Unternehmen: Innovatives Unternehmen im Bereich KI und Cloud-Technologie.
- Vorteile: Wettbewerbsfähiges Gehalt, flexible Remote-Arbeit und Karriereentwicklung.
- Weitere Informationen: Dynamisches Umfeld mit internationalem Team und großem Wachstumspotenzial.
- Warum dieser Job: Arbeite an spannenden Projekten und beeinflusse die Zukunft der Netzwerktechnologie.
- Qualifikationen: Erfahrung in Site Reliability Engineering und Netzwerkmanagement erforderlich.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Wir suchen derzeit einen Senior Network Site Reliability Engineer (NetSRE) in Deutschland. Treten Sie einem hoch technischen, schnell wachsenden Umfeld bei, das sich auf den Aufbau von KI-Cloud-Infrastrukturen der nächsten Generation im globalen Maßstab konzentriert. In dieser Rolle helfen Sie, die Zuverlässigkeit, Skalierbarkeit und betriebliche Exzellenz von mission-kritischen Netzwerksystemen sicherzustellen, die fortschrittliche KI-Workloads und verteilte Plattformen unterstützen.
In dieser Position arbeiten Sie an der Schnittstelle von Netzwerk, Automatisierung und Site Reliability Engineering und arbeiten eng mit Infrastruktur- und Plattformteams zusammen, um resiliente Systeme zu entwerfen und die betriebliche Leistung zu optimieren. Diese Gelegenheit ist ideal für Ingenieure, die es genießen, komplexe Infrastrukturherausforderungen zu lösen, Automatisierung voranzutreiben und die Zuverlässigkeit durch ingenieurtechnische Praktiken zu verbessern.
Sie werden zu großangelegten Netzwerkoperationen beitragen und Einfluss auf Werkzeuge, Beobachtbarkeit, Vorfallreaktion und Bereitstellungsstrategien nehmen. Die Umgebung schätzt Eigenverantwortung, Innovation, Zusammenarbeit und kontinuierliche Verbesserung in global verteilten Teams.
Verantwortlichkeiten:- Definieren und Verwalten von Zuverlässigkeitszielen für kritische Netzwerkdienste, einschließlich SLIs, SLOs, Verfügbarkeitsziele und betriebliche Leistungsstandards.
- Leiten von Initiativen zur Verbesserung der Netzwerkzuverlässigkeit über Infrastruktur, inter-site Konnektivität und betriebliche Workflows.
- Verantwortung für Vorfallreaktionsprozesse in Netzwerkumgebungen, Durchführung von Ursachenanalysen und Implementierung langfristiger Korrekturmaßnahmen.
- Entwerfen und Verbessern von Beobachtbarkeitssystemen durch Metriken, Protokollierung, Nachverfolgung, Alarmierung und Überwachungsverbesserungen zur Beschleunigung der Fehlersuche und Wiederherstellung.
- Aufbauen und Pflegen von Automatisierung, CI/CD-Pipelines, Testumgebungen, Rollback-Mechanismen und sicheren Bereitstellungsprozessen für Netzwerkänderungen.
- Zusammenarbeit mit Plattformengineering- und Infrastrukturteams zur Verbesserung der Betriebsfähigkeit, Skalierbarkeit und Zuverlässigkeit von Netzwerksystemen.
- Entwicklung von Werkzeugen und Automatisierungslösungen unter Verwendung moderner Programmiersprachen und Praktiken des Infrastrukturmanagements.
- Unterstützung von Betriebsbereitschaft und Skalierbarkeitsinitiativen für hochverfügbare und hochdurchsatzfähige Netzwerkumgebungen.
- Starke Erfahrung in den Bereichen Site Reliability Engineering, Netzwerkengineering oder Infrastrukturengineering in großen Produktionsumgebungen.
- Solide Linux-Systemadministrationsexpertise und nachgewiesene Fähigkeit zur Fehlersuche in komplexen verteilten Systemen.
- Starkes Verständnis der Netzwerkgrundlagen, einschließlich Ausfallbereiche, Latenz, Paketverlust, Konzepte der Steuerungs- und Datenebene sowie hochverfügbare Architekturen.
- Praktische Erfahrung im Betrieb und in der Verbesserung zuverlässiger Produktionssysteme durch Automatisierung und bewährte Ingenieurpraktiken.
- Kenntnisse in Softwareentwicklung oder Skripting mit Go, Python oder ähnlichen Programmiersprachen.
- Erfahrung mit Infrastructure-as-Code, CI/CD-Pipelines, containerisierten Umgebungen und betrieblichen Automatisierungstools.
- Vertrautheit mit Beobachtbarkeit, Telemetrie, Überwachungssystemen und Praktiken des Vorfallmanagements.
- Fähigkeit zur Zusammenarbeit mit verschiedenen Engineering-Teams bei gleichzeitiger Wahrung starker Eigenverantwortung und Kommunikationsfähigkeiten.
- Zusätzliche Erfahrungen mit eBPF/XDP, DPDK, großangelegter Netzwerk-Telemetrie, NAT64, Lastenausgleich oder fortgeschrittener Netzwerkleistungsoptimierung werden als großer Vorteil angesehen.
- Wettbewerbsfähiges Vergütungspaket.
- Flexible Remote-Arbeitsmöglichkeiten in ganz Europa.
- Karriereentwicklung und kontinuierliche Lernmöglichkeiten.
- Kollaborative und ingenieurgesteuerte Arbeitsumgebung.
- Gelegenheit, zu bahnbrechenden KI-Infrastrukturprojekten beizutragen.
- Einblick in internationale Teams und großangelegte verteilte Systeme.
- Einflussreiche Rolle mit starker Eigenverantwortung und technischem Einfluss.
- Unterstützende Kultur, die sich auf Innovation, Wachstum und Work-Life-Balance konzentriert.
Senior Network Site Reliability Engineer (NetSRE) Arbeitgeber: Jobgether
Als Arbeitgeber bieten wir Ihnen die Möglichkeit, in einem dynamischen und innovativen Umfeld zu arbeiten, das sich auf den Aufbau von KI-Cloud-Infrastrukturen der nächsten Generation konzentriert. Unsere Unternehmenskultur fördert Zusammenarbeit, kontinuierliche Verbesserung und technologische Exzellenz, während wir flexible Arbeitsoptionen in ganz Europa anbieten. Zudem unterstützen wir Ihre berufliche Entwicklung durch zahlreiche Lernmöglichkeiten und ermöglichen Ihnen, an hochkarätigen Projekten mit internationalem Einfluss teilzunehmen.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior Network Site Reliability Engineer (NetSRE) erhalten könnten
✨Tipp Nummer 1
Netzwerk- und Infrastrukturkenntnisse sind entscheidend! Zeig in deinem Gespräch, dass du die Grundlagen der Netzwerktechnologie verstehst und wie du diese in der Praxis anwendest. Bereite dich darauf vor, konkrete Beispiele aus deiner Erfahrung zu teilen.
✨Tipp Nummer 2
Automatisierung ist der Schlüssel! Sprich darüber, wie du Automatisierung in deinen bisherigen Projekten eingesetzt hast, um Effizienz und Zuverlässigkeit zu steigern. Zeig, dass du mit modernen Tools und Programmiersprachen vertraut bist.
✨Tipp Nummer 3
Sei bereit, über Vorfälle zu sprechen! Erkläre, wie du in der Vergangenheit mit Netzwerkproblemen umgegangen bist und welche Maßnahmen du ergriffen hast, um ähnliche Probleme in Zukunft zu vermeiden. Das zeigt deine Problemlösungsfähigkeiten.
✨Tipp Nummer 4
Nutze unsere Plattform! Bewirb dich direkt über unsere Website, um sicherzustellen, dass deine Bewerbung schnell und effizient bearbeitet wird. Wir helfen dir, die besten Chancen auf dem Markt zu nutzen!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Network Site Reliability Engineer (NetSRE) mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei authentisch!:Wenn du deine Bewerbung schreibst, sei einfach du selbst. Zeig uns, wer du bist und was dich motiviert. Wir suchen nach echten Persönlichkeiten, die zu unserem Team passen!
Betone deine Erfahrungen:Stell sicher, dass du deine relevanten Erfahrungen im Bereich Site Reliability Engineering und Netzwerktechnik klar hervorhebst. Zeig uns, wie du komplexe Probleme gelöst hast und welche Tools du verwendet hast.
Verwende klare Sprache:Halte deine Bewerbung klar und präzise. Vermeide Fachjargon, wenn es nicht nötig ist, und achte darauf, dass wir deine Fähigkeiten und Erfahrungen leicht verstehen können.
Bewirb dich über unsere Website:Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell und effizient bearbeitet wird. Wir freuen uns auf deine Unterlagen!
Wie man sich auf ein Vorstellungsgespräch bei Jobgether vorbereitet
✨Verstehe die Grundlagen
Mach dich mit den grundlegenden Konzepten der Netzwerktechnologie vertraut. Du solltest die Begriffe wie SLIs, SLOs und Hochverfügbarkeitsarchitekturen nicht nur kennen, sondern auch in der Lage sein, sie in praktischen Szenarien anzuwenden.
✨Automatisierung im Fokus
Bereite dich darauf vor, über deine Erfahrungen mit Automatisierung zu sprechen. Zeige, wie du CI/CD-Pipelines oder Infrastruktur als Code implementiert hast, um die Zuverlässigkeit von Systemen zu verbessern. Konkrete Beispiele sind hier Gold wert!
✨Teamarbeit betonen
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, über deine Erfahrungen in interdisziplinären Teams zu sprechen. Betone, wie du zur Verbesserung der operativen Leistung beigetragen hast und welche Kommunikationsstrategien du verwendet hast.
✨Vorbereitung auf technische Fragen
Erwarte technische Fragen zu komplexen verteilten Systemen und deren Fehlersuche. Übe, wie du Probleme analysierst und Lösungen entwickelst. Das zeigt dein tiefes Verständnis und deine Fähigkeit, in kritischen Situationen ruhig zu bleiben.