Senior System Engineer (Munich, Germany)
Senior System Engineer (Munich, Germany)

Senior System Engineer (Munich, Germany)

München Vollzeit 75000 - 100000 € / Jahr (geschätzt) Home Office möglich (teilweise)
Go Premium
R

Auf einen Blick

  • Aufgaben: Entwickle Software für KI-Infrastruktur und optimiere Hochleistungs-Computing-Lösungen.
  • Arbeitgeber: Schnell wachsendes Deep-Tech-Unternehmen, führend in Quanten-Software in der EU.
  • Mitarbeitervorteile: Unbefristeter Vertrag, leistungsabhängiger Bonus, private Krankenversicherung und Bildungsbudget.
  • Andere Informationen: Dynamisches Umfeld mit flexiblen Arbeitszeiten und Karriereentwicklungsmöglichkeiten.
  • Warum dieser Job: Arbeite mit modernster Technologie und forme die Zukunft der KI-Infrastruktur.
  • Gewünschte Qualifikationen: 10+ Jahre Erfahrung in Systemprogrammierung, tiefes Kubernetes-Wissen und GPU-Management.

Das voraussichtliche Gehalt liegt zwischen 75000 - 100000 € pro Jahr.

Über den Kunden: Ein gut finanziertes und schnell wachsendes Deep-Tech-Unternehmen, das 2019 gegründet wurde. Wir sind das größte Quantum-Softwareunternehmen in der EU und gehören laut CB Insights (2023) zu den 100 vielversprechendsten Unternehmen im Bereich KI weltweit, mit über 150 Mitarbeitern und wachsend, vollständig multikulturell und international.

Anforderungen

  • Systemprogrammierungsexpertise: Über 10 Jahre Erfahrung in der Softwareentwicklung mit starker Beherrschung von Python. Sie sollten in der Lage sein, Systemagenten, APIs und CLI-Tools zu erstellen.
  • Tiefes Kubernetes-Wissen: Sie verstehen die K8s-Interna über einfache Bereitstellungen hinaus. Erfahrung mit benutzerdefinierten Ressourcen-Definitionen (CRDs), Operatoren und der Architektur des Kubernetes-API-Servers.
  • GPU-Ökosystem-Erfahrung: Praktische Erfahrung in der Verwaltung von NVIDIA-GPU-Clustern. Vertrautheit mit NVIDIA-Treibern, CUDA-Toolkit und der Container-Laufzeit (NVIDIA Container Toolkit).
  • Linux-Interna: Tiefes Verständnis des Linux-Kernels, cgroups, Namespaces und der Systemleistungsoptimierung.
  • Infrastructure as Code: Beherrschung deklarativer Infrastrukturtools (Terraform, Ansible) mit Fokus auf die Bereitstellung physischer Hardware anstelle von Cloud-VMs.
  • Problemlösung: Nachweisliche Erfolge beim Debuggen komplexer verteilter Systeme, bei denen die Ursache im Code, Netzwerk oder Silizium liegen könnte.

Bevorzugte Qualifikationen

  • HPC-Hintergrund: Erfahrung mit traditionellen Supercomputing-Planungssystemen (Slurm, PBS) oder modernen Batch-Planungssystemen (Volcano, Kueue, Ray).
  • Bare-Metal-Bereitstellung: Erfahrung mit Tools wie Cluster API (CAPI), Metal3, Tinkerbell, Canonical MaaS oder OpenStack Ironic.
  • Hochgeschwindigkeitsnetzwerke: Kenntnisse über RDMA, InfiniBand, GPUDirect und wie man diese Technologien für containerisierte Workloads zugänglich macht.
  • AI/ML-Vertrautheit: Verständnis dafür, wie verteiltes Training funktioniert (z.B. PyTorch Distributed, Megatron-LM, DeepSpeed) und die Infrastrukturanforderungen großer Sprachmodelle (LLMs).
  • Observability: Erfahrung im Aufbau von Monitoring für die Hardwaregesundheit (DCGM) und verteiltes Tracing für langlaufende Jobs.

Was Sie tun werden

  • Aufbau der Steuerungsebene: Entwurf und Entwicklung der Softwareebene (APIs, Controller, Agenten), die den Lebenszyklus der Bare-Metal-AI-Infrastruktur automatisiert.
  • Orchestrierung von Hochleistungsrechnern: Architektur von Planungslösungen für großangelegte verteilte Trainingsjobs über massive GPU-Cluster (NVIDIA H200/B200/B300), um effizientes Bin-Packing und Gang-Planung sicherzustellen.
  • Optimierung des Fabrics: Feinabstimmung der softwaredefinierten Netzwerkschicht zur Unterstützung von latenzarmen Interconnects (InfiniBand/RDMA/RoCEv2), die für das Training mehrerer Knoten unerlässlich sind.
  • Entwicklung von Kubernetes-Erweiterungen: Schreiben benutzerdefinierter Kubernetes-Operatoren und CRDs, um komplexe Hardware-Reale in nutzbare Schnittstellen für unsere Data Scientists zu abstrahieren.
  • Hardware-Level-Debugging: Untersuchung und Behebung tiefgreifender Systemprobleme, die von PCIe-Busfehlern und NCCL-Kommunikationszeitüberschreitungen bis hin zu Kernel-Paniken auf Bare-Metal-Knoten reichen.
  • Festlegung von Standards: Erstellung des „Goldenen Bildes“ für AI-Workloads, Verwaltung von Treibern, Firmware und OS-Optimierungen, um die maximale Leistung aus der Hardware herauszuholen.

Vorteile

  • Unbefristeter Vertrag.
  • Gleiches Gehalt garantiert.
  • Variabler Leistungsbonus.
  • Unterzeichnungsbonus.
  • Umzugspaket (falls zutreffend).
  • Private Krankenversicherung.
  • Anspruch auf Bildungsbudget gemäß interner Richtlinie.
  • Hybride Möglichkeit.
  • Flexible Arbeitszeiten.
  • Arbeiten in einem schnelllebigen Umfeld mit modernster Technologie.
  • Karriereplan. Möglichkeit zu lernen und zu lehren.
  • Fortschrittliches Unternehmen. Kultur glücklicher Menschen.

Senior System Engineer (Munich, Germany) Arbeitgeber: RemoteStar

Unser Unternehmen ist ein schnell wachsendes Deep-Tech-Unternehmen mit Sitz in München, das sich auf Quanten-Software spezialisiert hat und als eines der vielversprechendsten Unternehmen im Bereich KI gilt. Wir bieten unseren Mitarbeitern nicht nur ein unbefristetes Arbeitsverhältnis und ein wettbewerbsfähiges Gehalt, sondern auch flexible Arbeitszeiten und die Möglichkeit, in einem multikulturellen Team an innovativen Technologien zu arbeiten. Zudem fördern wir die persönliche und berufliche Weiterentwicklung durch individuelle Karrierepläne und ein unterstützendes Arbeitsumfeld.
R

Kontaktperson:

RemoteStar HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior System Engineer (Munich, Germany)

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe Coding-Challenges und Systemdesign-Fragen, die für die Rolle als Senior System Engineer relevant sind. Wir haben viele Ressourcen, die dir dabei helfen können!

Tipp Nummer 3

Sei bereit, deine Erfahrungen zu teilen! Erzähl von deinen Projekten und wie du komplexe Probleme gelöst hast. Das zeigt dein Können und deine Leidenschaft für die Technik.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtigen Leute erreicht. Und vergiss nicht, uns bei Fragen zu kontaktieren!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior System Engineer (Munich, Germany)

Python
Kubernetes
Custom Resource Definitions (CRDs)
Operators
NVIDIA GPU Management
CUDA Toolkit
Linux Kernel
cgroups
Namespaces
Terraform
Ansible
Debugging komplexer verteilter Systeme
HPC Erfahrung
Bare Metal Provisioning
RDMA
InfiniBand

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wir wollen dich kennenlernen, also sei authentisch in deiner Bewerbung. Zeig uns, wer du bist und was dich motiviert, Teil unseres Teams zu werden. Lass deine Persönlichkeit durchscheinen!

Pass auf die Details auf!: Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Nimm dir die Zeit, alles gründlich zu überprüfen, bevor du es abschickst.

Zeig deine Erfahrungen!: Erzähle uns von deinen bisherigen Projekten und wie sie zu den Anforderungen der Stelle passen. Konkrete Beispiele helfen uns, deine Fähigkeiten besser zu verstehen und zu sehen, wie du unser Team bereichern kannst.

Bewirb dich über unsere Website!: Der einfachste Weg, um sicherzustellen, dass wir deine Bewerbung erhalten, ist, sie direkt über unsere Website einzureichen. So kannst du sicher sein, dass alles an die richtige Stelle gelangt und wir schnell auf dich reagieren können.

Wie du dich auf ein Vorstellungsgespräch bei RemoteStar vorbereitest

Mach dich mit der Unternehmensvision vertraut

Bevor du zum Interview gehst, solltest du dir die Zeit nehmen, die Mission und Vision des Unternehmens zu verstehen. Da es sich um ein schnell wachsendes Deep-Tech-Unternehmen handelt, ist es wichtig, dass du zeigen kannst, wie deine Fähigkeiten und Erfahrungen zur Erreichung ihrer Ziele beitragen können.

Technisches Wissen auffrischen

Stelle sicher, dass du deine Kenntnisse in Python, Kubernetes und dem GPU-Ökosystem auf den neuesten Stand bringst. Bereite dich darauf vor, technische Fragen zu beantworten und vielleicht sogar praktische Aufgaben zu lösen, die deine Fähigkeiten in diesen Bereichen testen.

Beispiele für Problemlösungen parat haben

Bereite konkrete Beispiele aus deiner bisherigen Berufserfahrung vor, in denen du komplexe Probleme gelöst hast. Zeige, wie du Debugging-Methoden angewendet hast, um Herausforderungen in verteilten Systemen zu bewältigen. Das wird dir helfen, deine Problemlösungsfähigkeiten zu demonstrieren.

Fragen zur Unternehmenskultur stellen

Nutze die Gelegenheit, um Fragen zur Unternehmenskultur und den Teamdynamiken zu stellen. Da das Unternehmen Wert auf eine progressive Kultur legt, zeigt dies dein Interesse an einem positiven Arbeitsumfeld und hilft dir, herauszufinden, ob es gut zu dir passt.

Senior System Engineer (Munich, Germany)
RemoteStar
Standort: München
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>