Senior System Engineer

Senior System Engineer

München Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
R

Auf einen Blick

  • Aufgaben: Entwickle Software für KI-Infrastruktur und optimiere Hochleistungs-Computing-Lösungen.
  • Arbeitgeber: Schnell wachsendes Deep-Tech-Unternehmen, führend in Quanten-Software in der EU.
  • Mitarbeitervorteile: Unbefristeter Vertrag, Umzugspaket, private Krankenversicherung und Bildungsbudget.
  • Andere Informationen: Dynamisches Umfeld mit Karrierechancen und einer Kultur des Lernens.
  • Warum dieser Job: Arbeite mit modernster Technologie und forme die Zukunft der KI.
  • Gewünschte Qualifikationen: 10+ Jahre Erfahrung in Systemprogrammierung und tiefes Kubernetes-Wissen.

Das voraussichtliche Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

Gut finanziertes und schnell wachsendes Deep-Tech-Unternehmen, gegründet im Jahr 2019. Wir sind das größte Quantum-Softwareunternehmen in der EU und gehören zu den 100 vielversprechendsten Unternehmen im Bereich KI weltweit (laut CB Insights, 2023) mit über 150 Mitarbeitern und wachsend, vollständig multikulturell und international.

Anforderungen

  • Systems Programming Expertise: Über 10 Jahre Erfahrung in der Softwareentwicklung mit starker Beherrschung von Python. Sie sollten in der Lage sein, Systemagenten, APIs und CLI-Tools zu erstellen.
  • Tiefe Kubernetes-Kenntnisse: Sie verstehen die K8s-Interna über einfache Bereitstellungen hinaus. Erfahrung mit benutzerdefinierten Ressourcen-Definitionen (CRDs), Operatoren und der Architektur des Kubernetes-API-Servers.
  • GPU-Ökosystem-Erfahrung: Praktische Erfahrung in der Verwaltung von NVIDIA-GPU-Clustern. Vertrautheit mit NVIDIA-Treibern, CUDA-Toolkit und der Container-Laufzeit (NVIDIA Container Toolkit).
  • Linux-Interna: Tiefes Verständnis des Linux-Kernels, cgroups, Namespaces und der Systemleistungsoptimierung.
  • Infrastructure as Code: Beherrschung deklarativer Infrastrukturtools (Terraform, Ansible) mit Fokus auf die Bereitstellung physischer Hardware anstelle von Cloud-VMs.
  • Problemlösung: Nachweisliche Erfolge beim Debuggen komplexer verteilter Systeme, bei denen die Ursache im Code, Netzwerk oder Silizium liegen könnte.

Bevorzugte Qualifikationen

  • HPC-Hintergrund: Erfahrung mit traditionellen Supercomputing-Schedulern (Slurm, PBS) oder modernen Batch-Schedulern (Volcano, Kueue, Ray).
  • Bare Metal Provisioning: Erfahrung mit Tools wie Cluster API (CAPI), Metal3, Tinkerbell, Canonical MaaS oder OpenStack Ironic.
  • Hochgeschwindigkeitsnetzwerke: Kenntnisse über RDMA, InfiniBand, GPUDirect und wie man diese Technologien für containerisierte Workloads zugänglich macht.
  • AI/ML-Vertrautheit: Verständnis dafür, wie verteiltes Training funktioniert (z.B. PyTorch Distributed, Megatron-LM, DeepSpeed) und die Infrastrukturanforderungen großer Sprachmodelle (LLMs).
  • Observability: Erfahrung im Aufbau von Monitoring für die Hardwaregesundheit (DCGM) und verteiltes Tracing für langlaufende Jobs.

Standort

Bewerber müssen eine rechtliche Genehmigung haben, um in dem Land zu arbeiten, in dem die Position angesiedelt ist.

Was Sie tun werden

  • Aufbau der Steuerungsebene: Entwurf und Entwicklung der Softwareebene (APIs, Controller, Agenten), die den Lebenszyklus der Bare-Metal-AI-Infrastruktur automatisiert.
  • Orchestrierung von Hochleistungsrechnern: Architektur von Scheduling-Lösungen für großangelegte verteilte Trainingsjobs über massive GPU-Cluster (NVIDIA H200/B200/B300), um effizientes Bin-Packing und Gang-Scheduling sicherzustellen.
  • Optimierung des Fabrics: Feinabstimmung der softwaredefinierten Netzwerkschicht zur Unterstützung von latenzarmen Interconnects (InfiniBand/RDMA/RoCEv2), die für das Training mehrerer Knoten unerlässlich sind.
  • Entwicklung von Kubernetes-Erweiterungen: Schreiben von benutzerdefinierten Kubernetes-Operatoren und CRDs, um komplexe Hardware-Reality (Topologie-Bewusstsein, GPU-Partitionierung) in nutzbare Schnittstellen für unsere Data Scientists zu abstrahieren.
  • Hardware-Level-Debugging: Untersuchung und Behebung tiefgreifender Systemprobleme, die von PCIe-Busfehlern und NCCL-Kommunikationszeitüberschreitungen bis hin zu Kernel-Paniken auf Bare-Metal-Knoten reichen.
  • Festlegung von Standards: Erstellung des "Goldenen Bildes" für AI-Workloads, Verwaltung von Treibern, Firmware und OS-Optimierungen, um die maximale Leistung aus der Hardware herauszuholen.

Unbefristeter Vertrag. Unterzeichnungsbonus. Umzugspaket (falls zutreffend). Private Krankenversicherung. Anspruch auf Bildungsbudget gemäß interner Richtlinie. Hybride Möglichkeit. Arbeiten in einem schnelllebigen Umfeld, an modernsten Technologien. Karriereplan. Möglichkeit zu lernen und zu lehren. Fortschrittliches Unternehmen. Kultur glücklicher Menschen.

Senior System Engineer Arbeitgeber: RemoteStar

Als eines der vielversprechendsten Unternehmen im Bereich KI und die größte Quanten-Softwarefirma in der EU bietet unser schnell wachsendes, tieftechnologisches Unternehmen eine dynamische und multikulturelle Arbeitsumgebung. Wir fördern eine positive Unternehmenskultur, die auf kontinuierlichem Lernen und persönlichem Wachstum basiert, und bieten attraktive Vorteile wie einen unbefristeten Vertrag, ein Umzugspaket, private Krankenversicherung und die Möglichkeit, an der Spitze innovativer Technologien zu arbeiten.
R

Kontaktperson:

RemoteStar HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior System Engineer

Netzwerken, Netzwerken, Netzwerken!

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht vergessen, dass viele Jobs über persönliche Empfehlungen vergeben werden. Also, sei aktiv und knüpfe Kontakte!

Sei bereit für technische Interviews!

Mach dich mit typischen Fragen und Herausforderungen vertraut, die in technischen Interviews gestellt werden. Übe das Lösen von Problemen in Echtzeit, damit du im Interview glänzen kannst. Wir können dir helfen, die besten Ressourcen dafür zu finden!

Präsentiere deine Projekte!

Hast du an spannenden Projekten gearbeitet? Zeig sie! Erstelle ein Portfolio oder eine GitHub-Seite, um deine Fähigkeiten zu demonstrieren. Das gibt den Arbeitgebern einen Einblick in dein Können und deine Leidenschaft.

Bewirb dich direkt über unsere Website!

Wir haben tolle Stellenangebote, die perfekt zu deinem Profil passen könnten. Bewirb dich direkt über unsere Website, um sicherzustellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt. Lass uns gemeinsam den nächsten Schritt in deiner Karriere gehen!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior System Engineer

Python
Kubernetes
Custom Resource Definitions (CRDs)
Operators
NVIDIA GPU Management
CUDA Toolkit
Linux Kernel
cgroups
Namespaces
Terraform
Ansible
Debugging komplexer verteilter Systeme
HPC (High Performance Computing)
Bare Metal Provisioning
RDMA
InfiniBand

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wir wollen dich kennenlernen, also zeig uns deine Persönlichkeit! Verwende eine lockere Sprache und sei authentisch in deinem Anschreiben. Das macht einen viel besseren Eindruck als ein standardisiertes Bewerbungsschreiben.

Betone deine Erfahrungen: Stell sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Wenn du mit Kubernetes oder NVIDIA GPU-Clustern gearbeitet hast, dann erzähl uns davon! Wir suchen nach konkreten Beispielen, die zeigen, wie du Probleme gelöst hast.

Mach es übersichtlich: Halte dein Anschreiben und deinen Lebenslauf klar und strukturiert. Verwende Absätze und Aufzählungen, um wichtige Informationen hervorzuheben. So können wir schnell erkennen, was du zu bieten hast!

Bewirb dich über unsere Website: Der einfachste Weg, um bei uns zu landen, ist, dich direkt über unsere Website zu bewerben. Dort findest du alle Informationen und kannst sicherstellen, dass deine Bewerbung an die richtige Stelle gelangt. Wir freuen uns auf deine Unterlagen!

Wie du dich auf ein Vorstellungsgespräch bei RemoteStar vorbereitest

Mach dich mit den Technologien vertraut

Stelle sicher, dass du die Technologien und Tools, die in der Stellenbeschreibung erwähnt werden, gut verstehst. Das bedeutet, dass du nicht nur die Grundlagen von Kubernetes, Python und dem GPU-Ökosystem kennst, sondern auch tiefergehende Kenntnisse über deren interne Funktionsweise hast. Bereite dich darauf vor, spezifische Fragen zu diesen Themen zu beantworten.

Praktische Beispiele parat haben

Bereite konkrete Beispiele aus deiner bisherigen Berufserfahrung vor, die deine Fähigkeiten im Bereich Systemprogrammierung und Problemlösung demonstrieren. Zeige, wie du komplexe Probleme in verteilten Systemen gelöst hast und welche Tools du dabei verwendet hast. Das gibt den Interviewern einen klaren Einblick in deine praktische Erfahrung.

Fragen zur Unternehmenskultur stellen

Da das Unternehmen eine multikulturelle und internationale Umgebung bietet, ist es wichtig, Fragen zur Unternehmenskultur zu stellen. Zeige dein Interesse an der Teamdynamik und wie du dich in ein diverses Team integrieren kannst. Das zeigt, dass du nicht nur an der technischen Seite interessiert bist, sondern auch an der Zusammenarbeit mit anderen.

Vorbereitung auf technische Herausforderungen

Erwarte technische Fragen oder sogar praktische Tests während des Interviews. Übe, wie du deine Denkweise bei der Lösung von Problemen darstellst, insbesondere bei Themen wie Hardware-Debugging oder der Optimierung von Netzwerken. Das wird dir helfen, deine Fähigkeiten unter Beweis zu stellen und zu zeigen, dass du in der Lage bist, in einem schnelllebigen Umfeld zu arbeiten.

Senior System Engineer
RemoteStar
Standort: München
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>