Auf einen Blick
- Aufgaben: Entwickle Software für KI-Infrastruktur und optimiere Hochleistungs-Computing-Lösungen.
- Arbeitgeber: Schnell wachsendes Deep-Tech-Unternehmen, führend in Quanten-Software in der EU.
- Mitarbeitervorteile: Unbefristeter Vertrag, Umzugspaket, private Krankenversicherung und Bildungsbudget.
- Andere Informationen: Dynamisches Umfeld mit Karrierechancen und einer Kultur des Lernens.
- Warum dieser Job: Arbeite mit modernster Technologie und forme die Zukunft der KI.
- Gewünschte Qualifikationen: 10+ Jahre Erfahrung in Systemprogrammierung und tiefes Kubernetes-Wissen.
Das voraussichtliche Gehalt liegt zwischen 75000 - 95000 € pro Jahr.
Gut finanziertes und schnell wachsendes Deep-Tech-Unternehmen, gegründet im Jahr 2019. Wir sind das größte Quantum-Softwareunternehmen in der EU und gehören zu den 100 vielversprechendsten Unternehmen im Bereich KI weltweit (laut CB Insights, 2023) mit über 150 Mitarbeitern und wachsend, vollständig multikulturell und international.
Anforderungen
- Systems Programming Expertise: Über 10 Jahre Erfahrung in der Softwareentwicklung mit starker Beherrschung von Python. Sie sollten in der Lage sein, Systemagenten, APIs und CLI-Tools zu erstellen.
- Tiefe Kubernetes-Kenntnisse: Sie verstehen die K8s-Interna über einfache Bereitstellungen hinaus. Erfahrung mit benutzerdefinierten Ressourcen-Definitionen (CRDs), Operatoren und der Architektur des Kubernetes-API-Servers.
- GPU-Ökosystem-Erfahrung: Praktische Erfahrung in der Verwaltung von NVIDIA-GPU-Clustern. Vertrautheit mit NVIDIA-Treibern, CUDA-Toolkit und der Container-Laufzeit (NVIDIA Container Toolkit).
- Linux-Interna: Tiefes Verständnis des Linux-Kernels, cgroups, Namespaces und der Systemleistungsoptimierung.
- Infrastructure as Code: Beherrschung deklarativer Infrastrukturtools (Terraform, Ansible) mit Fokus auf die Bereitstellung physischer Hardware anstelle von Cloud-VMs.
- Problemlösung: Nachweisliche Erfolge beim Debuggen komplexer verteilter Systeme, bei denen die Ursache im Code, Netzwerk oder Silizium liegen könnte.
Bevorzugte Qualifikationen
- HPC-Hintergrund: Erfahrung mit traditionellen Supercomputing-Schedulern (Slurm, PBS) oder modernen Batch-Schedulern (Volcano, Kueue, Ray).
- Bare Metal Provisioning: Erfahrung mit Tools wie Cluster API (CAPI), Metal3, Tinkerbell, Canonical MaaS oder OpenStack Ironic.
- Hochgeschwindigkeitsnetzwerke: Kenntnisse über RDMA, InfiniBand, GPUDirect und wie man diese Technologien für containerisierte Workloads zugänglich macht.
- AI/ML-Vertrautheit: Verständnis dafür, wie verteiltes Training funktioniert (z.B. PyTorch Distributed, Megatron-LM, DeepSpeed) und die Infrastrukturanforderungen großer Sprachmodelle (LLMs).
- Observability: Erfahrung im Aufbau von Monitoring für die Hardwaregesundheit (DCGM) und verteiltes Tracing für langlaufende Jobs.
Standort
Bewerber müssen eine rechtliche Genehmigung haben, um in dem Land zu arbeiten, in dem die Position angesiedelt ist.
Was Sie tun werden
- Aufbau der Steuerungsebene: Entwurf und Entwicklung der Softwareebene (APIs, Controller, Agenten), die den Lebenszyklus der Bare-Metal-AI-Infrastruktur automatisiert.
- Orchestrierung von Hochleistungsrechnern: Architektur von Scheduling-Lösungen für großangelegte verteilte Trainingsjobs über massive GPU-Cluster (NVIDIA H200/B200/B300), um effizientes Bin-Packing und Gang-Scheduling sicherzustellen.
- Optimierung des Fabrics: Feinabstimmung der softwaredefinierten Netzwerkschicht zur Unterstützung von latenzarmen Interconnects (InfiniBand/RDMA/RoCEv2), die für das Training mehrerer Knoten unerlässlich sind.
- Entwicklung von Kubernetes-Erweiterungen: Schreiben von benutzerdefinierten Kubernetes-Operatoren und CRDs, um komplexe Hardware-Reality (Topologie-Bewusstsein, GPU-Partitionierung) in nutzbare Schnittstellen für unsere Data Scientists zu abstrahieren.
- Hardware-Level-Debugging: Untersuchung und Behebung tiefgreifender Systemprobleme, die von PCIe-Busfehlern und NCCL-Kommunikationszeitüberschreitungen bis hin zu Kernel-Paniken auf Bare-Metal-Knoten reichen.
- Festlegung von Standards: Erstellung des "Goldenen Bildes" für AI-Workloads, Verwaltung von Treibern, Firmware und OS-Optimierungen, um die maximale Leistung aus der Hardware herauszuholen.
Unbefristeter Vertrag. Unterzeichnungsbonus. Umzugspaket (falls zutreffend). Private Krankenversicherung. Anspruch auf Bildungsbudget gemäß interner Richtlinie. Hybride Möglichkeit. Arbeiten in einem schnelllebigen Umfeld, an modernsten Technologien. Karriereplan. Möglichkeit zu lernen und zu lehren. Fortschrittliches Unternehmen. Kultur glücklicher Menschen.
Senior System Engineer Arbeitgeber: RemoteStar
Kontaktperson:
RemoteStar HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior System Engineer
✨Netzwerken, Netzwerken, Netzwerken!
Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht vergessen, dass viele Jobs über persönliche Empfehlungen vergeben werden. Also, sei aktiv und knüpfe Kontakte!
✨Sei bereit für technische Interviews!
Mach dich mit typischen Fragen und Herausforderungen vertraut, die in technischen Interviews gestellt werden. Übe das Lösen von Problemen in Echtzeit, damit du im Interview glänzen kannst. Wir können dir helfen, die besten Ressourcen dafür zu finden!
✨Präsentiere deine Projekte!
Hast du an spannenden Projekten gearbeitet? Zeig sie! Erstelle ein Portfolio oder eine GitHub-Seite, um deine Fähigkeiten zu demonstrieren. Das gibt den Arbeitgebern einen Einblick in dein Können und deine Leidenschaft.
✨Bewirb dich direkt über unsere Website!
Wir haben tolle Stellenangebote, die perfekt zu deinem Profil passen könnten. Bewirb dich direkt über unsere Website, um sicherzustellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt. Lass uns gemeinsam den nächsten Schritt in deiner Karriere gehen!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior System Engineer
Tipps für deine Bewerbung 🫡
Sei du selbst!: Wir wollen dich kennenlernen, also zeig uns deine Persönlichkeit! Verwende eine lockere Sprache und sei authentisch in deinem Anschreiben. Das macht einen viel besseren Eindruck als ein standardisiertes Bewerbungsschreiben.
Betone deine Erfahrungen: Stell sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Wenn du mit Kubernetes oder NVIDIA GPU-Clustern gearbeitet hast, dann erzähl uns davon! Wir suchen nach konkreten Beispielen, die zeigen, wie du Probleme gelöst hast.
Mach es übersichtlich: Halte dein Anschreiben und deinen Lebenslauf klar und strukturiert. Verwende Absätze und Aufzählungen, um wichtige Informationen hervorzuheben. So können wir schnell erkennen, was du zu bieten hast!
Bewirb dich über unsere Website: Der einfachste Weg, um bei uns zu landen, ist, dich direkt über unsere Website zu bewerben. Dort findest du alle Informationen und kannst sicherstellen, dass deine Bewerbung an die richtige Stelle gelangt. Wir freuen uns auf deine Unterlagen!
Wie du dich auf ein Vorstellungsgespräch bei RemoteStar vorbereitest
✨Mach dich mit den Technologien vertraut
Stelle sicher, dass du die Technologien und Tools, die in der Stellenbeschreibung erwähnt werden, gut verstehst. Das bedeutet, dass du nicht nur die Grundlagen von Kubernetes, Python und dem GPU-Ökosystem kennst, sondern auch tiefergehende Kenntnisse über deren interne Funktionsweise hast. Bereite dich darauf vor, spezifische Fragen zu diesen Themen zu beantworten.
✨Praktische Beispiele parat haben
Bereite konkrete Beispiele aus deiner bisherigen Berufserfahrung vor, die deine Fähigkeiten im Bereich Systemprogrammierung und Problemlösung demonstrieren. Zeige, wie du komplexe Probleme in verteilten Systemen gelöst hast und welche Tools du dabei verwendet hast. Das gibt den Interviewern einen klaren Einblick in deine praktische Erfahrung.
✨Fragen zur Unternehmenskultur stellen
Da das Unternehmen eine multikulturelle und internationale Umgebung bietet, ist es wichtig, Fragen zur Unternehmenskultur zu stellen. Zeige dein Interesse an der Teamdynamik und wie du dich in ein diverses Team integrieren kannst. Das zeigt, dass du nicht nur an der technischen Seite interessiert bist, sondern auch an der Zusammenarbeit mit anderen.
✨Vorbereitung auf technische Herausforderungen
Erwarte technische Fragen oder sogar praktische Tests während des Interviews. Übe, wie du deine Denkweise bei der Lösung von Problemen darstellst, insbesondere bei Themen wie Hardware-Debugging oder der Optimierung von Netzwerken. Das wird dir helfen, deine Fähigkeiten unter Beweis zu stellen und zu zeigen, dass du in der Lage bist, in einem schnelllebigen Umfeld zu arbeiten.