Senior HPC Cluster Engineer

Senior HPC Cluster Engineer

Vollzeit 60000 - 80000 € / Jahr (geschätzt) Homeoffice (teilweise)
J

Auf einen Blick

  • Aufgaben: Optimiere GPU-Cluster und verbessere die Leistung von InfiniBand-Netzwerken.
  • Unternehmen: Innovatives Unternehmen im Bereich KI-Cloud-Infrastruktur.
  • Vorteile: Wettbewerbsfähiges Gehalt, flexible Remote-Arbeit und Karriereentwicklung.
  • Weitere Informationen: Zusammenarbeit mit internationalen Engineering-Teams und spannende technische Herausforderungen.
  • Warum dieser Job: Gestalte die Zukunft der KI-Infrastruktur in einem dynamischen Umfeld.
  • Qualifikationen: 5+ Jahre Erfahrung in Systemsoftware und starke Programmierkenntnisse.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wir suchen derzeit einen Senior HPC Cluster Engineer in Deutschland. Treten Sie einer hochwirksamen Ingenieurumgebung bei, die sich auf den Fortschritt der nächsten Generation von KI-Cloud-Infrastrukturen im Hyperscale-Bereich konzentriert. Diese Rolle bietet die Möglichkeit, an modernster GPU-Computing-, Hochleistungsnetzwerk- und verteilten Infrastruktursystemen zu arbeiten, die großangelegte KI- und maschinelles Lernen-Workloads unterstützen.

Als Senior HPC Cluster Engineer spielen Sie eine Schlüsselrolle bei der Optimierung von GPU-Clustern, der Verbesserung der InfiniBand-Netzwerkleistung und der Gewährleistung der Zuverlässigkeit in komplexen HPC-Umgebungen. Sie werden mit hochqualifizierten Ingenieuren zusammenarbeiten und zu Infrastrukturverbesserungen in den Bereichen Virtualisierung, Automatisierung, Leistungsoptimierung und Hardwareintegration beitragen. Die Position kombiniert tiefes technisches Eigentum mit bedeutender Zusammenarbeit in einer schnelllebigen, innovationsgetriebenen Umgebung, die für ehrgeizige Ingenieure geschaffen wurde.

Verantwortlichkeiten:

  • Optimierung der Leistung, Skalierbarkeit und Zuverlässigkeit von GPU-Clustern und InfiniBand-Netzwerken innerhalb von Hochleistungsrechenumgebungen.
  • Analyse, Fehlersuche und Behebung von Ursachenproblemen im Zusammenhang mit GPU-Infrastruktur, Netzwerkleistung und verteilten Computersystemen.
  • Integration und Unterstützung neuer Hardwaretechnologien, einschließlich GPU-Geräte, in bestehende Cloud- und Virtualisierungsumgebungen.
  • Konfiguration, Wartung und Verbesserung der Orchestrierung von GPU-Geräten, Kubernetes-Integrationen und Virtualisierungsstacks wie QEMU und KVM.
  • Entwurf und Verbesserung von Automatisierungssystemen für proaktive Überwachung, Fehlererkennung und Problemlösung in HPC-Clustern.
  • Zusammenarbeit mit Ingenieurteams zur Verbesserung der Effizienz der Infrastruktur, der Systemleistung und der Plattformresilienz.
  • Durchführung von Leistungsanalysen und -optimierungen für HPC-Workloads, einschließlich KI/ML-Training, Simulationen und großangelegter Datenverarbeitung.
  • Beitrag zur Evolution der Infrastruktur durch Verbesserung der Netzwerk-, Virtualisierungs- und verteilten Computerfähigkeiten.

Anforderungen:

  • Über 5 Jahre Berufserfahrung in der systemnahen Softwareentwicklung, der Low-Level-Programmierung oder der Optimierung der Infrastrukturleistung.
  • Über 3 Jahre praktische Erfahrung mit Linux-Systemen, einschließlich Administration, Fehlersuche und Leistungsoptimierung.
  • Starkes Verständnis der Serverarchitektur, der Grundlagen des Linux-Kernels, PCIe-Geräte, NICs und Hochleistungsrechnersysteme.
  • Starke Programmierkenntnisse in Sprachen wie C, C++, Go, Python oder ähnlichen leistungsorientierten Technologien.
  • Erfahrung mit GPU-Infrastruktur, HPC-Umgebungen, verteilten Systemen oder leistungsorientierten Systemen.
  • Vertrautheit mit Containerisierung, Orchestrierung oder Virtualisierungstechnologien, einschließlich Kubernetes, QEMU oder KVM.
  • Starke Fähigkeiten in der Fehlersuche, Systemanalyse und Problemlösung in komplexen technischen Umgebungen.
  • Ausgezeichnete Zusammenarbeit und Kommunikationsfähigkeiten mit der Fähigkeit, effektiv in funktionsübergreifenden Ingenieurteams zu arbeiten.
  • Zusätzliche Punkte für Erfahrungen mit InfiniBand, RDMA, RoCE, MPI, NCCL, SDN oder GPU-Cluster-Testumgebungen.
  • Zusätzliche Erfahrung mit Deep-Learning-Frameworks wie PyTorch oder TensorFlow und KI/ML-Infrastruktur ist sehr wertvoll.

Vorteile:

  • Wettbewerbsfähiges Vergütungspaket, das an Erfahrung und technische Expertise angepasst ist.
  • Flexibles Remote-Arbeitsumfeld, das die Work-Life-Balance in ganz Europa unterstützt.
  • Karriereentwicklungsmöglichkeiten mit kontinuierlichem Lernen und Unterstützung des beruflichen Wachstums.
  • Gelegenheit, an wirkungsvollen KI- und Hochleistungsrechenprojekten im globalen Maßstab zu arbeiten.
  • Kollaborative, innovative und ingenieurfokussierte Kultur, die auf Eigenverantwortung und Autonomie basiert.
  • Einblick in internationale Ingenieurteams in den Bereichen Cloud, Infrastruktur und KI.
  • Schnelllebige Umgebung mit bedeutenden technischen Herausforderungen und langfristiger Karriereentwicklung.
  • Inklusive Arbeitsplatz, der sich für Vielfalt, Chancengleichheit und das Wachstum der Mitarbeiter einsetzt.

Senior HPC Cluster Engineer Arbeitgeber: Jobgether

Als Arbeitgeber bieten wir Ihnen die Möglichkeit, in einem dynamischen und innovativen Umfeld zu arbeiten, das sich auf die Entwicklung von KI-Cloud-Infrastrukturen auf hyperskalierbarem Niveau konzentriert. Unsere Unternehmenskultur fördert Zusammenarbeit, Eigenverantwortung und kontinuierliches Lernen, während wir Ihnen flexible Arbeitsmodelle und ein wettbewerbsfähiges Vergütungspaket bieten. Hier haben Sie die Chance, an bedeutenden Projekten im Bereich Hochleistungsrechnen und KI zu arbeiten und Ihre Karriere in einem internationalen Team voranzutreiben.

J

Kontaktdaten:

Jobgether Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior HPC Cluster Engineer erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit anderen Ingenieuren und Fachleuten in Kontakt zu treten. Teile deine Projekte und Erfolge, um sichtbar zu werden und vielleicht sogar Empfehlungen zu erhalten.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe häufige Fragen zu HPC, GPU-Architekturen und Netzwerktechnologien. Zeige dein Wissen über Performance-Optimierung und Problemlösung, um die Interviewer zu beeindrucken.

Tipp Nummer 3

Sei proaktiv und zeige Initiative! Wenn du eine interessante Stelle findest, bewirb dich direkt über unsere Website. Das zeigt dein Interesse und Engagement für die Position und das Unternehmen.

Tipp Nummer 4

Bleib dran und folge nach! Wenn du nach dem Interview nichts hörst, zögere nicht, höflich nachzufragen. Das zeigt, dass du wirklich an der Stelle interessiert bist und kann dir helfen, im Gedächtnis zu bleiben.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior HPC Cluster Engineer mit Bravour zu bestehen

GPU-Cluster-Optimierung
InfiniBand-Netzwerkleistung
Hochleistungsrechner (HPC) Umgebungen
Linux-Systemadministration
Leistungsoptimierung
C, C++, Go, Python Programmierung
Containerisierung

Einige Tipps für deine Bewerbung 🫡

Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeige deine Persönlichkeit. Wir wollen wissen, wer du bist und was dich motiviert, also lass deine Leidenschaft für HPC und AI durchscheinen!

Betone deine Erfahrungen:Stelle sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Zeige uns, wie deine 5+ Jahre Erfahrung in der Systemsoftware-Entwicklung und deine Kenntnisse in GPU-Infrastrukturen dich zu einem idealen Kandidaten machen.

Verwende klare Sprache:Halte deine Bewerbung einfach und verständlich. Vermeide Fachjargon, wenn es nicht nötig ist, und achte darauf, dass wir deine Punkte leicht nachvollziehen können. Klarheit ist der Schlüssel!

Bewirb dich über unsere Website:Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell und effizient bearbeitet wird. Wir freuen uns darauf, von dir zu hören!

Wie man sich auf ein Vorstellungsgespräch bei Jobgether vorbereitet

Technisches Wissen auffrischen

Stelle sicher, dass du dein technisches Wissen über HPC-Cluster, GPU-Infrastruktur und Netzwerktechnologien wie InfiniBand auffrischst. Gehe die Grundlagen durch und sei bereit, spezifische Fragen zu beantworten, die deine Erfahrung mit diesen Technologien betreffen.

Praktische Beispiele vorbereiten

Bereite konkrete Beispiele aus deiner bisherigen Berufserfahrung vor, die deine Fähigkeiten in der Optimierung von Systemen und der Problemlösung demonstrieren. Zeige, wie du Herausforderungen in komplexen technischen Umgebungen gemeistert hast.

Teamarbeit betonen

Da die Rolle viel Zusammenarbeit erfordert, solltest du Beispiele für erfolgreiche Teamprojekte parat haben. Betone deine Kommunikationsfähigkeiten und wie du effektiv mit anderen Ingenieuren zusammengearbeitet hast, um technische Probleme zu lösen.

Fragen zur Unternehmenskultur stellen

Zeige dein Interesse an der Unternehmenskultur, indem du Fragen stellst, die auf die Innovationskraft und die Werte des Unternehmens abzielen. Dies zeigt, dass du nicht nur an der Technik interessiert bist, sondern auch an der langfristigen Zusammenarbeit im Team.