Auf einen Blick
- Aufgaben: Analysiere und optimiere große AI- und HPC-Workloads auf verteilten Systemen.
- Arbeitgeber: Führendes Unternehmen im Bereich HPC und KI mit innovativer Kultur.
- Mitarbeitervorteile: Hoch wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und umfassende Gesundheitsleistungen.
- Andere Informationen: Dynamisches Umfeld mit Möglichkeiten zur beruflichen Weiterentwicklung.
- Warum dieser Job: Arbeite an bahnbrechenden Technologien und beeinflusse die Zukunft der KI-Infrastruktur.
- Gewünschte Qualifikationen: Bachelor-Abschluss in Informatik und 6+ Jahre Erfahrung in Hochleistungsnetzwerken.
Das voraussichtliche Gehalt liegt zwischen 80000 - 110000 € pro Jahr.
Überblick: Diese Rolle konzentriert sich auf die Analyse und Optimierung von großangelegten KI- und HPC-Workloads auf verteilten Recheninfrastrukturen, mit Schwerpunkt auf GPU/CPU-Clustern, KI-Training und -Inference für große Sprachmodelle. Die Position umfasst tiefgehende technische Forschung über Hardware und Software, Untersuchung von Kommunikationsmustern, RDMA-Netzwerken und kollektiven Kommunikationsframeworks, um Engpässe zu identifizieren und systemweite Verbesserungen voranzutreiben.
Verantwortlichkeiten:
- Profilieren, Analysieren und Benchmarking von großangelegten KI-Workloads über verteilte GPU- und CPU-Cluster, mit Fokus auf Deep Learning und LLM-Training und -Inference.
- Untersuchung von Kommunikationsmustern, Netzwerkverhalten und kollektiven Operationen wie RDMA und NCCL zur Identifizierung von Leistungsengpässen.
- Entwicklung und Implementierung von Performance-Analysetools, Methoden und simulationsbasierten Ansätzen zur Bewertung des Systemverhaltens.
- Zusammenarbeit mit Hardware- und Software-Engineering-Teams zur Bereitstellung umsetzbarer Leistungsinsights und Optimierungsempfehlungen.
- Definition von Leistungsteststrategien und Festlegung von Benchmarks für neue Technologien, Systeme und KI-Infrastrukturkomponenten.
- Analyse der End-to-End-Systemleistung über GPUs, CPUs, Interconnects, Speichersysteme und Netzwerkinfrastruktur.
- Beitrag zur Ursachenanalyse von Leistungsproblemen in großangelegten verteilten KI-Trainings- und Inference-Workloads.
Anforderungen:
- Abschluss in Informatik, Softwaretechnik oder einem verwandten technischen Bereich.
- 6+ Jahre Erfahrung in Hochleistungsnetzwerkumgebungen, einschließlich RDMA, MPI oder NCCL.
- Starker Hintergrund in der Leistungsanalyse, Benchmarking und Systemoptimierungsmethoden.
- Praktische Erfahrung mit NVIDIA-GPUs, CUDA und Deep-Learning-Frameworks wie TensorFlow oder PyTorch.
- Starkes Verständnis von Netzwerkprotokollen und kollektiven Kommunikationstechnologien wie RoCE und RDMA.
- Kenntnisse in Python, C und Bash, mit Erfahrung in der Entwicklung von Performance-Analyse- oder Diagnosetools.
- Solides Verständnis von Linux-basierten Betriebssystemen und verteilten Rechenumgebungen.
- Starke analytische und problemlösende Fähigkeiten mit der Fähigkeit, komplexe Systeme schnell zu erlernen.
- Ausgezeichnete Kommunikations- und Teamfähigkeiten in funktionsübergreifenden Engineering-Umgebungen.
Wünschenswert:
- Tiefe Expertise in LLM-Benchmarking, Staukontrollalgorithmen, CUDA/NCCL-Interna und Systemarchitektur (CPU, GPU, Speicher, PCIe, HCA).
Vorteile:
- Hoch wettbewerbsfähiges Vergütungspaket mit leistungsbasierten Anreizen.
- Gelegenheit, an modernster KI-Infrastruktur und Supercomputing-Systemen zu arbeiten.
- Einblick in großangelegte verteilte KI-Workloads, die in globalen Umgebungen verwendet werden.
- Zusammenarbeit mit Experten der Spitzenklasse in HPC, Netzwerken und KI-Systemen.
- Flexible Arbeitsbedingungen in der gesamten Schweiz und an entfernten Standorten.
- Umfassende Vorteile zur Unterstützung von Gesundheit, Wohlbefinden und beruflichem Wachstum.
- Inklusive und vielfältige Arbeitsumgebung mit Prinzipien der Chancengleichheit.
- Starker Fokus auf Innovation, Lernen und fortgeschrittene technische Entwicklung.
Senior HPC and AI Networking Performance Research and Analysis Engineer Arbeitgeber: Jobgether
Kontaktperson:
Jobgether HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior HPC and AI Networking Performance Research and Analysis Engineer
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der HPC- und KI-Branche in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden und potenzielle Arbeitgeber auf dich aufmerksam zu machen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe häufige Fragen zu Performance-Analyse und Systemoptimierung. Zeige dein Wissen über RDMA, MPI und CUDA, um zu zeigen, dass du die Anforderungen der Stelle verstehst.
✨Tipp Nummer 3
Sei proaktiv und zeige Initiative! Wenn du eine interessante Stelle bei uns findest, bewirb dich direkt über unsere Website. Das zeigt, dass du wirklich an der Position interessiert bist und bereit bist, den nächsten Schritt zu gehen.
✨Tipp Nummer 4
Mach dir Gedanken über deine Soft Skills! Teamarbeit und Kommunikation sind entscheidend in einem interdisziplinären Umfeld. Bereite Beispiele vor, die zeigen, wie du erfolgreich mit anderen zusammengearbeitet hast, um technische Herausforderungen zu meistern.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior HPC and AI Networking Performance Research and Analysis Engineer
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Deine Persönlichkeit und Leidenschaft für HPC und AI sollten in deiner Bewerbung deutlich werden. Lass uns wissen, warum du für diese Rolle brennst und was dich motiviert.
Betone deine Erfahrungen: Erzähl uns von deinen bisherigen Projekten und Erfahrungen im Bereich Performance-Analyse und Systemoptimierung. Konkrete Beispiele helfen uns, deine Fähigkeiten besser zu verstehen und wie du unser Team bereichern kannst.
Technische Skills hervorheben: Vergiss nicht, deine technischen Fähigkeiten klar darzustellen! Ob es um CUDA, RDMA oder Benchmarking geht – zeig uns, dass du die nötigen Kenntnisse hast, um in dieser Rolle erfolgreich zu sein.
Bewerbung über unsere Website: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell bei uns ankommt und wir dich zügig kontaktieren können. Wir freuen uns auf deine Unterlagen!
Wie du dich auf ein Vorstellungsgespräch bei Jobgether vorbereitest
✨Verstehe die technischen Anforderungen
Mach dich mit den spezifischen Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie RDMA, MPI, NCCL, CUDA und die verschiedenen Deep Learning Frameworks. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen hast.
✨Bereite konkrete Beispiele vor
Denke an konkrete Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast, insbesondere solche, die sich auf Performance-Analyse und Systemoptimierung beziehen. Bereite dich darauf vor, diese Beispiele zu erläutern und wie sie auf die Anforderungen der Position zutreffen.
✨Zeige deine Teamfähigkeit
Da die Rolle enge Zusammenarbeit mit anderen Ingenieurteams erfordert, ist es wichtig, deine Kommunikations- und Teamfähigkeiten zu betonen. Überlege dir, wie du in der Vergangenheit erfolgreich in einem Team gearbeitet hast und welche Rolle du dabei gespielt hast.
✨Fragen stellen
Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und dem Unternehmen. Frage nach den aktuellen Herausforderungen im Bereich HPC und AI Networking oder wie das Team Innovationen vorantreibt.