Auf einen Blick
- Aufgaben: Analysiere AI-Workloads und optimiere die Leistung auf NVIDIA Supercomputern.
- Arbeitgeber: NVIDIA, ein führendes Unternehmen im Bereich KI und Hochleistungsrechnen.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen und Möglichkeiten zur beruflichen Weiterentwicklung.
- Warum dieser Job: Gestalte die Zukunft der KI mit innovativen Technologien und leistungsstarker Netzwerkanalyse.
- Gewünschte Qualifikationen: B.Sc. in Informatik oder Softwaretechnik und 6+ Jahre Erfahrung in Hochleistungsnetzwerken.
- Andere Informationen: Dynamisches Team mit Fokus auf Zusammenarbeit und persönlichem Wachstum.
Das voraussichtliche Gehalt liegt zwischen 72000 - 84000 € pro Jahr.
NVIDIA sucht einen talentierten Performance Research and Analysis Engineer zur Verstärkung unserer Performance-Gruppe. Der ideale Kandidat wird AI-Workloads auf großen GPU- und CPU-Skalen-Clustern für verteiltes Deep Learning LLM-Training und Inferenz analysieren, mit Fokus auf Kommunikationsmuster, kollektive Kommunikation, RDMA, Netzwerk- und Systemleistung.
Sie werden mit vielen Arten von Hardware-Plattformen wie HCAs, Switches, CPUs, GPUs und Systemen sowie mit verschiedenen Software-Schichten und -Funktionen arbeiten. Sie werden Erfahrung mit Simulatoren und der Entwicklung von Performance-Analysetools und -methoden sammeln, um tief in die Details einzutauchen, Leistungserwartungen, Einschränkungen und Engpässe im Rahmen der Ursachenanalyse dieser Jobs zu verstehen.
Was Sie tun werden:
- Erfahrung und Forschung zu AI-Workloads und DL-Modellen, die speziell für das großangelegte Deep Learning LLM-Training auf NVIDIA-Supercomputern mit Fokus auf Hochleistungsnetzwerke zugeschnitten sind.
- Benchmarking, Profiling und Analyse der Leistung, um Engpässe zu finden und Verbesserungs- und Optimierungsbereiche zu identifizieren, mit starkem Fokus auf Netzwerkaspekte.
- Implementierung von Performance-Analysetools.
- Zusammenarbeit mit vielen Teams von Hardware bis Software, um Einblicke in die Leistungsanalyse zu bieten.
- Definition von Leistungstestplänen, Festlegung von Leistungserwartungen für neue Technologien und Lösungen und Arbeit zur Erreichung der Leistungsziele.
Was wir sehen müssen:
- B.Sc in Informatik oder Software Engineering
- 6+ Jahre Erfahrung mit Hochleistungsnetzwerken (RDMA, MPI, NCCL)
- Nachgewiesene Fähigkeiten und Methoden in der Leistungsanalyse.
- Erfahrung mit NVIDIA GPUs, CUDA-Bibliothek, Deep-Learning-Frameworks wie TensorFlow oder PyTorch, kombiniert mit Fachwissen in kollektiven Kommunikationsbibliotheken (wie NCCL) und Protokollen (wie RoCE und RDMA).
- Schnelle und selbstständige Lernfähigkeiten mit starken analytischen und problemlösenden Fähigkeiten.
- Programmiersprachen: Python, Bash und C.
- Erfahrung mit Linux-OS-Distributionen.
- Teamplayer mit guten Kommunikations- und zwischenmenschlichen Fähigkeiten.
Wie Sie sich von der Masse abheben können:
- Tiefgehendes Wissen und Erfahrung mit Benchmarking von AI-Workloads für verteiltes LLM-Training, CUDA und NCCL-Bibliotheken.
- Tiefgehendes Systemwissen und Verständnis (Intel / AMD / ARM CPUs, NVIDIA GPUs, HCA, Speicher, PCI).
- Kenntnisse in Algorithmen zur Staukontrolle.
Senior HPC and AI Networking Performance Research and Analysis Engineer Arbeitgeber: Nvidia
Kontaktperson:
Nvidia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior HPC and AI Networking Performance Research and Analysis Engineer
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Insights über die Firma und die Position, die dich interessiert.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Mach dich mit den neuesten Trends in HPC und AI Networking vertraut. Zeig, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast.
✨Tipp Nummer 3
Sei proaktiv! Wenn du eine interessante Stelle siehst, bewirb dich direkt über unsere Website. Zeig dein Interesse und deine Motivation, indem du ein paar persönliche Worte hinzufügst.
✨Tipp Nummer 4
Mach dir Gedanken über deine Fragen! Bereite einige durchdachte Fragen für das Interview vor, die zeigen, dass du dich mit der Firma und der Rolle auseinandergesetzt hast. Das hinterlässt einen bleibenden Eindruck.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior HPC and AI Networking Performance Research and Analysis Engineer
Tipps für deine Bewerbung 🫡
Mach deine Hausaufgaben!: Bevor du mit deiner Bewerbung anfängst, schau dir unsere Website genau an. Verstehe, was wir bei StudySmarter machen und wie du in unser Team passen könntest. Das zeigt uns, dass du wirklich interessiert bist!
Sei konkret!: Wenn du über deine Erfahrungen sprichst, sei so konkret wie möglich. Nenne Beispiele für Projekte, an denen du gearbeitet hast, und welche Technologien du verwendet hast. Das hilft uns, ein besseres Bild von deinen Fähigkeiten zu bekommen.
Zeig deine Leidenschaft!: Erzähle uns, warum du dich für die Position interessierst und was dich an der Arbeit mit AI und HPC begeistert. Deine Begeisterung kann einen großen Unterschied machen und uns zeigen, dass du gut ins Team passt.
Bewirb dich direkt bei uns!: Wir empfehlen dir, deine Bewerbung über unsere Website einzureichen. So stellst du sicher, dass sie direkt bei uns landet und wir sie schnell bearbeiten können. Wir freuen uns auf deine Bewerbung!
Wie du dich auf ein Vorstellungsgespräch bei Nvidia vorbereitest
✨Verstehe die Technologien
Mach dich mit den spezifischen Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie RDMA, MPI und NCCL. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast, indem du Beispiele aus deiner bisherigen Arbeit teilst.
✨Bereite konkrete Beispiele vor
Überlege dir konkrete Situationen, in denen du Performance-Analysen durchgeführt hast. Sei bereit, über die Herausforderungen zu sprechen, die du dabei überwunden hast, und welche Methoden du verwendet hast, um die Leistung zu optimieren. Das zeigt, dass du die Anforderungen der Position verstehst.
✨Teamarbeit betonen
Da die Rolle viel Zusammenarbeit erfordert, solltest du Beispiele für erfolgreiche Teamprojekte parat haben. Erkläre, wie du mit anderen Teams zusammengearbeitet hast, um Performance-Insights zu gewinnen und Probleme zu lösen. Gute Kommunikationsfähigkeiten sind hier entscheidend!
✨Fragen vorbereiten
Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und dem Unternehmen. Frage nach den aktuellen Herausforderungen im Bereich Performance-Analyse oder wie das Team neue Technologien implementiert. So kannst du auch mehr über die Unternehmenskultur erfahren.