Auf einen Blick
- Aufgaben: Analysiere AI-Workloads und optimiere die Leistung auf NVIDIA Supercomputern.
- Arbeitgeber: NVIDIA, ein führendes Unternehmen im Bereich KI und Hochleistungsrechnen.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen und Möglichkeiten zur beruflichen Weiterentwicklung.
- Warum dieser Job: Gestalte die Zukunft der KI mit innovativen Technologien und leistungsstarker Netzwerkanalyse.
- Gewünschte Qualifikationen: B.Sc. in Informatik oder Softwaretechnik und 6+ Jahre Erfahrung in Hochleistungsnetzwerken.
- Andere Informationen: Dynamisches Team mit Fokus auf Zusammenarbeit und persönlichem Wachstum.
Das voraussichtliche Gehalt liegt zwischen 72000 - 84000 € pro Jahr.
NVIDIA sucht einen talentierten Performance Research and Analysis Engineer, um unser Performance-Team zu verstärken. Der ideale Kandidat wird AI-Workloads auf großen GPU- und CPU-Skalen-Clustern für verteiltes Deep Learning LLM-Training und Inferenz analysieren, mit Fokus auf Kommunikationsmuster, kollektive Kommunikation, RDMA, Netzwerk- und Systemleistung.
Sie werden mit vielen Arten von Hardware-Plattformen wie HCAs, Switches, CPUs, GPUs und Systemen sowie mit verschiedenen Software-Schichten und -Funktionen arbeiten. Sie werden Erfahrung mit Simulatoren und der Entwicklung von Performance-Analysetools und -methoden sammeln, um tief in die Details einzutauchen, Leistungserwartungen, Einschränkungen und Engpässe im Rahmen der Ursachenanalyse dieser Jobs zu verstehen.
Was Sie tun werden:
- Erfahrung und Forschung zu AI-Workloads und DL-Modellen, die speziell für das großangelegte Deep Learning LLM-Training auf NVIDIA-Supercomputern mit Fokus auf Hochleistungsnetzwerke zugeschnitten sind.
- Benchmarking, Profiling und Analyse der Leistung zur Identifizierung von Engpässen und Verbesserungspotenzialen, mit starkem Fokus auf Netzwerkaspekte.
- Implementierung von Performance-Analysetools.
- Zusammenarbeit mit vielen Teams von Hardware bis Software, um Einblicke in die Leistungsanalyse zu bieten.
- Definition von Leistungstestplänen, Festlegung von Leistungserwartungen für neue Technologien und Lösungen sowie Arbeit zur Erreichung der Leistungsziele.
Was wir sehen müssen:
- B.Sc in Informatik oder Software Engineering
- 6+ Jahre Erfahrung mit Hochleistungsnetzwerken (RDMA, MPI, NCCL)
- Nachgewiesene Fähigkeiten und Methoden in der Leistungsanalyse.
- Erfahrung mit NVIDIA GPUs, CUDA-Bibliothek, Deep-Learning-Frameworks wie TensorFlow oder PyTorch, kombiniert mit Fachwissen in kollektiven Kommunikationsbibliotheken (wie NCCL) und Protokollen (wie RoCE und RDMA).
- Schnelle und selbstständige Lernfähigkeiten mit starken analytischen und problemlösenden Fähigkeiten.
- Programmiersprachen: Python, Bash und C.
- Erfahrung mit Linux-OS-Distributionen.
- Teamplayer mit guten Kommunikations- und zwischenmenschlichen Fähigkeiten.
Wie Sie sich von der Masse abheben können:
- Tiefgehendes Wissen und Erfahrung mit Benchmarking von AI-Workloads für verteiltes LLM-Training, CUDA und NCCL-Bibliotheken.
- Tiefgehendes Systemwissen und Verständnis (Intel / AMD / ARM CPUs, NVIDIA GPUs, HCA, Speicher, PCI).
- Kenntnisse in Staukontrollalgorithmen.
Senior HPC and AI Networking Performance Research and Analysis Engineer Arbeitgeber: Nvidia
Kontaktperson:
Nvidia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior HPC and AI Networking Performance Research and Analysis Engineer
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Insights über die Firma und die Position, die dich interessiert.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe deine Fähigkeiten in Performance-Analyse und Networking, indem du an realistischen Szenarien arbeitest. Zeig, dass du die Herausforderungen der Rolle verstehst.
✨Tipp Nummer 3
Sei proaktiv! Wenn du eine interessante Stelle bei NVIDIA siehst, bewirb dich direkt über unsere Website. Zeig dein Interesse und deine Motivation, Teil des Teams zu werden.
✨Tipp Nummer 4
Mach dich mit den neuesten Trends in der KI und HPC vertraut! Lies aktuelle Artikel und nimm an Webinaren teil, um dein Wissen zu erweitern und in Gesprächen glänzen zu können.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior HPC and AI Networking Performance Research and Analysis Engineer
Tipps für deine Bewerbung 🫡
Mach deine Hausaufgaben!: Bevor du mit deiner Bewerbung anfängst, schau dir genau an, was wir bei StudySmarter machen. Verstehe die Rolle und die Anforderungen, damit du deine Erfahrungen und Fähigkeiten gezielt präsentieren kannst.
Sei konkret!: Wenn du über deine Erfahrungen sprichst, sei so konkret wie möglich. Nenne Beispiele für Projekte, an denen du gearbeitet hast, und wie du dabei Networking-Performance analysiert hast. Das macht deine Bewerbung lebendiger!
Zeig deine Leidenschaft!: Wir suchen nach Leuten, die wirklich für das Thema brennen. Lass in deinem Anschreiben durchscheinen, warum du dich für HPC und AI interessierst und was dich motiviert, Teil unseres Teams zu werden.
Bewirb dich direkt über unsere Website!: Um sicherzustellen, dass deine Bewerbung nicht im Spam landet, bewirb dich am besten direkt über unsere Website. So können wir deine Unterlagen schnell und unkompliziert bearbeiten.
Wie du dich auf ein Vorstellungsgespräch bei Nvidia vorbereitest
✨Verstehe die Technologie
Mach dich mit den neuesten Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie RDMA, MPI und NCCL. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast, indem du Beispiele aus deiner bisherigen Arbeit teilst.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast, insbesondere im Bereich Performance-Analyse und Benchmarking. Bereite dich darauf vor, diese Beispiele zu erläutern und wie du dabei Networking-Aspekte berücksichtigt hast.
✨Teamarbeit betonen
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, über deine Erfahrungen in interdisziplinären Teams zu sprechen. Hebe hervor, wie du mit Hardware- und Softwareteams zusammengearbeitet hast, um Performance-Analysen durchzuführen und Lösungen zu entwickeln.
✨Fragen stellen
Bereite einige kluge Fragen vor, die zeigen, dass du dich mit dem Unternehmen und der Rolle auseinandergesetzt hast. Frage nach den aktuellen Herausforderungen im Bereich AI-Workloads oder wie das Team Performance-Ziele definiert. Das zeigt dein Interesse und Engagement.