Auf einen Blick
- Aufgaben: Analysiere und optimiere AI-Workloads auf Hochleistungs-GPUs und CPUs.
- Arbeitgeber: NVIDIA, ein führendes Unternehmen im Bereich Hochleistungsrechner und KI.
- Mitarbeitervorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
- Warum dieser Job: Gestalte die Zukunft der KI mit modernster Technologie und innovativen Projekten.
- Gewünschte Qualifikationen: Abschluss in Informatik oder Softwaretechnik und 6+ Jahre Erfahrung in Hochleistungsnetzwerken.
- Andere Informationen: Dynamisches Team mit Fokus auf Vielfalt und Chancengleichheit.
Das voraussichtliche Gehalt liegt zwischen 43200 - 72000 € pro Jahr.
NVIDIA sucht einen talentierten Performance Research and Analysis Engineer zur Verstärkung unseres Performance-Teams. Der ideale Kandidat wird AI-Workloads auf großen GPU- und CPU-Skalen-Clustern für verteiltes Deep Learning LLM-Training und Inferenz analysieren, mit Fokus auf Kommunikationsmuster, kollektive Kommunikation, RDMA, Netzwerk- und Systemleistung.
Sie werden mit vielen Arten von Hardware-Plattformen wie HCAs, Switches, CPUs, GPUs und Systemen sowie mit verschiedenen Software-Schichten und -Funktionen arbeiten. Sie werden Erfahrung mit Simulatoren und der Entwicklung von Performance-Analysetools und -methoden sammeln, um tief in die Details einzutauchen, Leistungserwartungen, Einschränkungen und Engpässe im Rahmen der Ursachenanalyse dieser Jobs zu verstehen.
Was Sie tun werden:- Erfahrung und Forschung zu AI-Workloads und DL-Modellen, die speziell für das großangelegte Deep Learning LLM-Training auf NVIDIA-Supercomputern mit Fokus auf Hochleistungsnetzwerke zugeschnitten sind.
- Benchmarking, Profilierung und Analyse der Leistung, um Engpässe zu finden und Verbesserungs- und Optimierungsbereiche zu identifizieren, mit starkem Fokus auf Netzwerkaspekte.
- Implementierung von Performance-Analysetools.
- Zusammenarbeit mit vielen Teams von Hardware bis Software, um Einblicke in die Leistungsanalyse zu bieten.
- Definition von Leistungstestplänen, Festlegung von Leistungserwartungen für neue Technologien und Lösungen und Arbeit zur Erreichung der Leistungsziele.
- B.Sc in Informatik oder Software Engineering
- 6+ Jahre Erfahrung mit Hochleistungsnetzwerken (RDMA, MPI, NCCL)
- Nachgewiesene Fähigkeiten und Methoden in der Leistungsanalyse.
- Erfahrung mit NVIDIA GPUs, CUDA-Bibliothek, Deep-Learning-Frameworks wie TensorFlow oder PyTorch.
- Kombiniert mit Fachwissen in kollektiven Kommunikationsbibliotheken (wie NCCL) und Protokollen (wie RoCE und RDMA).
- Schnelle und selbstständige Lernfähigkeiten mit starken analytischen und problemlösenden Fähigkeiten.
- Programmiersprachen: Python, Bash und C.
- Erfahrung mit Linux-OS-Distributionen.
- Teamplayer mit guten Kommunikations- und zwischenmenschlichen Fähigkeiten.
- Tiefgehendes Wissen und Erfahrung mit Benchmarking von AI-Workloads für verteiltes LLM-Training, CUDA und NCCL-Bibliotheken.
- Tiefgehendes Systemwissen und Verständnis (Intel / AMD / ARM CPUs, NVIDIA GPUs, HCA, Speicher, PCI).
- Kenntnisse in Algorithmen zur Staukontrolle.
NVIDIA setzt sich für ein vielfältiges Arbeitsumfeld ein und ist stolz darauf, ein Arbeitgeber mit Chancengleichheit zu sein. Wir schätzen Vielfalt bei unseren aktuellen und zukünftigen Mitarbeitern und diskriminieren nicht (einschließlich unserer Einstellungs- und Beförderungspraktiken) aufgrund von Rasse, Religion, Hautfarbe, nationaler Herkunft, Geschlecht, Geschlechtsidentität, sexueller Orientierung, Alter, Familienstand, Veteranenstatus, Behinderungsstatus oder einer anderen durch das Gesetz geschützten Eigenschaft.
Senior HPC and AI Networking Performance Research and Analysis Engineer Arbeitgeber: NVIDIA Corporation
Kontaktperson:
NVIDIA Corporation HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior HPC and AI Networking Performance Research and Analysis Engineer
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe deine Problemlösungsfähigkeiten und sei bereit, deine Erfahrungen mit Performance-Analyse und Netzwerktechnologien zu teilen. Wir können dir helfen, die besten Ressourcen zu finden!
✨Tipp Nummer 3
Sei proaktiv! Wenn du eine interessante Stelle siehst, bewirb dich direkt über unsere Website. Zeig dein Interesse und deine Begeisterung für die Position!
✨Tipp Nummer 4
Mach dich mit den neuesten Trends in HPC und KI vertraut! Das zeigt, dass du engagiert bist und immer auf dem neuesten Stand bleibst. Lass uns wissen, wenn du Empfehlungen für Lernressourcen brauchst!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior HPC and AI Networking Performance Research and Analysis Engineer
Tipps für deine Bewerbung 🫡
Mach es persönlich!: Zeig uns, wer du bist! Verwende in deinem Anschreiben eine persönliche Ansprache und erzähle uns, warum du dich für die Position als Senior HPC und AI Networking Performance Research and Analysis Engineer interessierst. Lass deine Leidenschaft für die Technologie durchscheinen!
Betone deine Erfahrungen: Stell sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Wenn du mit NVIDIA GPUs oder Deep Learning Frameworks gearbeitet hast, dann lass uns das wissen! Wir wollen sehen, wie du zur Verbesserung unserer Performance beitragen kannst.
Sei präzise und strukturiert: Halte dein Anschreiben und deinen Lebenslauf übersichtlich und gut strukturiert. Verwende klare Absätze und Aufzählungen, um deine Qualifikationen und Erfolge zu präsentieren. So können wir schnell erkennen, was du drauf hast!
Bewirb dich über unsere Website: Vergiss nicht, dich direkt über unsere Website zu bewerben! Das macht es uns einfacher, deine Bewerbung zu finden und zu bearbeiten. Außerdem kannst du sicherstellen, dass du alle erforderlichen Unterlagen einreichst.
Wie du dich auf ein Vorstellungsgespräch bei NVIDIA Corporation vorbereitest
✨Verstehe die Technologie
Mach dich mit den neuesten Entwicklungen in der HPC- und KI-Netzwerktechnologie vertraut. Sei bereit, über spezifische Technologien wie RDMA, MPI und NCCL zu sprechen und wie sie in der Leistung von AI-Workloads eingesetzt werden.
✨Bereite konkrete Beispiele vor
Denke an konkrete Projekte oder Erfahrungen, bei denen du Performance-Analysen durchgeführt hast. Zeige, wie du Bottlenecks identifiziert und Lösungen implementiert hast, um die Leistung zu optimieren.
✨Teamarbeit betonen
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, Beispiele für erfolgreiche Teamprojekte zu teilen. Betone deine Kommunikationsfähigkeiten und wie du mit verschiedenen Teams zusammengearbeitet hast, um Performance-Insights zu liefern.
✨Fragen vorbereiten
Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Unternehmenskultur und die Erwartungen an die Rolle zu erfahren.