Senior HPC and AI Networking Performance Research and Analysis Engineer

Senior HPC and AI Networking Performance Research and Analysis Engineer

Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Homeoffice möglich
NVIDIA AI

Auf einen Blick

  • Aufgaben: Analysiere AI-Workloads und optimiere die Leistung von Hochleistungsnetzwerken.
  • Unternehmen: NVIDIA, ein führendes Unternehmen im Bereich KI und Hochleistungsrechnen.
  • Vorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Team mit Fokus auf Vielfalt und Chancengleichheit.
  • Warum dieser Job: Gestalte die Zukunft der KI mit innovativen Technologien und leistungsstarker Hardware.
  • Qualifikationen: Abschluss in Informatik oder Softwaretechnik und 6+ Jahre Erfahrung in Hochleistungsnetzwerken.

Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

NVIDIA sucht einen talentierten Performance Research and Analysis Engineer, der unserem Performance-Team beitritt. Der ideale Kandidat wird AI-Workloads auf großen GPU- und CPU-Skalen-Clustern für verteiltes Deep Learning LLM-Training und Inferenz analysieren, mit Fokus auf Kommunikationsmuster, kollektive Kommunikation, RDMA, Netzwerk- und Systemleistung.

Sie werden mit vielen Arten von Hardware-Plattformen wie HCAs, Switches, CPUs, GPUs und Systemen sowie mit verschiedenen Software-Schichten und -Funktionen arbeiten. Sie werden Erfahrung mit Simulatoren und der Entwicklung von Performance-Analysetools und -methoden sammeln, um tief in die Details einzutauchen, Leistungserwartungen, Einschränkungen und Engpässe im Rahmen der Ursachenanalyse dieser Jobs zu verstehen.

Was Sie tun werden:

  • Erfahrung und Forschung zu AI-Workloads und DL-Modellen, die speziell für das großangelegte Deep Learning LLM-Training auf NVIDIA-Supercomputern mit Fokus auf Hochleistungsnetzwerke zugeschnitten sind.
  • Benchmarking, Profiling und Analyse der Leistung zur Identifizierung von Engpässen und Verbesserungspotenzialen mit starkem Fokus auf Netzwerkaspekte.
  • Implementierung von Performance-Analysetools.
  • Zusammenarbeit mit vielen Teams von Hardware bis Software, um Einblicke in die Leistungsanalyse zu bieten.
  • Definition von Leistungstestplänen, Festlegung von Leistungserwartungen für neue Technologien und Lösungen sowie Arbeit zur Erreichung der Leistungsziele.

Was wir sehen möchten:

  • B.Sc in Informatik oder Software Engineering
  • 6+ Jahre Erfahrung mit Hochleistungsnetzwerken (RDMA, MPI, NCCL)
  • Nachgewiesene Fähigkeiten und Methoden in der Leistungsanalyse.
  • Erfahrung mit NVIDIA GPUs, CUDA-Bibliothek, Deep-Learning-Frameworks wie TensorFlow oder PyTorch.
  • Zusammen mit Fachkenntnissen in kollektiven Kommunikationsbibliotheken (wie NCCL) und Protokollen (wie RoCE und RDMA).
  • Schnelle und selbstständige Lernfähigkeiten mit starken analytischen und problemlösenden Fähigkeiten.
  • Programmiersprachen: Python, Bash und C.
  • Erfahrung mit Linux-OS-Distributionen.
  • Teamplayer mit guten Kommunikations- und zwischenmenschlichen Fähigkeiten.

Wie Sie sich von der Masse abheben können:

  • Tiefgehendes Wissen und Erfahrung mit Benchmarking von AI-Workloads für verteiltes LLM-Training, CUDA und NCCL-Bibliotheken.
  • Tiefgehendes Systemwissen und Verständnis (Intel / AMD / ARM CPUs, NVIDIA GPUs, HCA, Speicher, PCI).
  • Kenntnisse in Algorithmen zur Staukontrolle.

NVIDIA setzt sich für ein vielfältiges Arbeitsumfeld ein und ist stolz darauf, ein Arbeitgeber mit Chancengleichheit zu sein. Wir schätzen Vielfalt bei unseren aktuellen und zukünftigen Mitarbeitern und diskriminieren nicht (einschließlich unserer Einstellungs- und Beförderungspraktiken) aufgrund von Rasse, Religion, Hautfarbe, nationaler Herkunft, Geschlecht, Geschlechtsidentität, sexueller Orientierung, Alter, Familienstand, Veteranenstatus, Behinderungsstatus oder einer anderen durch das Gesetz geschützten Eigenschaft.

Senior HPC and AI Networking Performance Research and Analysis Engineer Arbeitgeber: NVIDIA AI

NVIDIA ist ein hervorragender Arbeitgeber, der eine dynamische und inklusive Arbeitsumgebung bietet, in der Innovation und Teamarbeit gefördert werden. Mit einem starken Fokus auf Mitarbeiterentwicklung und Weiterbildungsmöglichkeiten, insbesondere im Bereich Hochleistungsnetzwerke und KI, ermöglicht NVIDIA seinen Mitarbeitern, an der Spitze der Technologie zu arbeiten und ihre Fähigkeiten kontinuierlich auszubauen. Die Lage in einem technologisch fortschrittlichen Umfeld bietet zudem einzigartige Vorteile, um mit führenden Experten der Branche zusammenzuarbeiten und an bahnbrechenden Projekten teilzuhaben.

NVIDIA AI

Kontaktdaten:

NVIDIA AI Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior HPC and AI Networking Performance Research and Analysis Engineer erhalten könnten

Netzwerken ist der Schlüssel

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Informationen über offene Stellen oder Tipps, wie du dich am besten präsentieren kannst.

Sei proaktiv bei der Kontaktaufnahme

Wenn du eine interessante Stelle gefunden hast, zögere nicht, direkt die Personalabteilung oder den zuständigen Teamleiter zu kontaktieren. Ein persönlicher Kontakt kann oft den Unterschied machen!

Bereite dich auf technische Gespräche vor

Stelle sicher, dass du deine technischen Fähigkeiten und Erfahrungen gut präsentieren kannst. Übe typische Fragen zu Performance-Analyse und Netzwerktechnologien, die für die Stelle relevant sind.

Bewirb dich über unsere Website

Vergiss nicht, dich direkt über unsere Website zu bewerben! Das zeigt dein Interesse und gibt uns die Möglichkeit, dich besser kennenzulernen.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior HPC and AI Networking Performance Research and Analysis Engineer mit Bravour zu bestehen

Performance Analyse
Hochleistungsnetzwerk (RDMA, MPI, NCCL)
NVIDIA GPUs
CUDA-Bibliothek
Deep Learning Frameworks (TensorFlow, PyTorch)
Kollektive Kommunikationsbibliotheken (NCCL)
Protokolle (RoCE, RDMA)

Einige Tipps für deine Bewerbung 🫡

Mach deine Hausaufgaben!:Bevor du mit deiner Bewerbung anfängst, schau dir unsere Website genau an. Verstehe, was wir bei StudySmarter machen und wie du in unser Team passen könntest. Das hilft dir, deine Motivation klar zu kommunizieren.

Sei konkret!:Wenn du über deine Erfahrungen sprichst, sei so konkret wie möglich. Nenne Beispiele für Projekte, an denen du gearbeitet hast, und welche Technologien du verwendet hast. Das zeigt uns, dass du wirklich weißt, wovon du sprichst!

Pass auf die Details auf!:Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Lass jemanden drüberlesen, bevor du sie abschickst!

Bewirb dich direkt über unsere Website!:Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und effizient bearbeitet wird. Wir freuen uns darauf, von dir zu hören!

Wie man sich auf ein Vorstellungsgespräch bei NVIDIA AI vorbereitet

Verstehe die Technologie

Mach dich mit den neuesten Entwicklungen in der HPC- und KI-Netzwerktechnologie vertraut. Informiere dich über RDMA, MPI und NCCL, um während des Interviews gezielt Fragen zu beantworten und deine Expertise zu zeigen.

Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, bei denen du Performance-Analysen durchgeführt hast. Sei bereit, über Herausforderungen und Lösungen zu sprechen, um deine Problemlösungsfähigkeiten zu demonstrieren.

Teamarbeit betonen

Da die Rolle viel Zusammenarbeit erfordert, solltest du Beispiele für erfolgreiche Teamprojekte parat haben. Zeige, wie du mit verschiedenen Teams zusammengearbeitet hast, um Performance-Insights zu gewinnen.

Fragen stellen

Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Unternehmenskultur und die Erwartungen zu erfahren.