Senior GPU Networking Architect

Senior GPU Networking Architect

Vollzeit 60000 - 80000 € / Jahr (geschätzt) Kein Homeoffice möglich
Nvidia

Auf einen Blick

  • Aufgaben: Entwickle und optimiere GPU-Kommunikationskerne für großangelegte KI-Systeme.
  • Unternehmen: NVIDIA, ein führendes Unternehmen in Grafik- und KI-Technologie.
  • Vorteile: Wettbewerbsfähiges Gehalt, umfassende Sozialleistungen und flexible Arbeitsmöglichkeiten.
  • Weitere Informationen: Arbeite in einem dynamischen Team mit Experten auf dem Gebiet der KI und Hochleistungsrechner.
  • Warum dieser Job: Gestalte die Zukunft der KI mit innovativer GPU-Architektur und -Optimierung.
  • Qualifikationen: 5+ Jahre CUDA-Programmierung und tiefes Verständnis der GPU-Architektur.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

NVIDIA hat die Computergraphik, das PC-Gaming und das beschleunigte Rechnen seit mehr als 25 Jahren transformiert. Es ist ein einzigartiges Erbe der Innovation, das durch großartige Technologie und erstaunliche Menschen angetrieben wird. Heute nutzen wir das unbegrenzte Potenzial von KI, um die nächste Ära des Rechnens zu definieren. Eine Ära, in der unsere GPU als das Gehirn von Computern, Robotern und selbstfahrenden Autos fungiert, die die Welt verstehen können. Als NVIDIAN werden Sie in einer vielfältigen, unterstützenden Umgebung arbeiten, in der jeder inspiriert ist, sein Bestes zu geben. Wir suchen einen Senior GPU Networking Architect, der unserem Netzwerksoftware-Team beitritt und starke GPU-Architektur- und Programmierkenntnisse mitbringt, um GPU-Kommunikationskerne zu entwickeln und zu verbessern.

Was Sie tun werden:

  • GPU-Kommunikationskerne erstellen, implementieren und optimieren, die kollektive und Punkt-zu-Punkt-Operationen in groß angelegten KI-Systemen unterstützen.
  • Tiefes Wissen über GPU-Architektur nutzen, um die Effizienz der Kerne zu verbessern, Latenz zu minimieren und Berechnungen mit Kommunikation zu überlappen.
  • GPU-residente Kommunikationsprimitive und geräteseitige APIs entwickeln, die eine feingranulare, kernelinitiierte Datenbewegung über Knoten und Beschleuniger ermöglichen.
  • GPU-Kerne end-to-end profilieren und optimieren, Engpässe an der Schnittstelle von Berechnung, Speicher und Netzwerk identifizieren und gezielte Optimierungen vorantreiben.
  • Mit Netzwerksoftware-, Hardware- und KI-Framework-Teams zusammenarbeiten, um Kommunikationsstrategien zu co-designen, die mit GPU-Ausführungsmustern und aufkommenden Modellarchitekturen übereinstimmen.
  • Proofs-of-Concept erstellen, Experimente durchführen und quantitative Modellierung zur Bewertung und Validierung neuer Kommunikationsstrategien durchführen.
  • Zur Evolution von Programmiermodellen beitragen, die GPU-bewusste Netzwerkfähigkeiten für Anwendungsentwickler zugänglich machen.

Was wir sehen möchten:

  • 5+ Jahre praktische CUDA-Programmierung, einschließlich Schreiben und Optimieren nicht-trivialer GPU-Kerne.
  • M.Sc. oder gleichwertige Erfahrung in Informatik, Computertechnik oder einem eng verwandten Bereich.
  • Starkes Verständnis der Grundlagen der GPU-Architektur: Warp-Scheduling, Shared Memory, L2-Cache, Speicherkoaleszenz, Belegungsoptimierung und asynchrone Ausführung.
  • Erfahrung mit systemnaher C/C++-Entwicklung in leistungs-kritischen Umgebungen.
  • Vertrautheit mit GPU-Datenbewegungsmechanismen wie GPUDirect RDMA und GPU-initiierten Kommunikationen.
  • Fähigkeit, GPU-Leistungsprofile zu lesen und zu interpretieren (z.B. Nsight Compute, Nsight Systems) und Beobachtungen in umsetzbare Optimierungen zu übersetzen.
  • Starke Zusammenarbeit in einem multinationalen, interdisziplinären Umfeld.

Hervorstechende Merkmale:

  • Erfahrung in der Entwicklung oder Optimierung von Kommunikationskernen in Bibliotheken wie NCCL, NVSHMEM oder ähnlichen GPU-bewussten Kommunikationsframeworks.
  • Verständnis von Techniken des verteilten Deep Learning, einschließlich Datenparallelismus, Tensorparallelismus, Pipeline-Parallelismus, Expertenparallelismus und Mischexpertenparallelismus sowie der Kommunikationsmuster, die sie auf GPU-Kerne ausüben.
  • Hintergrund in RDMA, InfiniBand, Hochgeschwindigkeitsnetzwerken und GPU-Systemtopologie, einschließlich NVLink, NVSwitch, PCIe und Netzwerkfabriken und deren Einfluss auf das Design von Kommunikationskernen.
  • Erfahrung mit Überlappungstechniken wie Kernel-Pipelining, persistente Kerne oder kooperative Gruppen, um Kommunikationslatenz hinter Berechnungen zu verbergen.
  • Nachgewiesene Erfahrung in der Evaluierung und Optimierung von großangelegten LLM-Trainings- oder Inferenzlasten, einschließlich praktischer Arbeit mit Frameworks wie PyTorch, TensorRT-LLM oder vLLM und Vertrautheit mit aufkommenden Servierungsarchitekturen wie disaggregierter Servierung.

Bei NVIDIA arbeiten Sie mit Kollegen zusammen, die tiefes Fachwissen und innovatives Denken in der Branche demonstrieren und die Grenzen dessen, was in KI und Hochleistungsrechnen möglich ist, erweitern. Wenn Sie leidenschaftlich an GPU-Architektur, Low-Level-Kernel-Optimierung und dem Aufbau des Kommunikationsgewebes für die nächste Generation von KI interessiert sind, möchten wir von Ihnen hören!

Widerruflich als einer der begehrtesten Arbeitgeber der Technologiebranche gilt NVIDIA bietet hoch wettbewerbsfähige Gehälter und ein umfassendes Leistungspaket an. Planen Sie Ihre Zukunft und sehen Sie, was wir Ihnen und Ihrer Familie anbieten können.

Senior GPU Networking Architect Arbeitgeber: Nvidia

NVIDIA ist ein herausragender Arbeitgeber, der eine vielfältige und unterstützende Arbeitsumgebung bietet, in der Innovation und Teamarbeit gefördert werden. Mit einem starken Fokus auf Mitarbeiterentwicklung und einer Kultur, die Kreativität und Zusammenarbeit schätzt, haben Sie die Möglichkeit, an bahnbrechenden Technologien im Bereich KI und Hochleistungsrechnen zu arbeiten. Zudem profitieren Sie von wettbewerbsfähigen Gehältern und einem umfassenden Leistungspaket, das auf Ihre Bedürfnisse und die Ihrer Familie zugeschnitten ist.

Nvidia

Kontaktdaten:

Nvidia Recruiting-Team

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior GPU Networking Architect mit Bravour zu bestehen

CUDA-Programmierung
GPU-Architektur
Thread-Scheduling
Speicherhierarchie
Ausführungs-Pipelines
C/C++-Entwicklung
GPU-Datenbewegungsmechanismen