Auf einen Blick
- Aufgaben: Entwickle und optimiere GPU-Kommunikationskerne für großangelegte KI-Systeme.
- Unternehmen: NVIDIA, ein führendes Unternehmen in Grafik- und KI-Technologie.
- Vorteile: Wettbewerbsfähiges Gehalt, umfassende Sozialleistungen und flexible Arbeitsmöglichkeiten.
- Weitere Informationen: Arbeite in einem dynamischen Team mit Experten und innovativen Denkern.
- Warum dieser Job: Gestalte die Zukunft der KI mit innovativer GPU-Architektur und -Optimierung.
- Qualifikationen: Mindestens 5 Jahre Erfahrung in CUDA-Programmierung und tiefes Verständnis der GPU-Architektur.
Das prognostizierte Gehalt liegt zwischen 75000 - 100000 € pro Jahr.
NVIDIA hat die Computergraphik, PC-Gaming und beschleunigtes Rechnen seit mehr als 25 Jahren transformiert. Heute nutzen wir das unbegrenzte Potenzial von KI, um die nächste Ära des Rechnens zu definieren. Wir suchen einen Senior GPU Networking Architect, der unserem Netzwerk-Softwareteam beitritt und starke GPU-Architektur- und Programmierkenntnisse mitbringt, um GPU-Kommunikationskerne zu entwickeln und zu verbessern.
Was Sie tun werden:
- GPU-Kommunikationskerne erstellen, implementieren und optimieren, die kollektive und Punkt-zu-Punkt-Operationen in großangelegten KI-Systemen unterstützen.
- Tiefes Wissen über GPU-Architektur nutzen, um die Effizienz der Kerne zu verbessern, Latenz zu minimieren und Berechnungen mit Kommunikation zu überlappen.
- GPU-residente Kommunikationsprimitive und geräteseitige APIs entwickeln, die eine feingranulare, kernelinitiierte Datenbewegung über Knoten und Beschleuniger ermöglichen.
- GPU-Kerne end-to-end profilieren und abstimmen, Engpässe an der Schnittstelle von Berechnung, Speicher und Netzwerk identifizieren und gezielte Optimierungen vorantreiben.
- Mit Netzwerksoftware-, Hardware- und KI-Framework-Teams zusammenarbeiten, um Kommunikationsstrategien zu entwerfen, die mit GPU-Ausführungsmustern und aufkommenden Modellarchitekturen übereinstimmen.
- Proofs-of-Concept erstellen, Experimente durchführen und quantitative Modellierung durchführen, um neue Kommunikationsstrategien zu bewerten und zu validieren, bevor sie in die Produktion gehen.
- Zur Weiterentwicklung von Programmiermodellen beitragen, die GPU-bewusste Netzwerkfähigkeiten für Anwendungsentwickler bereitstellen.
Was wir sehen müssen:
- 5+ Jahre praktische CUDA-Programmierung, einschließlich Schreiben und Optimieren nicht-trivialer GPU-Kerne.
- M.Sc. oder gleichwertige Erfahrung in Informatik, Computertechnik oder einem eng verwandten Bereich.
- Starkes Verständnis der Grundlagen der GPU-Architektur: Warp-Scheduling, Shared Memory, L2-Cache, Speicherkoaleszenz, Belegungsoptimierung und asynchrone Ausführung.
- Erfahrung mit systemnaher C/C++-Entwicklung in leistungs-kritischen Umgebungen.
- Vertrautheit mit GPU-Datenbewegungsmechanismen wie GPUDirect RDMA und GPU-initiierten Kommunikationen.
- Fähigkeit, GPU-Leistungsprofile zu lesen und zu analysieren und Beobachtungen in umsetzbare Optimierungen zu übersetzen.
- Starke Zusammenarbeit in einem multinationalen, interdisziplinären Umfeld.
Hervorstechen aus der Menge:
- Erfahrung in der Entwicklung oder Optimierung von Kommunikationskernen in Bibliotheken wie NCCL, NVSHMEM oder ähnlichen GPU-bewussten Kommunikationsframeworks.
- Verständnis von Techniken des verteilten Deep Learning, einschließlich Datenparallelismus, Tensorparallelismus, Pipeline-Parallelismus, Expertenparallelismus und Mischexperten-Parallelismus sowie der Kommunikationsmuster, die sie auf GPU-Kerne auferlegen.
- Hintergrund in RDMA, InfiniBand, Hochgeschwindigkeitsnetzwerken und GPU-Systemtopologie, einschließlich NVLink, NVSwitch, PCIe und Netzwerkfabriken, und deren Einfluss auf das Design von Kommunikationskernen.
- Erfahrung mit Überlappungstechniken wie Kernel-Pipelining, persistente Kerne oder kooperative Gruppen, um Kommunikationslatenz hinter Berechnungen zu verbergen.
- Nachgewiesene Erfahrung in der Bewertung und Optimierung von großangelegten LLM-Trainings- oder Inferenzlasten, einschließlich praktischer Arbeit mit Frameworks wie PyTorch, TensorRT-LLM oder vLLM und Vertrautheit mit aufkommenden Servierungsarchitekturen wie disaggregierter Servierung.
Bei NVIDIA arbeiten Sie mit Kollegen zusammen, die tiefes Fachwissen und innovative Denkweise in der Branche demonstrieren und die Grenzen dessen, was in KI und Hochleistungsrechnen möglich ist, erweitern. Wenn Sie leidenschaftlich an GPU-Architektur, Low-Level-Kernel-Optimierung und dem Aufbau des Kommunikationsgewebes für die nächste Generation von KI interessiert sind, möchten wir von Ihnen hören!
NVIDIA gilt weithin als einer der begehrtesten Arbeitgeber der Technologiebranche und bietet hoch wettbewerbsfähige Gehälter sowie ein umfassendes Leistungspaket.
Senior GPU Networking Architect Arbeitgeber: NVIDIA Corporation
NVIDIA ist ein herausragender Arbeitgeber, der eine dynamische und unterstützende Arbeitsumgebung bietet, in der Innovation und Zusammenarbeit gefördert werden. Mit einem starken Fokus auf Mitarbeiterentwicklung und einer Vielzahl von Vorteilen, einschließlich wettbewerbsfähiger Gehälter und umfassender Sozialleistungen, ermöglicht NVIDIA seinen Mitarbeitern, an der Spitze der Technologie zu arbeiten und bedeutende Beiträge zur Zukunft der KI und des Hochleistungsrechnens zu leisten. In Polen profitieren Sie von einem attraktiven Gehaltsrahmen und der Möglichkeit, in einem internationalen Team von Experten zu arbeiten, das die Grenzen des Möglichen ständig erweitert.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior GPU Networking Architect erhalten könnten
✨Netzwerken, Netzwerken, Netzwerken!
Nutze jede Gelegenheit, um mit Leuten aus der Branche in Kontakt zu treten. Besuche Meetups, Konferenzen oder Online-Webinare. Je mehr du dich zeigst und deine Leidenschaft für GPU-Architektur teilst, desto wahrscheinlicher ist es, dass du die richtigen Leute triffst, die dir helfen können, deinen Traumjob zu finden.
✨Zeige deine Projekte!
Hast du an coolen Projekten gearbeitet? Zeig sie! Erstelle ein Portfolio oder eine GitHub-Seite, auf der du deine besten Arbeiten präsentierst. Das gibt potenziellen Arbeitgebern einen Einblick in deine Fähigkeiten und zeigt, dass du nicht nur redest, sondern auch handelst.
✨Bereite dich auf technische Interviews vor!
Technische Interviews können knifflig sein, also übe vorher! Nutze Plattformen wie LeetCode oder HackerRank, um deine Programmierfähigkeiten zu schärfen. Sei bereit, über deine Erfahrungen mit CUDA und GPU-Architektur zu sprechen und zeige, dass du die Herausforderungen in diesem Bereich meistern kannst.
✨Bewirb dich direkt über unsere Website!
Wenn du denkst, dass du der perfekte Kandidat für die Stelle bist, bewirb dich direkt über unsere Website. So stellst du sicher, dass deine Bewerbung die richtige Aufmerksamkeit bekommt. Und vergiss nicht, dein Netzwerk zu nutzen, um deine Bewerbung zu pushen!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior GPU Networking Architect mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei authentisch!:Wenn du deine Bewerbung schreibst, sei einfach du selbst. Zeig uns, was dich motiviert und warum du für die Rolle als Senior GPU Networking Architect brennst. Authentizität kommt immer gut an!
Betone deine Erfahrungen:Stell sicher, dass du deine relevanten Erfahrungen und Fähigkeiten klar hervorhebst. Besonders deine Kenntnisse in CUDA-Programmierung und GPU-Architektur sollten deutlich werden. Wir wollen sehen, was du drauf hast!
Verwende klare Sprache:Halte deine Bewerbung klar und präzise. Vermeide Fachjargon, der nicht notwendig ist, und achte darauf, dass wir schnell verstehen, was du sagen möchtest. Klarheit ist der Schlüssel!
Bewirb dich über unsere Website:Vergiss nicht, dich direkt über unsere Website zu bewerben! So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnell bearbeiten können. Wir freuen uns auf deine Unterlagen!
Wie man sich auf ein Vorstellungsgespräch bei NVIDIA Corporation vorbereitet
✨Verstehe die GPU-Architektur
Mach dich mit den Grundlagen der GPU-Architektur vertraut, insbesondere mit Themen wie Warp-Scheduling und Speicherhierarchie. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen in der Optimierung von GPU-Kernen hast.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast. Sei bereit, über deine Erfahrungen mit CUDA-Programmierung und der Entwicklung von Kommunikationskernen zu sprechen. Konkrete Beispiele helfen, deine Fähigkeiten zu untermauern.
✨Zeige Teamarbeit und Zusammenarbeit
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, über deine Erfahrungen in interdisziplinären Teams zu sprechen. Betone, wie du erfolgreich mit anderen Ingenieuren und Abteilungen zusammengearbeitet hast, um Kommunikationsstrategien zu entwickeln.
✨Frage nach den nächsten Schritten
Am Ende des Interviews kannst du nach den nächsten Schritten im Auswahlprozess fragen. Das zeigt dein Interesse an der Position und gibt dir die Möglichkeit, mehr über die Unternehmenskultur und das Team zu erfahren.