Auf einen Blick
- Aufgaben: Entwickle und optimiere KI-Inferenzsysteme für große Modelle mit modernster Technologie.
- Arbeitgeber: NVIDIA, ein führendes Unternehmen in der KI-Forschung und -Entwicklung.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
- Andere Informationen: Dynamisches Team mit Experten und hervorragenden Karrieremöglichkeiten.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an bahnbrechenden Technologien.
- Gewünschte Qualifikationen: Erforderlich sind umfangreiche Programmierkenntnisse und Erfahrung in der Softwareentwicklung.
Das voraussichtliche Gehalt liegt zwischen 75000 - 100000 € pro Jahr.
Wir suchen hochqualifizierte und motivierte Software-Ingenieure, die uns dabei unterstützen, KI-Inferenzsysteme zu entwickeln, die großangelegte Modelle mit extremer Effizienz bedienen. Sie werden Hochleistungs-Inferenzstacks entwerfen und implementieren, GPU-Kerne und Compiler optimieren, Branchenbenchmarks vorantreiben und Workloads über Multi-GPU-, Multi-Node- und Multi-Cloud-Umgebungen skalieren. Sie werden mit Teams aus den Bereichen Inferenz, Compiler, Planung und Leistung zusammenarbeiten, um die Grenzen des beschleunigten Rechnens für KI zu erweitern.
Was Sie tun werden:
- Funktionen zu vLLM beitragen, die die neuesten Modelle mit den neuesten NVIDIA-GPU-Hardwarefunktionen ausstatten; das Inferenz-Framework (vLLM) mit Methoden wie spekulativer Dekodierung, Daten-/Tensor-/Experten-/Pipeline-Parallele und Prefill-Dekodierungsdisaggregation profilieren und optimieren.
- GPU-Kerne (handoptimiert und vom Compiler generiert) mit Techniken wie Fusion, Autotuning und Speicher-/Layout-Optimierung entwickeln, optimieren und benchmarken; hochrangige DSLs und Compiler-Infrastruktur aufbauen und erweitern, um die Produktivität der Kernel-Entwickler zu steigern und gleichzeitig eine maximale Hardwareauslastung zu erreichen.
- Methoden und Werkzeuge zur Inferenz-Benchmarking definieren und erstellen; sowohl neue Benchmarks als auch NVIDIA-Beiträge zur branchenführenden MLPerf Inferenz-Benchmarking-Suite beisteuern.
- Die Planung und Orchestrierung containerisierter großangelegter Inferenzbereitstellungen auf GPU-Clustern über Clouds architektonisch gestalten.
- Originalforschung durchführen und veröffentlichen, die die Pareto-Grenze im Bereich der ML-Systeme verschiebt; aktuelle Veröffentlichungen durchsehen und einen Weg finden, Forschungsansätze und Prototypen in die Softwareprodukte von NVIDIA zu integrieren.
Was wir sehen möchten:
- Abschluss (oder gleichwertige Erfahrung) in Informatik (CS), Computertechnik (CE) oder Softwaretechnik (SE) mit mehr als 7 Jahren Erfahrung; alternativ Master-Abschluss in CS/CE/SE mit mehr als 5 Jahren Erfahrung; oder Doktortitel mit der Dissertation und erstklassigen Veröffentlichungen in ML-Systemen, GPU-Architektur oder Hochleistungsrechnen.
- Starke Programmierkenntnisse in Python und C/C++; Erfahrung mit Go oder Rust ist von Vorteil; solide Grundlagen in der Informatik: Algorithmen & Datenstrukturen, Betriebssysteme, Computerarchitektur, paralleles Programmieren, verteilte Systeme, Theorien des tiefen Lernens.
- Kenntnis und Leidenschaft für Performance Engineering in ML-Frameworks (z.B. PyTorch) und Inferenz-Engines (z.B. vLLM und SGLang).
- Vertrautheit mit GPU-Programmierung und -Leistung: CUDA, Speicherhierarchie, Streams, NCCL; Kenntnisse in Profilierungs-/Debugging-Tools (z.B. Nsight Systems/Compute).
- Erfahrung mit Containern und Orchestrierung (Docker, Kubernetes, Slurm); Vertrautheit mit Linux-Namensräumen und cgroups.
- Ausgezeichnete Debugging-, Problemlösungs- und Kommunikationsfähigkeiten; Fähigkeit, in einem schnelllebigen, multifunktionalen Umfeld zu glänzen.
Wie Sie sich von der Masse abheben können:
- Erfahrung im Aufbau und in der Optimierung von LLM-Inferenz-Engines (z.B. vLLM, SGLang).
- Praktische Erfahrung mit ML-Compilern und DSLs (z.B. Triton, TorchDynamo/Inductor, MLIR/LLVM, XLA), GPU-Bibliotheken (z.B. CUTLASS) und Funktionen (z.B. CUDA Graph, Tensor Cores).
- Erfahrung mit Containerisierungs-/Virtualisierungstechnologien wie containerd/CRI-O/CRIU.
- Erfahrung mit Cloud-Plattformen (AWS/GCP/Azure), Infrastruktur als Code, CI/CD und Produktionsbeobachtbarkeit.
- Beiträge zu Open-Source-Projekten und/oder Veröffentlichungen; bitte Links zu GitHub-Pull-Requests, veröffentlichten Arbeiten und Artefakten beifügen.
Bei NVIDIA glauben wir, dass künstliche Intelligenz (KI) grundlegend verändern wird, wie Menschen leben und arbeiten. Unsere Mission ist es, die KI-Forschung und -Entwicklung voranzutreiben, um bahnbrechende Technologien zu schaffen, die es jedem ermöglichen, die Kraft der KI zu nutzen und von ihrem Potenzial zu profitieren. Unser Team besteht aus Experten für KI, Systeme und Leistungsoptimierung. Unsere Führung umfasst weltweit anerkannte Experten in KI-Systemen, die mehrere akademische und industrielle Forschungsawards erhalten haben. Wenn Sie begeistert sind, Systeme, Kerne und Werkzeuge zu entwickeln, die großangelegte KI schneller, effizienter und einfacher bereitstellen, würden wir uns freuen, von Ihnen zu hören.
Ihr Grundgehalt wird basierend auf Ihrem Standort, Ihrer Erfahrung und dem Gehalt von Mitarbeitern in ähnlichen Positionen festgelegt. Für Polen: Die Grundgehaltsspanne liegt bei 292.500 PLN - 507.000 PLN für Level 4 und 375.000 PLN - 650.000 PLN für Level 5.
Senior Software Engineer, AI Inference Systems Arbeitgeber: Nvidia
Kontaktperson:
Nvidia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior Software Engineer, AI Inference Systems
✨Netzwerken ist der Schlüssel
Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht nur Bewerbungen verschicken, sondern auch aktiv Gespräche führen und Beziehungen aufbauen!
✨Sei bereit für technische Interviews
Mach dich fit für technische Interviews, indem du Coding-Challenges und Systemdesign-Probleme übst. Wir sollten sicherstellen, dass wir unsere Fähigkeiten in Python, C/C++ und GPU-Programmierung glänzen lassen!
✨Präsentiere deine Projekte
Zeig uns deine besten Projekte! Ob Open-Source-Beiträge oder persönliche Projekte – teile Links zu deinem GitHub und präsentiere, was du drauf hast. Das hebt dich von anderen ab!
✨Bewirb dich direkt über unsere Website
Vergiss nicht, dich direkt über unsere Website zu bewerben! So können wir deine Bewerbung schneller sehen und du zeigst, dass du wirklich an uns interessiert bist.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior Software Engineer, AI Inference Systems
Tipps für deine Bewerbung 🫡
Sei präzise und konkret: Wenn du deine Erfahrungen und Fähigkeiten beschreibst, sei so konkret wie möglich. Verwende Beispiele aus deiner bisherigen Arbeit, um zu zeigen, wie du Probleme gelöst hast oder welche Erfolge du erzielt hast. Das macht deinen Lebenslauf lebendiger und überzeugender.
Pass auf die Formatierung auf: Eine klare und übersichtliche Formatierung ist das A und O. Nutze Absätze, Aufzählungen und eine einheitliche Schriftart, um deine Bewerbung ansprechend zu gestalten. So wird es für uns einfacher, deine Qualifikationen schnell zu erfassen.
Zeige deine Leidenschaft: Wir suchen nach Menschen, die wirklich für das brennen, was sie tun. Lass in deinem Anschreiben durchscheinen, warum du dich für die Position interessierst und was dich an der Arbeit mit KI-Inferenzsystemen begeistert. Deine Begeisterung kann den Unterschied machen!
Bewirb dich über unsere Website: Um sicherzustellen, dass wir deine Bewerbung schnell und effizient bearbeiten können, bewirb dich bitte direkt über unsere Website. So kannst du sicher sein, dass alle Informationen an die richtige Stelle gelangen und wir dich schnellstmöglich kontaktieren können.
Wie du dich auf ein Vorstellungsgespräch bei Nvidia vorbereitest
✨Verstehe die Technologien
Mach dich mit den neuesten Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie vLLM, CUDA und GPU-Programmierung. Zeige im Interview, dass du nicht nur die Grundlagen beherrschst, sondern auch aktuelle Trends und Entwicklungen in der KI und Performance-Engineering verfolgst.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Erfahrungen, die deine Fähigkeiten in der Optimierung von Inferenzsystemen und GPU-Kernen demonstrieren. Sei bereit, über Herausforderungen zu sprechen, die du gemeistert hast, und wie du zur Effizienzsteigerung beigetragen hast.
✨Zeige Teamarbeit und Kommunikation
Da die Rolle viel Zusammenarbeit erfordert, solltest du Beispiele für erfolgreiche Teamprojekte parat haben. Betone deine Kommunikationsfähigkeiten und wie du in einem dynamischen Umfeld effektiv mit anderen zusammengearbeitet hast.
✨Fragen stellen
Bereite einige durchdachte Fragen vor, die dein Interesse an der Position und dem Unternehmen zeigen. Frage nach den aktuellen Herausforderungen im Bereich der KI-Inferenzsysteme oder wie das Team Innovationen vorantreibt. Das zeigt, dass du wirklich an der Rolle interessiert bist.