Auf einen Blick
- Aufgaben: Entwickle KI-Inferenzsysteme und optimiere Hochleistungs-Stacks für große Modelle.
- Unternehmen: NVIDIA, ein führendes Unternehmen in der KI-Forschung und -Entwicklung.
- Vorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
- Weitere Informationen: Arbeite in einem kreativen Umfeld mit exzellenten Karrierechancen.
- Warum dieser Job: Gestalte die Zukunft der KI mit innovativen Technologien und einem dynamischen Team.
- Qualifikationen: Erforderlich sind umfangreiche Erfahrung in Softwareentwicklung und starke Programmierkenntnisse.
Das prognostizierte Gehalt liegt zwischen 50000 - 70000 € pro Jahr.
Wir suchen hochqualifizierte und motivierte Software-Ingenieure, die uns helfen, KI-Inferenzsysteme zu entwickeln, die groß angelegte Modelle mit extremer Effizienz bedienen. Sie werden Hochleistungs-Inferenzstacks entwerfen und implementieren, GPU-Kerne und Compiler optimieren, Branchenbenchmarks vorantreiben und Workloads über Multi-GPU-, Multi-Node- und Multi-Cloud-Umgebungen skalieren. Sie werden mit Teams aus den Bereichen Inferenz, Compiler, Planung und Leistung zusammenarbeiten, um die Grenzen des beschleunigten Rechnens für KI zu erweitern.
Verantwortlichkeiten
- Funktionen zu vLLM beitragen, die die neuesten Modelle mit den neuesten NVIDIA-GPU-Hardwarefunktionen unterstützen; das Inferenz-Framework (vLLM) mit Methoden wie spekulativer Dekodierung, Daten-/Tensor-/Experten-/Pipeline-Parallele und Prefill-Decode-Disaggregation profilieren und optimieren.
- GPU-Kerne (handoptimiert und vom Compiler generiert) mit Techniken wie Fusion, Autotuning und Speicher-/Layout-Optimierung entwickeln, optimieren und benchmarken; hochgradige DSLs und Compiler-Infrastruktur aufbauen und erweitern, um die Produktivität der Kernel-Entwickler zu steigern und gleichzeitig eine maximale Hardwareauslastung zu erreichen.
- Methoden und Werkzeuge zur Inferenz-Benchmarking definieren und erstellen; sowohl neue Benchmarks als auch NVIDIA-Beiträge zur branchenführenden MLPerf Inferenz-Benchmarking-Suite beitragen.
- Die Planung und Orchestrierung containerisierter großangelegter Inferenzbereitstellungen auf GPU-Clustern über Clouds hinweg entwerfen.
- Originalforschung durchführen und veröffentlichen, die die Pareto-Grenze im Bereich der ML-Systeme verschiebt; aktuelle Veröffentlichungen überprüfen und einen Weg finden, Forschungsideen und Prototypen in die Softwareprodukte von NVIDIA zu integrieren.
Erforderliche Qualifikationen
- Abschluss (Bachelor oder gleichwertige Erfahrung) in Informatik, Computertechnik oder Softwaretechnik mit mehr als 7 Jahren Erfahrung; alternativ Master-Abschluss mit mehr als 5 Jahren Erfahrung; oder Doktortitel mit Dissertation und erstklassigen Veröffentlichungen in ML-Systemen, GPU-Architektur oder Hochleistungsrechnen.
- Starke Programmierkenntnisse in Python und C/C++; Erfahrung mit Go oder Rust ist von Vorteil; solide Grundlagen in der Informatik: Algorithmen & Datenstrukturen, Betriebssysteme, Computerarchitektur, paralleles Programmieren, verteilte Systeme, Theorien des tiefen Lernens.
- Kenntnis und Leidenschaft für Performance Engineering in ML-Frameworks (z.B. PyTorch) und Inferenz-Engines (z.B. vLLM und SGLang).
- Vertrautheit mit GPU-Programmierung und -Leistung: CUDA, Speicherhierarchie, Streams, NCCL; Kenntnisse in Profilierungs-/Debugging-Tools (z.B. Nsight Systems/Compute).
- Erfahrung mit Containern und Orchestrierung (Docker, Kubernetes, Slurm); Vertrautheit mit Linux-Namensräumen und cgroups.
- Exzellente Debugging-, Problemlösungs- und Kommunikationsfähigkeiten; Fähigkeit, in einem schnelllebigen, multifunktionalen Umfeld erfolgreich zu sein.
Wünschenswerte Qualifikationen
- Erfahrung im Aufbau und in der Optimierung von LLM-Inferenz-Engines (z.B. vLLM, SGLang).
- Praktische Erfahrung mit ML-Compilern und DSLs (z.B. Triton, TorchDynamo/Inductor, MLIR/LLVM, XLA), GPU-Bibliotheken (z.B. CUTLASS) und Funktionen (z.B. CUDA Graph, Tensor Cores).
- Erfahrung mit Containerisierungs-/Virtualisierungstechnologien wie containerd/CRI-O/CRIU.
- Erfahrung mit Cloud-Plattformen (AWS/GCP/Azure), Infrastruktur als Code, CI/CD und Produktionsbeobachtbarkeit.
- Beiträge zu Open-Source-Projekten und/oder Veröffentlichungen; bitte Links zu GitHub-Pull-Requests, veröffentlichten Arbeiten und Artefakten beifügen.
Über NVIDIA
Bei NVIDIA glauben wir, dass künstliche Intelligenz (KI) grundlegend verändern wird, wie Menschen leben und arbeiten. Unsere Mission ist es, die KI-Forschung und -Entwicklung voranzutreiben, um bahnbrechende Technologien zu schaffen, die es jedem ermöglichen, die Kraft der KI zu nutzen und von ihrem Potenzial zu profitieren. Unser Team besteht aus Experten für KI, Systeme und Leistungsoptimierung. Unsere Führung umfasst weltweit anerkannte Experten in KI-Systemen, die mehrere akademische und industrielle Forschungsawards erhalten haben. Wenn Sie begeistert sind, Systeme, Kerne und Tools zu entwickeln, die großangelegte KI schneller, effizienter und einfacher bereitstellen, würden wir uns freuen, von Ihnen zu hören.
Senior Software Engineer, AI Inference Systems Arbeitgeber: NVIDIA Gruppe
NVIDIA ist ein herausragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, an der Spitze der KI-Technologie zu arbeiten. Mit einem dynamischen Arbeitsumfeld in Polen fördern wir eine Kultur der Zusammenarbeit und Innovation, während wir gleichzeitig umfangreiche Weiterbildungsmöglichkeiten und Karriereentwicklung bieten. Unsere Mitarbeiter profitieren von wettbewerbsfähigen Gehältern, flexiblen Arbeitsmodellen und der Chance, an bahnbrechenden Projekten zu arbeiten, die die Zukunft der KI gestalten.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior Software Engineer, AI Inference Systems erhalten könnten
✨Netzwerken, Netzwerken, Netzwerken!
Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht vergessen, dass viele Jobs über persönliche Empfehlungen vergeben werden!
✨Sei bereit für technische Interviews!
Mach dich mit typischen Fragen und Herausforderungen vertraut, die in technischen Interviews gestellt werden. Übe das Programmieren unter Zeitdruck – das wird dir helfen, deine Fähigkeiten zu zeigen!
✨Präsentiere deine Projekte!
Habe eine Auswahl deiner besten Projekte bereit, um sie während des Interviews zu präsentieren. Zeige, was du kannst, und erkläre, wie du Probleme gelöst hast – das beeindruckt die Interviewer!
✨Bewirb dich direkt über unsere Website!
Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So bist du sicher, dass deine Bewerbung die richtigen Leute erreicht und du die besten Chancen auf ein Vorstellungsgespräch hast!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Software Engineer, AI Inference Systems mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Mach deine Hausaufgaben:Bevor du mit deiner Bewerbung anfängst, schau dir unsere Website genau an. Verstehe, was wir bei StudySmarter machen und wie du mit deinen Fähigkeiten zu unserem Team passen kannst. Das zeigt uns, dass du wirklich interessiert bist!
Sei konkret und präzise:Wenn du deine Erfahrungen und Fähigkeiten aufschreibst, sei so konkret wie möglich. Nenne spezifische Projekte oder Technologien, die du verwendet hast, und beschreibe, wie du Herausforderungen gemeistert hast. Das hilft uns, ein klares Bild von deinem Können zu bekommen.
Zeig deine Leidenschaft:Wir suchen nach Leuten, die nicht nur die nötigen Qualifikationen haben, sondern auch eine echte Leidenschaft für das, was sie tun. Teile in deinem Anschreiben, warum du dich für AI und Performance Engineering begeisterst und was dich motiviert, bei uns zu arbeiten.
Bewirb dich über unsere Website:Um sicherzustellen, dass deine Bewerbung nicht verloren geht, bewirb dich direkt über unsere Website. So können wir deine Unterlagen schnell und effizient bearbeiten und du bist einen Schritt näher dran, Teil unseres großartigen Teams zu werden!
Wie man sich auf ein Vorstellungsgespräch bei NVIDIA Gruppe vorbereitet
✨Verstehe die Technologien
Mach dich mit den neuesten Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie vLLM, CUDA und GPU-Programmierung. Zeige im Interview, dass du nicht nur die Grundlagen beherrschst, sondern auch aktuelle Trends und Entwicklungen in der KI und Performance-Engineering kennst.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast, insbesondere solche, die deine Fähigkeiten in Python, C/C++ oder GPU-Optimierung demonstrieren. Bereite dich darauf vor, diese Erfahrungen klar und prägnant zu erläutern, um deine Eignung für die Rolle zu unterstreichen.
✨Fragen stellen
Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Teamdynamik und die Herausforderungen, die dich erwarten, zu erfahren. Fragen zu den aktuellen Projekten oder zur Unternehmenskultur sind immer gut!
✨Soft Skills betonen
Neben technischen Fähigkeiten sind auch Kommunikations- und Problemlösungsfähigkeiten wichtig. Sei bereit, Beispiele zu geben, wie du in einem Team gearbeitet hast oder wie du komplexe Probleme gelöst hast. Dies zeigt, dass du nicht nur ein technischer Experte bist, sondern auch gut in einem dynamischen Umfeld arbeiten kannst.