Auf einen Blick
- Aufgaben: Entwickle und optimiere KI-Infrastruktur mit Kubernetes und verteilten Systemen.
- Unternehmen: NVIDIA, ein führendes Unternehmen für beschleunigtes Computing.
- Vorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
- Weitere Informationen: Dynamisches Team mit innovativen Projekten und exzellenten Karrieremöglichkeiten.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Herausforderungen.
- Qualifikationen: Mindestens 8 Jahre Erfahrung in Computerarchitektur und Kubernetes-Kenntnisse.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Die DGX Cloud-Organisation bei NVIDIA vereint modernste Hardware- und Software-Innovationen, um branchenführendes beschleunigtes Computing für die abenteuerlichsten KI-Workloads der Welt bereitzustellen. Wir sind ein Team innovativer Ingenieure, das sich der Lösung einiger der größten Herausforderungen der Welt widmet, ständig Fortschritte vorantreibt und Millionen von Leben weltweit beeinflusst! Wir suchen einen herausragenden Senior Systems Software Engineer mit umfassender Erfahrung in verteilten Systemen, Open-Source-Technologien wie Kubernetes und Containern sowie einem starken Hintergrund in Systemleistung und Skalierbarkeit.
Der ideale Kandidat bringt umfassende Erfahrungen über den gesamten Stack hinweg mit – von GPU-Operatoren und Geräte-Plugins bis hin zu verteiltem Inferenz-Serving und Cloud-Plattformen – sowie die technische Tiefe, um spannende, reale Probleme im großen Maßstab zu untersuchen und anzugehen. In dieser entscheidenden Rolle werden Sie die Herausforderung annehmen, die KI-Infrastruktur zu skalieren und gleichzeitig die Gesamtkosten zu optimieren, um die Kosten pro Token zu senken und die nächste Generation von KI-Innovationen und KI-Fabriken freizuschalten!
Was Sie tun werden:
- End-to-End-Leistung und Skalierungscharakterisierung für den NVIDIA DGX Cloud-Software-Stack vorantreiben, von Kubernetes-Kontroll- und Datenebenen bis hin zu NVIDIA-Komponenten wie GPU-Operator, Netzwerk-Operator, DCGM, NIM und verteiltem Inferenz-Serving, wobei Probleme von der Orchestrierung bis zum Metall verfolgt werden.
- Mit KI-Forschern, Entwicklern und Kunden zusammenarbeiten, um innovative, automatisierte Tests zu entwickeln, die reale Benutzer-Workloads mit maßgeschneiderten und führenden Open-Source-Tools und -Frameworks simulieren.
- In Leistungs- und Skalierungsprobleme in komplexen verteilten Systemen eintauchen, einschließlich der Interaktionen zwischen Kubernetes und dem NVIDIA-Software-Stack, um die Ursachen zu identifizieren und zu beheben.
- Überwachungs-, Reporting- und Analysetools für Leistungs- und Skalierungstests über Software-, GPU- und CPU-Ressourcen entwerfen und entwickeln.
- Probleme im Zusammenhang mit dem Betrieb von Kubernetes-Clustern in ultra-großem Maßstab triagieren, debuggen und die Ursachen ermitteln, um Zuverlässigkeit und Effizienz sicherzustellen.
- Ein hochdynamisches Framework aufbauen und pflegen, das kontinuierliche, immer verfügbare Leistungs- und Skalierungstests über eine moderne CI/CD-Pipeline ermöglicht.
- Forschung, Methoden und Ergebnisse klar und präzise dokumentieren und Ergebnisse intern und extern präsentieren, einschließlich Community-Konferenzen wie KubeCon und GTC.
- Effizient mit upstream-Communities – einschließlich Kubernetes, CNCF und NVIDIA Open-Source-Projekten – interagieren, um die Leistung und Skalierbarkeit von KI-Workloads frühzeitig zu validieren und Design- und Entwicklungsentscheidungen zu beeinflussen.
Was wir sehen möchten:
- Über 8 Jahre Erfahrung in Computerarchitektur, Netzwerken, Speichersystemen, Beschleunigern und einen Bachelor/Master in Ingenieurwissenschaften (vorzugsweise Elektrotechnik, Computertechnik oder Informatik) oder gleichwertige Erfahrung.
- Expertise in Kubernetes und Vertrautheit mit verwandten CNCF-Projekten.
- Hintergrund in der Arbeit mit großflächigen parallelen und verteilten beschleunigerbasierten Systemen.
- Expertise in der Optimierung von Leistung und KI-Workloads auf großflächigen Systemen.
- Erfahrung mit Leistungsmodellierung und Benchmarking im großen Maßstab.
- Kenntnisse in Golang/Python.
- Hintergrund im NVIDIA-Software-Ökosystem sowohl im Trainings- als auch im Inferenzbereich.
- Expertise mit mindestens einer öffentlichen CSP-Infrastruktur (z.B. GCP, AWS, Azure, OCI).
Wie Sie sich von der Masse abheben können:
- Starke operative Erfahrung mit einer der Kubernetes-Distributionen.
- Frühere Erfahrung in der Skalierung von Kubernetes-Clustern auf ultra-große Knoten- und Objektzahlen.
- Nachgewiesene Geschichte der Arbeit in der Open-Source-Community.
- Exzellente Kommunikations- und zwischenmenschliche Fähigkeiten.
- Doktorgrad in relevanten Bereichen.
NVIDIA wird weithin als einer der begehrtesten Arbeitgeber der Technologiebranche angesehen. Wir haben einige der fortschrittlichsten und fleißigsten Menschen der Welt, die für uns arbeiten. Wenn Sie kreativ und autonom sind, möchten wir von Ihnen hören!
Senior Systems Software Engineer, Kubernetes Scale - DGX Cloud Arbeitgeber: Nvidia
NVIDIA ist ein herausragender Arbeitgeber, der innovative Ingenieure anzieht, die an der Spitze der Technologie arbeiten und bedeutende Herausforderungen im Bereich KI bewältigen. Unsere Unternehmenskultur fördert Kreativität und Eigenverantwortung, während wir gleichzeitig umfangreiche Möglichkeiten zur beruflichen Weiterentwicklung bieten. Mit einem dynamischen Team in Polen profitieren Sie von einem wettbewerbsfähigen Gehalt und der Chance, an bahnbrechenden Projekten zu arbeiten, die das Leben von Millionen beeinflussen.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior Systems Software Engineer, Kubernetes Scale - DGX Cloud erhalten könnten
✨Engagier dich in Entwickler-Communities!
Lass uns mal ehrlich sein: In der Software-Entwicklung sind Netzwerke Gold wert! Tummel dich in GitHub-Projekten, nehme an lokalen Meetups oder Hackathons teil und vernetze dich mit anderen Entwicklern. So steigerst du nicht nur deine Sichtbarkeit, sondern lernst auch die neuesten Trends und Technologien kennen.
✨Zeig deine Fähigkeiten!
Erstelle ein Portfolio, das deine besten Projekte und Code-Examples zeigt. Nichts überzeugt mehr als ein praktischer Beweis deiner Skills. Das kann auch helfen, bei Nvidia anzuklopfen, wenn du dich auf die Stelle als Senior Systems Software Engineer, Kubernetes Scale - DGX Cloud bewirbst – so wissen sie gleich, was sie von dir erwarten können!
✨Nutze Jobplattformen speziell für Tech-Jobs!
Plattformen wie Stack Overflow Jobs oder AngelsList sind perfekte Orte, um Vollzeitstellen in der Software-Entwicklung zu finden. Hier sind viele tolle Unternehmen auf der Suche nach Talenten wie uns, also schau regelmäßig vorbei und bewirb dich direkt über die Website.
✨Such dir Mentoren und Feedback!
Hol dir Feedback von erfahrenen Entwicklern, die dir Tipps geben können, was Recruiter wirklich suchen. Ob über LinkedIn oder persönliche Kontakte: Menschen, die sich in der Branche auskennen, können enorm wertvoll sein, um dir zu helfen, dich optimal auf deine Bewerbung bei Nvidia vorzubereiten!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Systems Software Engineer, Kubernetes Scale - DGX Cloud mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Highlights deiner Coding-Skills:In der Software-Entwicklung kommt es auf konkrete Fähigkeiten an. Vergiss nicht, relevante Programmiersprachen und Frameworks in deinen Lebenslauf aufzunehmen. Zeig uns, was du kannst – vielleicht mit einem Link zu deinem GitHub-Profil oder einer Übersicht deiner Side Projects, die deine Programmierkenntnisse illustrieren.
Dokumentation deiner Erfolge:Gerade bei einer Vollzeitstelle in der Software-Entwicklung sind konkrete Ergebnisse Gold wert. Nenn uns Zahlen und Ergebnisse aus deinen vorherigen Projekten. Hast du den Code optimiert oder Systemfehler behoben? Solche Erfolge zeigen, dass du die Sprache der Entwickler sprichst und einen echten Mehrwert bringst.
Attraktive Projektbeschreibungen:Wenn du an Projekten gearbeitet hast, die hervorstechen, beschreibe sie ausführlich in deinem Lebenslauf. Was war das Problem, das du gelöst hast? Welche Technologien hast du eingesetzt? Das gibt uns einen klaren Einblick in deine Herangehensweise und Problemlösungsfähigkeiten.
Motivation zeigen:In deinem Anschreiben solltest du deine Motivation für die Stelle im Bereich Software-Entwicklung bei Nvidia klar herausstellen. Warum sprichst gerade du die Anforderungen für diese Vollzeitrolle an? Mach deutlich, was dich an der Arbeit bei uns reizt und wie du über das rein Technische hinaus wachsen möchtest.
Wie man sich auf ein Vorstellungsgespräch bei Nvidia vorbereitet
✨Technische Vorbereitung auf die Coding-Challenges
In der Software-Entwicklung sind technische Fragen oft ein zentraler Teil des Interviews. Macht euch mit Plattformen wie LeetCode oder HackerRank vertraut, um eure Problemlösungsfähigkeiten zu trainieren. Zeigt im Interview viel Selbstbewusstsein beim Erklären eurer Ansätze!
✨Das eigene Portfolio im besten Licht präsentieren
Stellt sicher, dass ihr ein aussagekräftiges Portfolio habt, das einige eurer besten Projekte zeigt. Seid bereit, darüber zu sprechen, was eure Rolle war, welche Technologien ihr verwendet habt und welche Herausforderungen es gab. Das gibt den Interviewern einen Einblick in eure praktische Erfahrung.
✨Teamfähigkeit und Kommunikation betonen
In einer Vollzeit-Position wird Kommunikation im Team sehr wichtig sein. Seid bereit, Beispiele aus der Vergangenheit zu teilen, in denen ihr effektiv im Team gearbeitet habt. Dies zeigt, dass ihr nicht nur technische Fähigkeiten habt, sondern auch gut ins Team passt.
✨Vorbereitung auf Fragen zur Software-Architektur
Bereitet euch darauf vor, Fragen zur Software-Architektur zu beantworten. Themen wie RESTful APIs, Microservices und Cloud-Architekturen können Teil eures Interviews sein. Zeigt euer Verständnis durch Diskussionen und Beispiele aus eurer bisherigen Arbeit oder Projekte.