Auf einen Blick
- Aufgaben: Entwickle und integriere KI-Lösungen mit NVIDIA-Technologie für führende Cloud-Partner.
- Unternehmen: NVIDIA, ein innovatives Unternehmen im Bereich künstliche Intelligenz.
- Vorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen und Möglichkeiten zur beruflichen Weiterentwicklung.
- Weitere Informationen: Dynamisches Umfeld mit hervorragenden Wachstumschancen und Zusammenarbeit mit verschiedenen Teams.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten mit modernster Technologie.
- Qualifikationen: Master oder Ph.D. in Informatik oder verwandten Bereichen, 5+ Jahre Erfahrung in maschinellem Lernen.
Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.
NVIDIA’s Worldwide Field Operations (WWFO) team sucht einen AI-fokussierten Solution Architect mit Expertise in der Inferenz von neuronalen Netzwerken und der Entwicklung/Betrieb von agentischen Pipelines. Ein Kandidat sollte ein Verständnis für die Inferenz von großen DNNs sowie das End-to-End-Design von agentischen Utilities mit Tools wie NVIDIA NeMo Agent Toolkit, LangChain, LLamaIndex, Haystack usw. haben.
Als Solutions Architect in unserem Team werden Sie eine kundenorientierte technische Rolle übernehmen, um einem oder mehreren führenden NVIDIA Cloud Partnern (NCPs) zu helfen, den NVIDIA AI-Stack und andere Open-Source-GPU-beschleunigte Stacks zu integrieren und ihnen zu helfen, eine E2E-Lösung für AI-Dienste von Training bis Post-Training und Inferenz-Workloads zu entwickeln, bereitzustellen und zu unterstützen. Sie werden an Projekten teilnehmen, die Technologien wie LLMs, VLMs, Physical-AI, agentische Pipelines und andere umfassen.
Wir suchen jemanden, der immer an künstlicher Intelligenz denkt, der in einem schnelllebigen, sich schnell entwickelnden Bereich gedeihen kann, und der in der Lage ist, die Bemühungen zwischen Kunden, Unternehmensmarketing, Geschäftsentwicklung in der Industrie und Engineering zu koordinieren. Die Arbeit an verschiedenen Projekten und Aufgaben sowie das effiziente Multitasking bei gleichzeitiger Beibehaltung eines kundenorientierten Ansatzes sind in dieser Funktion entscheidend.
In dieser Rolle werden Sie die erste technische Anlaufstelle zwischen NVIDIA und unseren Partnern und Kunden sein. Zu Ihren Aufgaben gehört die Arbeit an Proof-of-Concept-Demonstrationen und die Leitung der Diskussion mit Entwicklern, Produktteams und wichtigen Führungskräften. Sie werden die Einführung der NVIDIA AI-Technologieplattform fördern und deren Bereitstellung in der Produktion vereinfachen. Das dynamische Engagement mit verschiedenen Rollen innerhalb von NVIDIA und mit dem NCP und anderen Partnern ist ein wesentlicher Bestandteil der Rolle des Solutions Architect und wird Ihnen Erfahrung mit einer Vielzahl von Technologien bieten.
Was Sie tun werden:
- Direkt mit unseren NCPs und deren wichtigsten Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
- Lösungen basierend auf NVIDIA’s und Open-Source-NLP- und LLM-Technologie entwickeln und demonstrieren sowie diese in agentische Pipelines integrieren.
- Eine eingehende Analyse und Optimierung durchführen, um die beste Leistung auf GPU-basierten Systemen sicherzustellen. Dies umfasst die Inferenzoptimierung sowie die Optimierung von End-to-End-agentischen Pipelines.
- Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen.
- Die Entwicklung und das Wachstum von Produktfunktionen durch Kundenfeedback und Proof-of-Concept-Bewertungen ermöglichen.
- Branchenspezifisches Fachwissen aufbauen und ein Mitwirkender bei der Integration von NVIDIA-Technologie in AI-Cloud-Lösungen und Enterprise-Computing-Architekturen werden.
Was wir sehen möchten:
- Exzellente verbale, schriftliche Kommunikations- und technische Präsentationsfähigkeiten in Englisch.
- Master oder Ph.D. in Informatik, Künstlicher Intelligenz oder gleichwertige Erfahrung.
- 5+ Jahre Industrie- und/oder akademische Erfahrung in Bereichen, die mit maschinellem Lernen, Deep Learning und/oder Datenwissenschaft zu tun haben, mit Vorliebe für DNN-Inferenz.
- Berufserfahrung und Kenntnisse moderner LLM-, VLM- und Diffusionsarchitekturen mit Schwerpunkt auf MoE.
- Verständnis der wichtigsten Bibliotheken, die für DNN-Inferenz verwendet werden (z.B. TRT-LLM, Dynamo, RedHat Inference Server) sowie der Entwicklung agentischer Pipelines.
- Begeisterung für die Zusammenarbeit mit verschiedenen Ebenen und Teams in Organisationen (Engineering, Produkt, Vertrieb und Marketing).
- Stark ausgeprägte analytische und problemlösende Fähigkeiten. Sie sind ein Selbststarter mit dem Drang nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.
- Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr anspruchsvollen Projekten.
Wie Sie sich von der Masse abheben können:
- Erfahrung mit der Inferenz sehr großer MoE-Architekturen für NLP, CV, ASR oder andere.
- Erfahrung mit DevOps-Technologien wie Docker, Kubernetes, Singularity usw.
- Verständnis von HPC-Systemen: Design von Rechenzentren, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und damit verbundene Design- und/oder Verwaltungserfahrungen.
Solutions Architect, Cloud Inference Services Arbeitgeber: Nvidia
NVIDIA ist ein herausragender Arbeitgeber, der innovative Lösungen im Bereich künstliche Intelligenz fördert und seinen Mitarbeitern die Möglichkeit bietet, an vorderster Front der Technologie zu arbeiten. Mit einem dynamischen Arbeitsumfeld, das auf Zusammenarbeit und kontinuierlichem Lernen basiert, unterstützt NVIDIA die berufliche Weiterentwicklung seiner Mitarbeiter durch spannende Projekte und enge Zusammenarbeit mit führenden Partnern. Die Unternehmenskultur legt Wert auf Kreativität und Teamarbeit, was es den Mitarbeitern ermöglicht, ihre Fähigkeiten in einem schnelllebigen und sich ständig weiterentwickelnden Bereich zu entfalten.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Solutions Architect, Cloud Inference Services erhalten könnten
✨Tipp Nummer 1
Sei proaktiv und nutze Networking! Sprich mit Leuten aus der Branche, besuche Meetups oder Konferenzen. Oft erfährt man von offenen Stellen durch persönliche Kontakte.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe, wie du deine Lösungen präsentieren kannst, und sei bereit, deine Denkweise zu erklären. Zeige, dass du die Technologien, die du verwendest, wirklich verstehst.
✨Tipp Nummer 3
Nutze unsere Website für Bewerbungen! Wir haben viele spannende Stellen, die perfekt zu deinem Profil passen könnten. Es ist der beste Weg, um direkt in Kontakt mit uns zu treten.
✨Tipp Nummer 4
Bleib flexibel und offen für verschiedene Rollen! Manchmal kann eine Position, die nicht genau deinem Traumjob entspricht, dir wertvolle Erfahrungen und Kontakte bringen, die später nützlich sein können.
Wir glauben, dass du diese Fähigkeiten brauchst, um Solutions Architect, Cloud Inference Services mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für KI haben und bereit sind, ihre Ideen und Erfahrungen zu teilen.
Mach es konkret!:Verwende spezifische Beispiele aus deiner bisherigen Erfahrung, um deine Fähigkeiten zu untermauern. Zeig uns, wie du in der Vergangenheit Probleme gelöst hast und welche Technologien du eingesetzt hast, um Lösungen zu entwickeln.
Sprich unsere Sprache!:Achte darauf, die Begriffe und Technologien, die in der Stellenbeschreibung erwähnt werden, in deiner Bewerbung zu verwenden. Das zeigt uns, dass du die Anforderungen verstehst und dich mit den Themen auskennst.
Bewirb dich über unsere Website!:Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und effizient bei uns ankommt und wir dich besser kennenlernen können.
Wie man sich auf ein Vorstellungsgespräch bei Nvidia vorbereitet
✨Verstehe die Technologien
Mach dich mit den spezifischen Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie NVIDIA NeMo Agent Toolkit und LangChain. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen oder Projekte hast, die diese Tools nutzen.
✨Bereite dich auf technische Fragen vor
Erwarte technische Fragen zu DNN-Inferenz und agentischen Pipelines. Übe, wie du komplexe Konzepte einfach erklären kannst, damit du deine Kommunikationsfähigkeiten unter Beweis stellen kannst. Das wird dir helfen, das Vertrauen der Interviewer zu gewinnen.
✨Kundenorientierung zeigen
Da die Rolle kundenorientiert ist, bereite Beispiele vor, wie du in der Vergangenheit erfolgreich mit Kunden zusammengearbeitet hast. Betone deine Fähigkeit, technische Lösungen an die Bedürfnisse der Kunden anzupassen und wie du Feedback in die Produktentwicklung integriert hast.
✨Multitasking-Fähigkeiten demonstrieren
Bereite dich darauf vor, über deine Erfahrungen im Multitasking zu sprechen. Gib konkrete Beispiele, wie du mehrere Projekte gleichzeitig verwaltet hast, ohne die Qualität zu beeinträchtigen. Dies zeigt, dass du in einem schnelllebigen Umfeld arbeiten kannst.