Solutions Architect, Cloud Inference Services

Solutions Architect, Cloud Inference Services

Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Homeoffice möglich
Nvidia

Auf einen Blick

  • Aufgaben: Entwickle und integriere KI-Lösungen mit modernster Technologie für führende Cloud-Partner.
  • Unternehmen: NVIDIA, ein innovatives Unternehmen im Bereich künstliche Intelligenz.
  • Vorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Umfeld mit hervorragenden Karrieremöglichkeiten und Teamarbeit.
  • Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten mit führenden Partnern.
  • Qualifikationen: Master oder Ph.D. in Informatik oder verwandten Bereichen, 5+ Jahre Erfahrung in maschinellem Lernen.

Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

NVIDIA’s Worldwide Field Operations (WWFO) team sucht einen AI-fokussierten Solution Architect mit Expertise in der Inferenz von neuronalen Netzwerken und der Entwicklung/Betrieb von agentischen Pipelines. Ein Kandidat sollte ein Verständnis für die Inferenz von großen DNNs sowie das End-to-End-Design von agentischen Utilities mit Tools wie NVIDIA NeMo Agent Toolkit, LangChain, LLamaIndex, Haystack usw. haben.

Als Solutions Architect in unserem Team werden Sie eine kundenorientierte technische Rolle übernehmen, um einem oder mehreren führenden NVIDIA Cloud Partnern (NCPs) zu helfen, den NVIDIA AI-Stack und andere OpenSource GPU-beschleunigte Stacks zu integrieren und ihnen zu helfen, eine E2E-Lösung für AI-Dienste von Training bis Post-Training und Inferenz-Workloads zu entwickeln, bereitzustellen und zu unterstützen. Sie werden an Projekten teilnehmen, die Technologien wie LLMs, VLMs, Physical-AI, agentische Pipelines und andere umfassen.

Wir suchen jemanden, der immer an künstlicher Intelligenz denkt, der in einem schnelllebigen, sich rasant entwickelnden Bereich gedeihen kann, und der in der Lage ist, die Bemühungen zwischen Kunden, Unternehmensmarketing, Geschäftsentwicklung in der Industrie und Engineering zu koordinieren. Die Arbeit an verschiedenen Projekten und Aufgaben sowie das effiziente Multitasking bei gleichzeitiger Beibehaltung eines kundenorientierten Ansatzes sind in dieser Funktion entscheidend.

In dieser Rolle werden Sie die erste technische Anlaufstelle zwischen NVIDIA und unseren Partnern und Kunden sein. Zu Ihren Aufgaben gehört die Arbeit an Proof-of-Concept-Demonstrationen und die Leitung der Diskussion mit Entwicklern, Produktteams und wichtigen Führungskräften. Sie werden die Einführung der NVIDIA AI-Technologieplattform fördern und deren Bereitstellung in die Produktion vereinfachen. Das dynamische Engagement mit verschiedenen Rollen innerhalb von NVIDIA und mit dem NCP und anderen Partnern ist ein wesentlicher Bestandteil der Rolle des Solutions Architect und wird Ihnen Erfahrung mit einer Vielzahl von Technologien bieten.

Was Sie tun werden:

  • Direkt mit unseren NCPs und deren wichtigsten Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
  • Lösungen basierend auf NVIDIA’s und Open-Source NLP- und LLM-Technologie entwickeln und demonstrieren sowie diese in agentische Pipelines integrieren.
  • Eine eingehende Analyse und Optimierung durchführen, um die beste Leistung auf GPU-basierten Systemen sicherzustellen.
  • Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen.
  • Die Entwicklung und das Wachstum von Produktfunktionen durch Kundenfeedback und Proof-of-Concept-Bewertungen ermöglichen.
  • Branchenspezifisches Fachwissen aufbauen und ein Mitwirkender bei der Integration von NVIDIA-Technologie in AI-Cloud-Lösungen und Enterprise-Computing-Architekturen werden.

Was wir sehen möchten:

  • Exzellente verbale, schriftliche Kommunikations- und technische Präsentationsfähigkeiten in Englisch.
  • Master oder Ph.D. in Informatik, Künstlicher Intelligenz oder gleichwertiger Erfahrung.
  • 5+ Jahre Industrie- und/oder akademische Erfahrung in Bereichen, die mit maschinellem Lernen, Deep Learning und/oder Datenwissenschaft zu tun haben, mit Vorliebe für DNN-Inferenz.
  • Berufserfahrung und Kenntnisse moderner LLM-, VLM- und Diffusionsarchitekturen mit Schwerpunkt auf MoE.
  • Verständnis der wichtigsten Bibliotheken, die für DNN-Inferenz verwendet werden (z.B. TRT-LLM, Dynamo, RedHat Inference Server) sowie der Entwicklung agentischer Pipelines.
  • Begeisterung für die Zusammenarbeit mit verschiedenen Ebenen und Teams innerhalb von Organisationen (Engineering, Produkt, Vertrieb und Marketing).
  • Stark analytische und problemlösende Fähigkeiten.
  • Sie sind ein Selbststarter mit dem Drang nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.
  • Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr komplexe Projekte.

Hervorstechen aus der Menge:

  • Erfahrung mit der Inferenz sehr großer MoE-Architekturen für NLP, CV, ASR oder andere.
  • Erfahrung mit DevOps-Technologien wie Docker, Kubernetes, Singularity usw.
  • Verständnis von HPC-Systemen: Design von Rechenzentren, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und damit verbundene Design- und/oder Managementerfahrungen.

Solutions Architect, Cloud Inference Services Arbeitgeber: Nvidia

NVIDIA ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, in einem dynamischen und innovativen Umfeld zu arbeiten. Als Solutions Architect im Bereich Cloud Inference Services profitieren Sie von einer offenen Unternehmenskultur, die kontinuierliches Lernen und persönliche Entwicklung fördert. Zudem haben Sie die Chance, an wegweisenden Projekten mit modernster Technologie zu arbeiten und direkt mit führenden Partnern zusammenzuarbeiten, was Ihre Karrierechancen erheblich steigert.

Nvidia

Kontaktdaten:

Nvidia Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Solutions Architect, Cloud Inference Services erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns gemeinsam nach Möglichkeiten suchen, um dich mit Entscheidungsträgern bei NVIDIA und anderen Partnern zu vernetzen.

Tipp Nummer 2

Bereite dich auf technische Gespräche vor! Du wirst oft mit Entwicklern und Führungskräften sprechen müssen. Lass uns deine Präsentationsfähigkeiten verbessern, damit du die Vorteile von NVIDIA's AI-Technologien überzeugend rüberbringen kannst.

Tipp Nummer 3

Mach dir ein paar Proof-of-Concepts! Zeige, dass du die Technologien beherrschst, indem du eigene kleine Projekte entwickelst. Wir können dir helfen, diese Konzepte zu erstellen und sie potenziellen Arbeitgebern zu präsentieren.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! Das gibt dir die beste Chance, gesehen zu werden. Lass uns gemeinsam sicherstellen, dass dein Profil und deine Bewerbung herausstechen!

Wir glauben, dass du diese Fähigkeiten brauchst, um Solutions Architect, Cloud Inference Services mit Bravour zu bestehen

Neural Network Inference
Agentic Pipeline Development
NVIDIA NeMo Agent Toolkit
LangChain
LLamaIndex
Haystack
DNN Inference

Einige Tipps für deine Bewerbung 🫡

Mach deine Hausaufgaben:Bevor du mit deiner Bewerbung anfängst, schau dir genau an, was wir bei StudySmarter machen. Verstehe unsere Produkte und wie sie in die Welt der KI passen. Das hilft dir, deine Motivation und dein Interesse in deinem Anschreiben klar zu kommunizieren.

Sei konkret und präzise:Wenn du über deine Erfahrungen sprichst, sei spezifisch! Nenne konkrete Projekte oder Technologien, mit denen du gearbeitet hast. Das zeigt uns, dass du wirklich weißt, wovon du sprichst und wie du zur Rolle beitragen kannst.

Zeig deine Leidenschaft für KI:Wir suchen nach jemandem, der für KI brennt! Lass in deiner Bewerbung durchscheinen, warum du dich für diesen Bereich interessierst und welche Trends oder Technologien dich besonders faszinieren. Das macht einen großen Unterschied!

Bewirb dich über unsere Website:Um sicherzustellen, dass deine Bewerbung nicht im Spam landet, bewirb dich direkt über unsere Website. So können wir deine Unterlagen schnell und unkompliziert bearbeiten und du bist gleich im richtigen System!

Wie man sich auf ein Vorstellungsgespräch bei Nvidia vorbereitet

Verstehe die Technologien

Mach dich mit den spezifischen Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie NVIDIA NeMo Agent Toolkit und LangChain. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen oder Projekte hast, die diese Tools nutzen.

Bereite dich auf technische Fragen vor

Erwarte technische Fragen zu DNN-Inferenz und agentischen Pipelines. Übe, wie du komplexe Konzepte einfach erklären kannst, um deine Kommunikationsfähigkeiten zu demonstrieren. Das zeigt, dass du sowohl tiefes Wissen als auch die Fähigkeit hast, es verständlich zu vermitteln.

Kundenorientierung betonen

Da die Rolle kundenorientiert ist, bereite Beispiele vor, wie du in der Vergangenheit erfolgreich mit Kunden zusammengearbeitet hast. Zeige, dass du in der Lage bist, technische Lösungen zu entwickeln, die auf die Bedürfnisse der Kunden zugeschnitten sind.

Multitasking-Fähigkeiten hervorheben

Bereite dich darauf vor, über deine Erfahrungen im Multitasking zu sprechen. Gib konkrete Beispiele, wie du mehrere Projekte gleichzeitig verwaltet hast, ohne die Qualität zu beeinträchtigen. Dies ist besonders wichtig, da die Rolle eine enge Zusammenarbeit mit verschiedenen Teams erfordert.