Solutions Architect, Cloud Inference Services
Solutions Architect, Cloud Inference Services

Solutions Architect, Cloud Inference Services

Zürich Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
NVIDIA Corporation

Auf einen Blick

  • Aufgaben: Entwickle innovative AI-Lösungen und arbeite direkt mit führenden Cloud-Partnern.
  • Arbeitgeber: NVIDIA, ein Vorreiter im Bereich beschleunigtes Computing und KI.
  • Mitarbeitervorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Andere Informationen: Dynamisches Umfeld mit hervorragenden Wachstumschancen und interdisziplinärer Zusammenarbeit.
  • Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten mit modernster Technologie.
  • Gewünschte Qualifikationen: Master oder Ph.D. in Informatik oder verwandten Bereichen, 5+ Jahre Erfahrung in maschinellem Lernen.

Das voraussichtliche Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

NVIDIA’s Worldwide Field Operations (WWFO) Team sucht einen auf KI fokussierten Solutions Architect mit Expertise in der Inferenz von neuronalen Netzwerken und der Entwicklung/Betrieb von agentischen Pipelines. Ein Kandidat sollte ein Verständnis für die Inferenz von groß angelegten DNN sowie das End-to-End-Design von agentischen Utilities haben, unter Verwendung von Tools wie NVIDIA NeMo Agent Toolkit, LangChain, LLamaIndex, Haystack usw.

Als Solutions Architect in unserem Team werden Sie eine kundenorientierte technische Rolle übernehmen, um einem oder mehreren führenden NVIDIA Cloud Partnern (NCPs) zu helfen, den NVIDIA AI-Stack und andere Open-Source-GPU-beschleunigte Stacks zu integrieren und ihnen zu helfen, eine E2E-Lösung für KI-Dienste von Training bis Post-Training und Inferenz-Workloads zu entwickeln, bereitzustellen und zu unterstützen.

Sie werden an Projekten teilnehmen, die Technologien wie LLMs, VLMs, Physical-AI, agentische Pipelines und andere umfassen. Wir suchen jemanden, der immer an künstliche Intelligenz denkt, der in einem schnelllebigen, sich schnell entwickelnden Bereich gedeihen kann und der in der Lage ist, die Bemühungen zwischen Kunden, Unternehmensmarketing, Geschäftsentwicklung in der Industrie und Engineering zu koordinieren. Die Arbeit an verschiedenen Projekten und Aufgaben sowie das effiziente Multitasking bei gleichzeitiger Beibehaltung eines kundenorientierten Ansatzes sind in dieser Funktion entscheidend.

In dieser Rolle werden Sie die erste technische Anlaufstelle zwischen NVIDIA und unseren Partnern und Kunden sein. Zu Ihren Aufgaben gehört die Arbeit an Proof-of-Concept-Demonstrationen und die Leitung der Diskussion mit Entwicklern, Produktteams und wichtigen Führungskräften. Sie werden die Einführung der NVIDIA AI-Technologieplattform fördern und deren Bereitstellung in der Produktion vereinfachen. Die dynamische Interaktion mit verschiedenen Rollen innerhalb von NVIDIA und mit dem NCP und anderen Partnern ist ein wesentlicher Bestandteil der Rolle des Solutions Architect und wird Ihnen Erfahrung mit einer Vielzahl von Technologien bieten.

Was Sie tun werden:

  • Direkt mit unseren NCPs und deren wichtigsten Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
  • Lösungen basierend auf NVIDIA’s und Open-Source-NLP- und LLM-Technologie entwickeln und demonstrieren sowie diese in agentische Pipelines integrieren.
  • Umfassende Analysen und Optimierungen durchführen, um die beste Leistung auf GPU-basierten Systemen sicherzustellen. Dies umfasst sowohl die Inferenzoptimierung als auch die Optimierung von End-to-End-agentischen Pipelines.
  • Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen. Die Entwicklung und das Wachstum von Produktmerkmalen durch Kundenfeedback und Proof-of-Concept-Bewertungen ermöglichen.
  • Branchenspezifisches Fachwissen aufbauen und ein Mitwirkender bei der Integration von NVIDIA-Technologie in KI-Cloud-Lösungen und Unternehmensarchitekturen werden.

Was wir sehen müssen:

  • Ausgezeichnete mündliche, schriftliche Kommunikations- und technische Präsentationsfähigkeiten in Englisch.
  • Master- oder Doktortitel in Informatik, künstlicher Intelligenz oder gleichwertige Erfahrung.
  • 5+ Jahre Industrie- und/oder akademische Erfahrung in Bereichen, die mit maschinellem Lernen, tiefem Lernen und/oder Datenwissenschaft zu tun haben, mit Vorliebe für DNN-Inferenz.
  • Berufserfahrung und Kenntnisse moderner LLM-, VLM- und Diffusionsarchitekturen mit Schwerpunkt auf MoE.
  • Verständnis der wichtigsten Bibliotheken, die für DNN-Inferenz verwendet werden (z.B. TRT-LLM, Dynamo, RedHat Inference Server) sowie der Entwicklung agentischer Pipelines.
  • Begeisterung für die Zusammenarbeit mit verschiedenen Ebenen und Teams innerhalb von Organisationen (Engineering, Produkt, Vertrieb und Marketing).
  • Stark ausgeprägte analytische und problemlösende Fähigkeiten. Sie sind ein Selbststarter mit dem Drang nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.
  • Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr anspruchsvollen Projekten.

Wie Sie sich von der Masse abheben können:

  • Erfahrung mit der Inferenz sehr großer MoE-Architekturen für NLP, CV, ASR oder andere.
  • Erfahrung mit DevOps-Technologien wie Docker, Kubernetes, Singularity usw.
  • Verständnis von HPC-Systemen: Rechenzentrumsdesign, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und damit verbundene Design- und/oder Managementerfahrungen.

NVIDIA hat beschleunigtes Rechnen revolutioniert. Heute treibt unsere KI-Infrastruktur globale Intelligenz an und transformiert jede Branche.

Solutions Architect, Cloud Inference Services Arbeitgeber: NVIDIA Corporation

NVIDIA ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern in Zürich, Amsterdam und München eine dynamische Arbeitsumgebung bietet, in der Innovation und Zusammenarbeit im Vordergrund stehen. Mit einem starken Fokus auf künstliche Intelligenz und modernste Technologien ermöglicht NVIDIA seinen Mitarbeitern, an spannenden Projekten zu arbeiten und sich kontinuierlich weiterzuentwickeln. Die Unternehmenskultur fördert Kreativität und Teamarbeit, während umfassende Schulungs- und Entwicklungsmöglichkeiten sicherstellen, dass jeder Mitarbeiter sein volles Potenzial entfalten kann.
NVIDIA Corporation

Kontaktperson:

NVIDIA Corporation HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Solutions Architect, Cloud Inference Services

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns gemeinsam nach Möglichkeiten suchen, um dich mit Entscheidungsträgern und anderen Fachleuten zu vernetzen.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe, deine Kenntnisse über neuronale Netzwerke und Agenten-Pipelines klar und verständlich zu präsentieren. Wir können dir helfen, die besten Ressourcen zu finden, um dich optimal vorzubereiten.

Tipp Nummer 3

Sei proaktiv und zeige Initiative! Wenn du eine interessante Stelle siehst, bewirb dich direkt über unsere Website. Lass uns gemeinsam sicherstellen, dass deine Bewerbung heraussticht und du die Aufmerksamkeit der Recruiter auf dich ziehst.

Tipp Nummer 4

Bleib flexibel und offen für verschiedene Rollen! Manchmal kann eine Position, die nicht genau deinem Traumjob entspricht, dennoch wertvolle Erfahrungen bieten. Lass uns zusammen Strategien entwickeln, um das Beste aus jeder Gelegenheit herauszuholen.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Solutions Architect, Cloud Inference Services

Neural Network Inference
Agentic Pipeline Development
NVIDIA NeMo Agent Toolkit
LangChain
LLamaIndex
Haystack
DNN Inference Optimization
Machine Learning
Deep Learning
Data Science
Modern LLM and VLM Architectures
Analytical Skills
Problem-Solving Skills
Technical Presentation Skills
Time Management

Tipps für deine Bewerbung 🫡

Sei authentisch!: Wenn du deine Bewerbung schreibst, sei einfach du selbst. Zeig uns, wer du bist und was dich motiviert. Wir suchen nach echten Persönlichkeiten, die Leidenschaft für KI und Technologie haben!

Mach es klar und präzise!: Halte deine Bewerbung übersichtlich und auf den Punkt. Verwende klare Sprache und vermeide Fachjargon, wenn es nicht nötig ist. Wir wollen schnell verstehen, was du kannst und wie du uns helfen kannst.

Betone deine Erfahrungen!: Erzähl uns von deinen bisherigen Projekten und Erfahrungen, die relevant für die Rolle sind. Zeig uns, wie du mit Technologien wie DNN-Inferenz oder agentischen Pipelines gearbeitet hast. Das macht einen großen Unterschied!

Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie an die richtige Stelle gelangt und du alle notwendigen Informationen bereitstellst. Lass uns gemeinsam durchstarten!

Wie du dich auf ein Vorstellungsgespräch bei NVIDIA Corporation vorbereitest

Verstehe die Technologien

Mach dich mit den spezifischen Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie NVIDIA NeMo Agent Toolkit und LangChain. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen oder Projekte hast, die diese Technologien nutzen.

Bereite dich auf technische Fragen vor

Erwarte technische Fragen zu DNN-Inferenz und agentischen Pipelines. Übe, wie du komplexe Konzepte einfach erklären kannst, um deine Kommunikationsfähigkeiten zu demonstrieren. Das wird dir helfen, das Vertrauen der Interviewer zu gewinnen.

Kundenorientierung zeigen

Da die Rolle kundenorientiert ist, bereite Beispiele vor, wie du in der Vergangenheit erfolgreich mit Kunden zusammengearbeitet hast. Betone deine Fähigkeit, technische Lösungen an die Bedürfnisse der Kunden anzupassen und wie du Feedback in Produktentwicklungen integriert hast.

Multitasking-Fähigkeiten betonen

In dieser Position musst du mehrere Projekte gleichzeitig managen. Bereite konkrete Beispiele vor, die zeigen, wie du in der Vergangenheit erfolgreich multitaskingfähig warst, ohne die Qualität deiner Arbeit zu beeinträchtigen. Das zeigt deine Organisationstalente und dein Zeitmanagement.

Solutions Architect, Cloud Inference Services
NVIDIA Corporation
Standort: Zürich
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>