Solutions Architect, Retrieval Augmented Generation

Solutions Architect, Retrieval Augmented Generation

Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Homeoffice möglich
Nvidia

Auf einen Blick

  • Aufgaben: Arbeite mit bahnbrechenden LLM-Modellen und entwickle innovative Lösungen für Kunden.
  • Unternehmen: NVIDIA, ein führendes Unternehmen in der Technologiebranche mit einem dynamischen Team.
  • Vorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Wachse in einem sich ständig weiterentwickelnden Umfeld mit großartigen Karrierechancen.
  • Warum dieser Job: Gestalte die Zukunft der Technologie und arbeite an spannenden Projekten mit führenden Experten.
  • Qualifikationen: MS/PhD in relevanten Bereichen und Erfahrung in Softwareentwicklung.

Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

Ein erfolgreicher Kandidat wird mit bahnbrechenden LLM-Modellen arbeiten, die die Art und Weise, wie Menschen Technologie nutzen, grundlegend verändern! Sie werden die erste technische Anlaufstelle zwischen NVIDIA und unseren Kunden sein. Ihre Aufgaben reichen von der Arbeit an Proof-of-Concept-Demonstrationen bis hin zur Pflege von Beziehungen zu wichtigen Führungskräften und Managern, um die Einführung von RAG-Pipelines zu fördern und deren Bereitstellung in der Produktion zu optimieren. Die dynamische Interaktion mit Entwicklern, wissenschaftlichen Forschern, Datenwissenschaftlern, IT-Managern und Führungskräften ist ein wesentlicher Bestandteil der Rolle des Solutions Architect und bietet Ihnen Erfahrung mit einer Vielzahl von Partnern und Technologien.

Was Sie tun werden:

  • Direkt mit wichtigen Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
  • Lösungen basierend auf NVIDIA’s und Open Source LLM-Technologie entwickeln und demonstrieren.
  • Umfassende Analysen und Optimierungen von RAG-Pipeline-Komponenten durchführen, um die beste Leistung auf GPU-Systemen sicherzustellen.
  • Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen.
  • Entwicklung und Wachstum von Produktfunktionen durch Kundenfeedback und Proof-of-Concept-Bewertungen ermöglichen.
  • Branchenspezifisches Fachwissen aufbauen und einen Beitrag zur Integration von NVIDIA-Technologie in Unternehmensarchitekturen leisten.

Was wir sehen möchten:

  • MS/PhD oder gleichwertige Erfahrung in Informatik, Datenwissenschaft, Elektrotechnik/Informatik, Physik, Mathematik oder anderen Ingenieurdisziplinen.
  • Ausgezeichnete mündliche und schriftliche Kommunikationsfähigkeiten sowie technische Präsentationsfähigkeiten in Englisch.
  • 6+ Jahre Berufserfahrung oder Forschungserfahrung mit Python/C++/anderer Softwareentwicklung.
  • Akademische und/oder praktische Erfahrung in Bereichen, die mit maschinellem Lernen, Deep Learning und/oder Datenwissenschaft zu tun haben.
  • Berufserfahrung in der Bereitstellung und Wartung von KI-basierten Systemen sowie Kenntnisse moderner DevOps/MLOps-Tools und -Standards.
  • Verständnis der wichtigsten Bibliotheken, die für die Entwicklung von LLM und RAG verwendet werden: für NLP-Modellentwicklung (z.B. NeMo, DeepSpeed, HuggingFace), für Bereitstellung (z.B. TensorRT-LLM, Triton Inference Server) für Informationsabruf (z.B. RAPIDS, Milvus, Pinecone, Elastic Search).
  • Sie sind begeistert davon, mit verschiedenen Ebenen und Teams in Organisationen (Engineering, Produkt, Vertrieb und Marketing) zu arbeiten und in einem sich ständig weiterentwickelnden Umfeld den Fokus nicht zu verlieren.
  • Fähigkeit, in einem schnelllebigen Umfeld mehrere Aufgaben gleichzeitig zu bewältigen, und angetrieben von starken analytischen und problemlösenden Fähigkeiten.
  • Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr komplexe Projekte.
  • Sie sind ein Selbststarter mit dem Wunsch nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.

Wie Sie sich von der Masse abheben können:

  • Erfahrung in der Arbeit mit größeren transformerbasierten Architekturen für NLP, CV, ASR oder andere.
  • Erfahrung in der Optimierung von DNN-Architekturen mit Tools wie TRT/TRT-LLM oder Modellkompression.
  • Verständnis von AI/HPC-Systemen: Design von Rechenzentren, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und damit verbundene Design- und/oder Verwaltungserfahrungen.

Solutions Architect, Retrieval Augmented Generation Arbeitgeber: Nvidia

NVIDIA ist ein herausragender Arbeitgeber, der innovative Technologien und eine dynamische Arbeitsumgebung bietet. Als Solutions Architect im Bereich Retrieval Augmented Generation haben Sie die Möglichkeit, mit bahnbrechenden LLM-Modellen zu arbeiten und direkt mit führenden Kunden zusammenzuarbeiten, um deren technologische Herausforderungen zu meistern. Die Unternehmenskultur fördert kontinuierliches Lernen und persönliche Entwicklung, während die Zusammenarbeit mit verschiedenen Teams Ihnen wertvolle Einblicke in die neuesten Entwicklungen in der KI- und Datenwissenschaft ermöglicht.

Nvidia

Kontaktdaten:

Nvidia Recruiting-Team

Wir glauben, dass du diese Fähigkeiten brauchst, um Solutions Architect, Retrieval Augmented Generation mit Bravour zu bestehen

Technische Expertise
Kommunikationsfähigkeiten
Python
C++
Maschinenlernen
Deep Learning
Datenwissenschaft