Solutions Architect, Large Language Model Inference

Solutions Architect, Large Language Model Inference

Vollzeit 60000 - 84000 € / Jahr (geschätzt) Kein Homeoffice möglich
Nvidia

Auf einen Blick

  • Aufgaben: Entwickle innovative Lösungen mit KI und NLP-Technologien für unsere Kunden.
  • Unternehmen: NVIDIA, ein führendes Unternehmen im Bereich künstliche Intelligenz und Technologie.
  • Vorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Umfeld mit großartigen Wachstumschancen und einem vielfältigen Team.
  • Warum dieser Job: Sei Teil der Revolution in der KI und arbeite an bahnbrechenden Projekten.
  • Qualifikationen: Erfahrung in ML, DL und NLP sowie starke Kommunikationsfähigkeiten.

Das prognostizierte Gehalt liegt zwischen 60000 - 84000 € pro Jahr.

NVIDIA’s Worldwide Field Operations (WWFO) team sucht einen AI-fokussierten Solution Architect mit Expertise in Machine Learning (ML), Deep Learning (DL) und Data Science Plattformen. Insbesondere wird ein Kandidat mit Verständnis für neuronale Natural Language Processing (NLP), Transformer-Architekturen und Large Language Model (LLM) Workflows gesucht. In dieser Rolle werden Sie sich erheblich auf Inferencing-Technologie konzentrieren (z.B. Modellkompression, Modellkompilierung, Modellbereitstellung).

In unserem Solutions Architecture Team arbeiten wir mit der aufregendsten Computerhardware und -software und treiben die neuesten Durchbrüche in der künstlichen Intelligenz voran. Wir benötigen Personen, die die Kundenakzeptanz der NVIDIA-Technologie ermöglichen und dauerhafte Beziehungen zu unseren Technologiepartnern entwickeln, wodurch NVIDIA ein integraler Bestandteil der Endbenutzerlösungen wird.

Ein erfolgreicher Kandidat wird mit bahnbrechenden NLP- und LLM-Modellen arbeiten, die die Art und Weise, wie Menschen Technologie nutzen, grundlegend verändern. Als Solutions Architect sind Sie die erste technische Anlaufstelle zwischen NVIDIA und unseren Kunden. Ihre Aufgaben reichen von der Arbeit an Proof-of-Concept-Demonstrationen bis hin zur Pflege von Beziehungen zu wichtigen Führungskräften und Managern, um die Akzeptanz von Large Language Models zu fördern und deren Bereitstellung in die Produktion zu optimieren.

Was Sie tun werden:

  • Direkt mit wichtigen Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
  • Lösungen basierend auf NVIDIA’s und Open Source NLP- und LLM-Technologie entwickeln und demonstrieren.
  • Umfassende Analysen und Optimierungen durchführen, um die beste Leistung auf GPU-basierten Systemen sicherzustellen. Dies umfasst sowohl das Training als auch die Inferenz von NLP/LLM-Pipelines.
  • Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen.
  • Branchenspezifisches Fachwissen aufbauen und ein Mitwirkender bei der Integration von NVIDIA-Technologie in Unternehmensarchitekturen werden.
  • Eng mit den Datenwissenschafts- und IT-Teams des Kunden zusammenarbeiten.

Was wir sehen möchten:

  • Exzellente verbale, schriftliche Kommunikations- und technische Präsentationsfähigkeiten in Englisch.
  • MS/PhD oder gleichwertige Erfahrung in Informatik, Datenwissenschaft, Elektrotechnik/Informatik, Physik, Mathematik oder anderen Ingenieurdisziplinen.
  • 5+ Jahre Arbeits- oder Forschungserfahrung mit Python/C++/anderer Softwareentwicklung und die Fähigkeit, in einer sich ständig weiterentwickelnden Umgebung den Fokus nicht zu verlieren.
  • Eine konsistente Erfolgsbilanz akademischer und/oder industrieller Erfahrungen in Bereichen, die mit maschinellem Lernen, tiefem Lernen und/oder Datenwissenschaft zu tun haben.
  • Berufserfahrung und Kenntnisse moderner NLP-Technologien, einschließlich eines guten Verständnisses von Transformer-Architekturen, einschließlich Prompt-Learning- und Adapter-Tuning-Techniken (z.B. IA3 oder LORA).
  • Verständnis der wichtigsten Bibliotheken, die für das Training von NLP/LLM verwendet werden (NeMo Framework, DeepSpeed usw.) und Inferenz (z.B. TRT-LLM, Triton Inference Server, HF Optimum).
  • Sie sind begeistert davon, mit mehreren Ebenen und Teams innerhalb von Organisationen (Engineering, Produkt, Vertrieb und Marketing) zu arbeiten.
  • Fähigkeit, in einem schnelllebigen Umfeld mehrere Aufgaben gleichzeitig zu bewältigen und starke analytische und problemlösende Fähigkeiten.
  • Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr komplexe Projekte.
  • Sie sind ein Selbststarter mit dem Bestreben nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.

Wege, sich von der Masse abzuheben:

  • Erfahrung mit größeren transformerbasierten Architekturen für NLP, CV, ASR oder andere.
  • Frühere Erfahrung in der Anwendung von NLP-Technologie und deren Bereitstellung in die Produktion.
  • Kenntnisse in der Verwendung von DevOps-Technologien wie Docker, Kubernetes, Singularity usw.
  • Erfahrung mit groß angelegtem verteiltem DL-Training.
  • Verständnis von HPC-Systemen: Rechenzentrumsdesign, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und Design- und/oder Managementerfahrung im Zusammenhang mit Planung.

Wir sind ein Arbeitgeber, der Chancengleichheit bietet und Vielfalt in unserem Unternehmen schätzt. Wir diskriminieren nicht aufgrund von Rasse, Religion, Hautfarbe, nationaler Herkunft, Geschlecht, Geschlechtsidentität, sexueller Orientierung, Alter, Familienstand, Veteranenstatus oder Behinderungsstatus. Wir werden sicherstellen, dass Personen mit Behinderungen angemessene Vorkehrungen erhalten, um am Bewerbungs- oder Interviewprozess teilzunehmen, wesentliche Arbeitsfunktionen auszuführen und andere Vorteile und Privilegien der Beschäftigung zu erhalten.

Solutions Architect, Large Language Model Inference Arbeitgeber: Nvidia

NVIDIA ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, an der Spitze der KI-Technologie zu arbeiten und bedeutende Beiträge zur Entwicklung von Lösungen im Bereich maschinelles Lernen und natürliche Sprachverarbeitung zu leisten. Mit einem dynamischen Arbeitsumfeld, das Innovation und Zusammenarbeit fördert, sowie umfangreichen Möglichkeiten zur beruflichen Weiterentwicklung, ist NVIDIA der ideale Ort für Fachkräfte, die in einem schnelllebigen und sich ständig weiterentwickelnden Bereich tätig sein möchten. Zudem legt das Unternehmen großen Wert auf Vielfalt und Inklusion, was eine positive und unterstützende Unternehmenskultur schafft.

Nvidia

Kontaktdaten:

Nvidia Recruiting-Team

Wir glauben, dass du diese Fähigkeiten brauchst, um Solutions Architect, Large Language Model Inference mit Bravour zu bestehen

Machine Learning (ML)
Deep Learning (DL)
Data Science
Natural Language Processing (NLP)
Transformer-Architekturen
Large Language Model (LLM) Workflows
Modellkompression