Solutions Architect, Large Language Model Inference

Solutions Architect, Large Language Model Inference

München Vollzeit 60000 - 84000 € / Jahr (geschätzt) Kein Homeoffice möglich
Nvidia

Auf einen Blick

  • Aufgaben: Entwickle innovative Lösungen mit KI und NLP-Technologien für unsere Kunden.
  • Unternehmen: NVIDIA, ein führendes Unternehmen im Bereich künstliche Intelligenz und Technologie.
  • Vorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Umfeld mit großartigen Wachstumschancen und einem vielfältigen Team.
  • Warum dieser Job: Sei Teil der Revolution in der KI und arbeite an bahnbrechenden Projekten.
  • Qualifikationen: Erfahrung in ML, DL und NLP sowie starke Kommunikationsfähigkeiten.

Das prognostizierte Gehalt liegt zwischen 60000 - 84000 € pro Jahr.

NVIDIA’s Worldwide Field Operations (WWFO) team sucht einen AI-fokussierten Solution Architect mit Expertise in Machine Learning (ML), Deep Learning (DL) und Data Science Plattformen. Insbesondere wird ein Kandidat mit Verständnis für neuronale Natural Language Processing (NLP), Transformer-Architekturen und Large Language Model (LLM) Workflows gesucht. In dieser Rolle werden Sie sich erheblich auf Inferencing-Technologien konzentrieren (z.B. Modellkompression, Modellkompilierung, Modellbereitstellung).

In unserem Solutions Architecture Team arbeiten wir mit der aufregendsten Computerhardware und -software und treiben die neuesten Durchbrüche in der künstlichen Intelligenz voran. Wir benötigen Personen, die die Kundenakzeptanz der NVIDIA-Technologie ermöglichen und dauerhafte Beziehungen zu unseren Technologiepartnern entwickeln, wodurch NVIDIA ein integraler Bestandteil der Endbenutzerlösungen wird.

Wir suchen jemanden, der immer an künstlicher Intelligenz denkt, der in einem schnelllebigen, sich rasant entwickelnden Bereich gedeihen kann und der in der Lage ist, die Bemühungen zwischen Kunden, Unternehmensmarketing, Geschäftsentwicklung in der Branche und Engineering zu koordinieren.

Ein erfolgreicher Kandidat wird mit bahnbrechenden NLP- und LLM-Modellen arbeiten, die die Art und Weise, wie Menschen Technologie nutzen, grundlegend verändern. Als Solutions Architect sind Sie die erste technische Anlaufstelle zwischen NVIDIA und unseren Kunden. Ihre Aufgaben reichen von der Arbeit an Proof-of-Concept-Demonstrationen bis hin zur Pflege von Beziehungen zu wichtigen Führungskräften und Managern, um die Akzeptanz von Large Language Models zu fördern und deren Bereitstellung in die Produktion zu optimieren.

Dynamisches Engagement mit Entwicklern, wissenschaftlichen Forschern, Datenwissenschaftlern, IT-Managern und Führungskräften ist ein wesentlicher Bestandteil der Rolle des Solutions Architect und wird Ihnen Erfahrung mit einer Vielzahl von Partnern und Technologien bieten.

Was Sie tun werden:

  • Direkt mit wichtigen Kunden zusammenarbeiten, um deren Technologie zu verstehen und die besten Lösungen anzubieten.
  • Lösungen basierend auf NVIDIA’s und Open Source NLP- und LLM-Technologie entwickeln und demonstrieren.
  • Umfassende Analysen und Optimierungen durchführen, um die beste Leistung auf GPU-basierten Systemen sicherzustellen. Dies umfasst sowohl das Training als auch die Inferenz von NLP/LLM-Pipelines.
  • Mit Engineering-, Produkt- und Vertriebsteams zusammenarbeiten, um die am besten geeigneten Lösungen für Kunden zu entwickeln und zu planen.
  • Branchenexpertise aufbauen und ein Mitwirkender bei der Integration von NVIDIA-Technologie in Unternehmensarchitekturen werden.
  • Eng mit den Datenwissenschafts- und IT-Teams der Kunden zusammenarbeiten.

Was wir sehen möchten:

  • Exzellente verbale, schriftliche Kommunikations- und technische Präsentationsfähigkeiten in Englisch.
  • MS/PhD oder gleichwertige Erfahrung in Informatik, Datenwissenschaft, Elektrotechnik/Informatik, Physik, Mathematik oder anderen Ingenieurdisziplinen.
  • 5+ Jahre Berufserfahrung oder Forschungserfahrung mit Python/C++/anderer Softwareentwicklung und die Fähigkeit, in einer sich ständig weiterentwickelnden Umgebung den Fokus nicht zu verlieren.
  • Eine konsistente Erfolgsbilanz akademischer und/oder industrieller Erfahrungen in Bereichen, die mit maschinellem Lernen, tiefem Lernen und/oder Datenwissenschaft zu tun haben.
  • Berufserfahrung und Kenntnisse moderner NLP-Technologien, einschließlich eines guten Verständnisses von Transformer-Architekturen, einschließlich Prompt-Learning- und Adapter-Tuning-Techniken (z.B. IA3 oder LORA).
  • Verständnis der Schlüsselbibliotheken, die für das Training von NLP/LLM verwendet werden (NeMo Framework, DeepSpeed usw.) und für die Inferenz (z.B. TRT-LLM, Triton Inference Server, HF Optimum).
  • Sie sind begeistert davon, mit mehreren Ebenen und Teams in Organisationen (Engineering, Produkt, Vertrieb und Marketing) zu arbeiten.
  • Fähigkeit, in einem schnelllebigen Umfeld mehrere Aufgaben gleichzeitig zu bewältigen und starke analytische und problemlösende Fähigkeiten.
  • Starke Zeitmanagement- und Organisationsfähigkeiten zur Koordination mehrerer Initiativen, Prioritäten und Implementierungen neuer Technologien und Produkte in sehr komplexe Projekte.
  • Sie sind ein Selbststarter mit dem Bestreben nach Wachstum, Leidenschaft für kontinuierliches Lernen und dem Teilen von Erkenntnissen im Team.

Wege, sich von der Masse abzuheben:

  • Erfahrung mit größeren transformerbasierten Architekturen für NLP, CV, ASR oder andere.
  • Frühere Erfahrung in der Anwendung von NLP-Technologie und deren Bereitstellung in die Produktion.
  • Kenntnisse in der Verwendung von DevOps-Technologien wie Docker, Kubernetes, Singularity usw.
  • Erfahrung mit groß angelegtem verteiltem DL-Training.
  • Verständnis von HPC-Systemen: Rechenzentrumsdesign, Hochgeschwindigkeitsverbindungen InfiniBand, Cluster-Speicher und Design- und/oder Managementerfahrung im Zusammenhang mit Planung.

Wir sind ein Arbeitgeber, der Chancengleichheit bietet und Vielfalt in unserem Unternehmen schätzt. Wir diskriminieren nicht aufgrund von Rasse, Religion, Hautfarbe, nationaler Herkunft, Geschlecht, Geschlechtsidentität, sexueller Orientierung, Alter, Familienstand, Veteranenstatus oder Behinderungsstatus. Wir werden sicherstellen, dass Personen mit Behinderungen angemessene Vorkehrungen erhalten, um am Bewerbungs- oder Interviewprozess teilzunehmen, um wesentliche Arbeitsfunktionen auszuführen und um andere Vorteile und Privilegien der Beschäftigung zu erhalten.

Solutions Architect, Large Language Model Inference Arbeitgeber: Nvidia

NVIDIA ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, an der Spitze der KI-Technologie zu arbeiten und bedeutende Beiträge zur Entwicklung von Lösungen im Bereich maschinelles Lernen und natürliche Sprachverarbeitung zu leisten. Unsere dynamische Arbeitskultur fördert Innovation und Zusammenarbeit, während wir gleichzeitig individuelle Wachstumschancen und kontinuierliche Weiterbildung unterstützen. Mit einem engagierten Team und modernster Technologie in einer inspirierenden Umgebung bieten wir eine einzigartige Gelegenheit, die Zukunft der Technologie mitzugestalten.

Nvidia

Kontaktdaten:

Nvidia Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Solutions Architect, Large Language Model Inference erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der KI- und ML-Branche in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden und potenzielle Arbeitgeber auf dich aufmerksam zu machen.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe häufige Fragen zu NLP, LLMs und den Technologien, die du beherrschst. Zeige dein Wissen über aktuelle Trends und Entwicklungen in der KI, um zu zeigen, dass du am Puls der Zeit bist.

Tipp Nummer 3

Sei proaktiv und zeige Initiative! Wenn du ein Unternehmen im Auge hast, zögere nicht, direkt Kontakt aufzunehmen. Frage nach Möglichkeiten, auch wenn keine Stellen ausgeschrieben sind. Manchmal gibt es Positionen, die noch nicht veröffentlicht wurden.

Tipp Nummer 4

Nutze unsere Website für Bewerbungen! Wir haben viele spannende Stellenangebote, die perfekt zu deinem Profil passen könnten. Bewirb dich direkt über uns, um sicherzustellen, dass deine Bewerbung die richtige Aufmerksamkeit erhält.

Wir glauben, dass du diese Fähigkeiten brauchst, um Solutions Architect, Large Language Model Inference mit Bravour zu bestehen

Machine Learning (ML)
Deep Learning (DL)
Data Science
Natural Language Processing (NLP)
Transformer-Architekturen
Large Language Model (LLM) Workflows
Modellkompression

Einige Tipps für deine Bewerbung 🫡

Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeige deine Persönlichkeit. Wir wollen wissen, wer du wirklich bist und was dich motiviert, in unserem Team zu arbeiten.

Betone deine Erfahrungen:Stelle sicher, dass du relevante Erfahrungen und Fähigkeiten hervorhebst, die zu der Stelle passen. Zeige uns, wie deine Kenntnisse in Machine Learning und NLP dich zu einem idealen Kandidaten machen.

Mach es klar und prägnant:Halte deine Bewerbung übersichtlich und auf den Punkt. Vermeide lange Sätze und komplizierte Formulierungen. Wir schätzen klare Kommunikation, besonders in technischen Rollen!

Bewirb dich über unsere Website:Vergiss nicht, dich direkt über unsere Website zu bewerben! So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnell bearbeiten können.

Wie man sich auf ein Vorstellungsgespräch bei Nvidia vorbereitet

Verstehe die Technologie

Mach dich mit den neuesten Entwicklungen in der KI, insbesondere im Bereich NLP und LLMs, vertraut. Zeige während des Interviews, dass du die Funktionsweise von Transformer-Architekturen und deren Anwendung verstehst. Das wird dir helfen, deine technische Expertise zu demonstrieren.

Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, die du in der Vergangenheit hattest, und wie du dabei Herausforderungen gemeistert hast. Sei bereit, diese Beispiele zu teilen, um deine Problemlösungsfähigkeiten und dein technisches Wissen zu untermauern.

Kommunikation ist der Schlüssel

Übe deine Kommunikationsfähigkeiten, sowohl verbal als auch schriftlich. Du wirst oft mit verschiedenen Stakeholdern interagieren, also stelle sicher, dass du komplexe technische Konzepte einfach und klar erklären kannst. Das zeigt, dass du nicht nur technisch versiert bist, sondern auch gut im Umgang mit Menschen.

Zeige deine Leidenschaft für KI

Lass deine Begeisterung für künstliche Intelligenz und maschinelles Lernen durchscheinen. Sprich über aktuelle Trends, die dich interessieren, und wie du dich kontinuierlich weiterbildest. Arbeitgeber suchen nach Kandidaten, die nicht nur die Anforderungen erfüllen, sondern auch eine echte Leidenschaft für das Feld haben.