Auf einen Blick
- Aufgaben: Arbeite direkt mit Kunden, um die besten KI-Lösungen zu entwickeln und große Inferenzpipelines zu optimieren.
- Arbeitgeber: NVIDIA ist ein führendes Unternehmen im Bereich KI und Computerhardware mit innovativen Technologien.
- Mitarbeitervorteile: Biete wettbewerbsfähige Gehälter, umfassende Sozialleistungen und ein diverses Arbeitsumfeld.
- Warum dieser Job: Sei Teil von bahnbrechenden Entwicklungen in der KI und arbeite mit den neuesten Technologien.
- Gewünschte Qualifikationen: Mindestens 5 Jahre Erfahrung in Python/C++ und fundierte Kenntnisse in modernen NLP-Architekturen.
- Andere Informationen: NVIDIA fördert Vielfalt und Chancengleichheit in der Belegschaft.
Das voraussichtliche Gehalt liegt zwischen 54000 - 84000 € pro Jahr.
Join to apply for the Deep Learning Solutions Architect – Large Scale Inference Optimization role at NVIDIA1 day ago Be among the first 25 applicantsJoin to apply for the Deep Learning Solutions Architect – Large Scale Inference Optimization role at NVIDIAGet AI-powered advice on this job and more exclusive features.NVIDIA’s Worldwide Field Operations (WWFO) team is seeking a Solution Architect with a strong focus on Deep Learning and deep understanding of neural network inference. With the introduction of NVIDIA Grace CPUs and Grace-Hopper / Grace-Blackwell systems, the CPU has become more tightly integrated into the AI platform than ever before. Innovations such as Chip-to-Chip NVLINK and the significant expansion of the NVLINK domain have enabled a wide range of new neural network architectures and approaches to training and inference.The ideal candidate will be proficient using tools such as TRT-LLM, vLLM, SGLang or similar, and have strong systems knowledge, enabling customers to fully use the capabilities of the new GB200 NVL72 systems (for example help customers embrace disaggregated inference, work on efficient KV cache offloading or help with inference of new architectures like hybrid or diffusion models). Solutions Architects work with the most exciting computing hardware and software, driving the latest breakthroughs in artificial intelligence! We need individuals who can enable customer productivity and develop lasting relationships with our technology partners, making NVIDIA an integral part of end-user solutions. We are looking for someone always passionate about artificial intelligence, someone who can maintain understanding of a fast paced field, someone able to coordinate efforts between corporate marketing, industry business development and engineering.What You Will Be DoingWork directly with key customers to understand their technology and provide the best AI solutions.Perform in-depth analysis and optimization to ensure the best performance on GPU architecture systems (in particular Grace/ARM based systems). This includes support in optimization of large scale inference pipelines.Partner with Engineering, Product and Sales teams to develop, plan best suitable solutions for customers. Enable development and growth of product features through customer feedback and proof-of-concept evaluations.What We Need To SeeExcellent verbal, written communication, and technical presentation skills in Website or equivalent experience in Computer Science, Data Science, Electrical/Computer Engineering, Physics, Mathematics, other Engineering fields.5+ years work or research experience with Python/ C++ / other software developmentWork experience and knowledge of modern NLP including good understanding of transformer, state space, diffusion, MOE model architectures. This can include either expertise in training or optimization/compression/operation of DNNs.Understanding of key libraries used for NLP/LLM training (such as Megatron-LN, NeMo, DeepSpeed etc.) and/or deployment (e.g. TensorRT-LLM, vLLM, Triton Inference Server).Person excited to work with multiple levels and teams across organizations (Engineering, Product, Sales and Marketing team). Capable of working in a constantly evolving environment without losing focus.Self-starter with demeanor for growth, passion for continuous learning and sharing findings across the team.Ways To Stand Out From The CrowdExperience running/debugging large scale distributed DL training or inference.Proven track record in optimizing neural network training performance and robustness, including implementing asynchronous checkpointing and optimizing CUDA kernels.Understanding of HPC systems: data center design, high speed interconnect InfiniBand, Cluster Storage and Scheduling related design and/or management experience.Widely considered to be one of the technology world’s most desirable employers, NVIDIA offers highly competitive salaries and a comprehensive benefits package. As you plan your future, see what we can offer to you and your family Website is committed to fostering a diverse work environment and proud to be an equal opportunity employer. As we highly value diversity in our current and future employees, we do not discriminate (including in our hiring and promotion practices) on the basis of race, religion, color, national origin, gender, gender expression, sexual orientation, age, marital status, veteran status, disability status or any other characteristic protected by law.JR1999831Seniority levelSeniority levelMid-Senior levelEmployment typeEmployment typeFull-timeJob functionIndustriesComputer Hardware Manufacturing, Software Development, and Computers and Electronics ManufacturingReferrals increase your chances of interviewing at NVIDIA by 2xGet notified about new Deep Learning Specialist jobs in Germany.Deep Learning Solutions Architect – Distributed TrainingWe’re unlocking community knowledge in a new way. Experts add insights directly into each article, started with the help of AI. #J-18808-Ljbffr
Deep Learning Solutions Architect – Large Scale Inference Optimization Arbeitgeber: Nvidia

Kontaktperson:
Nvidia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Deep Learning Solutions Architect – Large Scale Inference Optimization
✨Netzwerken mit Fachleuten
Nutze Plattformen wie LinkedIn, um dich mit anderen Fachleuten im Bereich Deep Learning und KI zu vernetzen. Suche gezielt nach Personen, die bei NVIDIA oder in ähnlichen Unternehmen arbeiten, und versuche, wertvolle Kontakte zu knüpfen.
✨Veranstaltungen und Meetups besuchen
Nimm an Konferenzen, Webinaren oder Meetups teil, die sich auf Deep Learning und KI konzentrieren. Diese Veranstaltungen bieten nicht nur wertvolle Informationen, sondern auch die Möglichkeit, direkt mit Vertretern von NVIDIA in Kontakt zu treten.
✨Projekte und Portfolios erstellen
Arbeite an eigenen Projekten, die deine Fähigkeiten in der Optimierung von Deep Learning Modellen demonstrieren. Ein gut strukturiertes Portfolio kann dir helfen, dich von anderen Bewerbern abzuheben und deine praktischen Kenntnisse zu zeigen.
✨Aktuelle Trends verfolgen
Bleibe über die neuesten Entwicklungen im Bereich Deep Learning und KI informiert. Verfolge relevante Blogs, Podcasts und wissenschaftliche Veröffentlichungen, um dein Wissen zu erweitern und bei Gesprächen mit potenziellen Arbeitgebern kompetent aufzutreten.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Deep Learning Solutions Architect – Large Scale Inference Optimization
Tipps für deine Bewerbung 🫡
Verstehe die Anforderungen: Lies die Stellenbeschreibung sorgfältig durch und achte auf spezifische Anforderungen wie Kenntnisse in Python, C++ und modernen NLP-Architekturen. Stelle sicher, dass du diese Punkte in deinem Lebenslauf und Anschreiben ansprichst.
Hebe relevante Erfahrungen hervor: Betone deine Erfahrungen mit großen, verteilten Deep Learning Trainings oder Inferenzsystemen. Wenn du bereits an ähnlichen Projekten gearbeitet hast, beschreibe diese detailliert, um deine Eignung zu unterstreichen.
Technische Fähigkeiten betonen: Stelle sicher, dass du deine technischen Fähigkeiten klar darstellst, insbesondere in Bezug auf die verwendeten Bibliotheken für NLP/LLM-Training und -Bereitstellung. Nenne spezifische Tools wie TensorRT-LLM oder Triton Inference Server, mit denen du vertraut bist.
Motivationsschreiben: Verfasse ein überzeugendes Motivationsschreiben, in dem du deine Leidenschaft für künstliche Intelligenz und deine Fähigkeit, in einem sich schnell verändernden Umfeld zu arbeiten, zum Ausdruck bringst. Zeige, wie du zur Entwicklung und zum Wachstum von Produktmerkmalen beitragen kannst.
Wie du dich auf ein Vorstellungsgespräch bei Nvidia vorbereitest
✨Verstehe die Technologien von NVIDIA
Mach dich mit den neuesten Technologien und Produkten von NVIDIA vertraut, insbesondere mit den Grace CPUs und den NVLINK-Architekturen. Zeige im Interview, dass du die Bedeutung dieser Technologien für Deep Learning und Inferenzoptimierung verstehst.
✨Bereite dich auf technische Fragen vor
Erwarte technische Fragen zu Python, C++ und modernen NLP-Architekturen. Sei bereit, deine Erfahrungen mit Tools wie TensorRT-LLM oder Megatron-LN zu erläutern und konkrete Beispiele für deine Optimierungsprojekte zu geben.
✨Kommunikationsfähigkeiten betonen
Da die Rolle viel Kundenkontakt erfordert, solltest du deine Kommunikationsfähigkeiten hervorheben. Übe, komplexe technische Konzepte einfach und klar zu erklären, um zu zeigen, dass du in der Lage bist, mit verschiedenen Stakeholdern zu kommunizieren.
✨Zeige deine Leidenschaft für KI
NVIDIA sucht nach Kandidaten, die eine echte Leidenschaft für künstliche Intelligenz haben. Teile im Interview deine Gedanken über aktuelle Trends in der KI und wie du dich kontinuierlich weiterbildest, um in diesem sich schnell entwickelnden Bereich relevant zu bleiben.