Auf einen Blick
- Aufgaben: Entwickle KI-Lösungen und optimiere Inferenzpipelines für modernste Systeme.
- Arbeitgeber: NVIDIA, ein führendes Unternehmen in der KI-Technologie mit innovativer Kultur.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, umfassende Sozialleistungen und Möglichkeiten zur beruflichen Weiterentwicklung.
- Warum dieser Job: Arbeite an bahnbrechenden KI-Technologien und beeinflusse die Zukunft der Inferenzoptimierung.
- Gewünschte Qualifikationen: Erfahrung in Softwareentwicklung und tiefes Verständnis von neuronalen Netzwerken.
- Andere Informationen: Dynamisches Umfeld mit hervorragenden Karrierechancen und einem Fokus auf Vielfalt.
Das voraussichtliche Gehalt liegt zwischen 72000 - 84000 € pro Jahr.
Deep Learning Solutions Architect – Inference Optimization
Be among the first 25 applicants. Get AI-powered advice on this job and more exclusive features.
NVIDIA’s Worldwide Field Operations (WWFO) team is seeking a Solution Architect with a deep understanding of neural network inference. As our customers adopt increasingly complex inference pipelines on state‑of‑the‑art infrastructure, there is a growing need for experts who can guide the integration of advanced inference techniques such as speculative decoding, request scheduler optimizations or FP4 quantization. The ideal candidate will be proficient using tools such as TRT LLM, vLLM, SGLang or similar, and have strong systems knowledge, enabling customers to fully use the capabilities of the new GB300 NVL72 systems (for example work on efficient KV cache offloading or help with inference of new architectures like hybrid or diffusion models, or architect the pre‑ and post‑processing pipelines).
Solutions Architects work with the most exciting computing hardware and software, driving the latest breakthroughs in artificial intelligence! We need individuals who can enable customer productivity and develop lasting relationships with our technology partners, making NVIDIA an integral part of end‑user solutions. We are looking for someone always passionate about artificial intelligence, someone who can maintain understanding of a fast‑paced field, someone able to coordinate efforts between corporate marketing, industry business development and engineering. Solutions Architects are the first line of technical expertise between NVIDIA and our customers. Your duties will vary from working on proof‑of‑concept demonstrations, to driving relationships with key executives and managers in order to promote adoption of NVIDIA based AI technology. Engaging with developers, scientific researchers, data scientists, IT managers and senior leaders is a significant part of the Solutions Architect role.
What You Will Be Doing
- Work directly with key customers to understand their technology and provide the best AI solutions.
- Perform in‑depth analysis and optimization to ensure the best performance on GPU architecture systems (in particular Grace/ARM based systems). This includes support in optimization of large‑scale inference pipelines.
- Partner with Engineering, Product and Sales teams to develop, plan best suitable solutions for customers. Enable development and growth of product features through customer feedback and proof‑of‑concept evaluations.
What We Need To See
- Excellent verbal, written communication, and technical presentation skills in English.
- MS/PhD or equivalent experience in Computer Science, Data Science, Electrical/Computer Engineering, Physics, Mathematics, other Engineering fields.
- 5+ years work or research experience with Python/C++/other software development.
- Work experience and knowledge of modern NLP including good understanding of transformer, state space, diffusion, MOE model architectures. This can include either expertise in training or optimization/compression/operation of DNNs.
- Understanding of key libraries used for NLP/LLM training (such as Megatron‑LM, NeMo, DeepSpeed etc.) and/or deployment (e.g. TensorRT‑LLM, vLLM, Triton Inference Server).
- Enthusiastic about collaborating with various teams and departments—such as Engineering, Product, Sales, and Marketing—this person thrives in dynamic environments and stays focused amid constant change.
- Self‑starter with demeanor for growth, passion for continuous learning and sharing findings across the team.
Ways To Stand Out From The Crowd
- Demonstrated experience in running and debugging large‑scale distributed deep learning training or inference processes.
- Experience working with larger transformer‑based architectures for NLP, CV, ASR or other.
- Applied NLP technology in production environments.
- Proficient with DevOps tools including Docker, Kubernetes, and Singularity.
- Understanding of HPC systems: data center design, high speed interconnect InfiniBand, Cluster Storage and Scheduling related design and/or management experience.
Widely considered to be one of the technology world’s most desirable employers, NVIDIA offers highly competitive salaries and a comprehensive benefits package. As you plan your future, see what we can offer to you and your family .
NVIDIA is committed to fostering a diverse work environment and proud to be an equal opportunity employer. As we highly value diversity in our current and future employees, we do not discriminate (including in our hiring and promotion practices) on the basis of race, religion, color, national origin, gender, gender expression, sexual orientation, age, marital status, veteran status, disability status or any other characteristic protected by law.
#J-18808-Ljbffr
Deep Learning Solutions Architect – Inference Optimization Arbeitgeber: Nvidia
Kontaktperson:
Nvidia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Deep Learning Solutions Architect – Inference Optimization
✨Netzwerken, Netzwerken, Netzwerken!
Nutze jede Gelegenheit, um mit Leuten aus der Branche in Kontakt zu treten. Besuche Meetups, Konferenzen oder Online-Webinare, um dein Netzwerk zu erweitern und potenzielle Arbeitgeber kennenzulernen.
✨Sei proaktiv!
Warte nicht darauf, dass die Stellenanzeigen auf dich zukommen. Recherchiere Unternehmen, die dich interessieren, und kontaktiere sie direkt. Zeige dein Interesse und frage nach möglichen Möglichkeiten.
✨Bereite dich auf technische Gespräche vor!
Stelle sicher, dass du deine technischen Fähigkeiten und Kenntnisse gut präsentieren kannst. Übe häufige Interviewfragen und sei bereit, deine Erfahrungen mit Tools wie TRT LLM oder vLLM zu diskutieren.
✨Bewirb dich über unsere Website!
Wenn du eine Stelle bei NVIDIA im Auge hast, bewirb dich direkt über unsere Website. So zeigst du, dass du wirklich interessiert bist und erhältst Zugang zu exklusiven Funktionen und Tipps!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Deep Learning Solutions Architect – Inference Optimization
Tipps für deine Bewerbung 🫡
Mach deine Hausaufgaben!: Bevor du mit deiner Bewerbung anfängst, schau dir genau an, was wir bei StudySmarter machen. Verstehe die Rolle des Deep Learning Solutions Architect und wie du mit deinen Fähigkeiten einen Unterschied machen kannst. Das zeigt uns, dass du wirklich interessiert bist!
Sei präzise und klar!: Wenn du deine Bewerbung schreibst, achte darauf, dass du deine Erfahrungen und Fähigkeiten klar und präzise darstellst. Verwende konkrete Beispiele, um zu zeigen, wie du in der Vergangenheit Probleme gelöst hast oder innovative Lösungen entwickelt hast. Das macht einen großen Unterschied!
Zeig deine Leidenschaft für KI!: Wir suchen nach jemandem, der wirklich für künstliche Intelligenz brennt. Teile in deinem Anschreiben, warum du dich für diesen Bereich interessierst und wie du dich ständig weiterbildest. Deine Begeisterung wird uns überzeugen!
Bewirb dich über unsere Website!: Um sicherzustellen, dass deine Bewerbung nicht verloren geht, bewirb dich direkt über unsere Website. So können wir deine Unterlagen schnell und effizient bearbeiten. Wir freuen uns darauf, von dir zu hören!
Wie du dich auf ein Vorstellungsgespräch bei Nvidia vorbereitest
✨Verstehe die Technologien
Mach dich mit den neuesten Technologien und Tools vertraut, die in der Stellenbeschreibung erwähnt werden, wie TRT LLM oder vLLM. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen hast, um deine Kenntnisse zu untermauern.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast, insbesondere im Bereich Deep Learning und Optimierung. Sei bereit, diese Beispiele zu teilen und zu erklären, wie du Probleme gelöst hast und welche Ergebnisse du erzielt hast.
✨Kommunikation ist der Schlüssel
Da die Rolle viel Interaktion mit Kunden und verschiedenen Teams erfordert, solltest du deine Kommunikationsfähigkeiten unter Beweis stellen. Übe, technische Konzepte einfach und klar zu erklären, damit auch Nicht-Experten sie verstehen können.
✨Zeige deine Leidenschaft für KI
NVIDIA sucht nach jemandem, der begeistert von künstlicher Intelligenz ist. Teile deine Gedanken über aktuelle Trends in der KI und wie du dich kontinuierlich weiterbildest. Das zeigt, dass du nicht nur für den Job brennst, sondern auch für die Branche insgesamt.