Senior ML Engineer (Token Factory)

Senior ML Engineer (Token Factory)

Vollzeit 75000 - 95000 € / Jahr (geschätzt) Homeoffice (teilweise)
Dormont Manufacturing Co

Auf einen Blick

  • Aufgaben: Optimiere ML-Modelle und entwickle innovative Inferenzlösungen auf einer leistungsstarken GPU-Plattform.
  • Unternehmen: Token Factory, Teil von Nebius Cloud, einem der größten GPU-Cloud-Anbieter weltweit.
  • Vorteile: Wettbewerbsfähiges Gehalt, umfassende Sozialleistungen und flexible Arbeitszeiten.
  • Weitere Informationen: Entwickle deine Karriere in einem innovativen und kollaborativen Umfeld.
  • Warum dieser Job: Sei Teil eines dynamischen Teams und gestalte die Zukunft der KI mit modernster Technologie.
  • Qualifikationen: Fundierte Kenntnisse in ML, GPU-Profiling und starke Software-Engineering-Fähigkeiten.

Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

Token Factory ist ein Teil von Nebius Cloud, einer der größten GPU-Clouds der Welt, die Zehntausende von GPUs betreibt. Wir bauen eine leistungsstarke Plattform für Inferenz und Feinabstimmung, die darauf ausgelegt ist, Grundmodelle an die Grenzen ihrer Hardware zu bringen. Unsere Mission ist es, den Durchsatz zu maximieren, die Latenz zu minimieren und die Kosten pro Token über Zehntausende von GPUs zu optimieren.

Einige Richtungen, an denen wir derzeit arbeiten und an denen Sie teilnehmen können:

  • Inference Optimization: Identifizierung von LLM-Inferenzengpässen zur Steigerung der Produktionsgeschwindigkeit. Maximierung der Leistung für eine Vielzahl von LLM-Architekturen im großen Maßstab (z.B. GPT-OSS, Kimi K2.5, DeepSeek V3.1/V3.2, GLM-5).
  • Inference engines support: Implementierung neuartiger spekulativer Dekodierungsarchitekturen, Optimierung von Komponenten verschiedener LLM-Designs (dense/MoE, autoregressiv/parallel) und Beitrag zu Open-Source-Inferenz-Engines.
  • Low Precision Training & Inference: Entwurf und Produktion von Low-Precision (FP8, NVFP4/MXFP4) Trainings- und Inferenzpipelines mit messbaren Gewinnen in Durchsatz und Kosteneffizienz.

Wir erwarten von Ihnen:

  • Ein tiefes Verständnis der theoretischen Grundlagen des maschinellen Lernens und der Transformer-Architektur.
  • Erfahrung in der Profilerstellung von GPU-Workloads mit Nsight, PyTorch Profiler oder ähnlichen Tools.
  • Verständnis der GPU-Speicherhierarchie und der Kompromisse zwischen Berechnung und Speicher.
  • Vertrautheit mit wichtigen Ideen im LLM-Bereich, wie MHA, RoPE, KV-Cache, Flash Attention und Quantisierung.
  • Verständnis der Leistungsaspekte des Trainings großer neuronaler Netzwerke (Sharding-Strategien, benutzerdefinierte Kerne, Hardwaremerkmale usw.).
  • Starke Software-Engineering-Fähigkeiten (wir verwenden hauptsächlich Python).
  • Tiefe Erfahrung mit modernen Deep-Learning-Frameworks.
  • Beherrschung zeitgemäßer Software-Engineering-Ansätze, einschließlich CI/CD, Versionskontrolle und Unit-Tests.
  • Starke Kommunikations- und Führungsfähigkeiten.

Wünschenswert:

  • Erfahrung mit Open-Source-Inferenz-Engines (vLLM, SGLang, TensorRT-LLM), einschließlich Beiträge.
  • Erfahrung mit Kernelsprache oder DSLs wie Triton, Cute, CUTLASS, CUDA.
  • Eine Erfolgsbilanz beim Aufbau und der Lieferung von Produkten (nicht unbedingt ML-bezogen) in einem dynamischen, startup-ähnlichen Umfeld.
  • Starke Ingenieursfähigkeiten, einschließlich Erfahrung in der Entwicklung großer verteilter Systeme oder hochbelasteter Webdienste.
  • Open-Source-Projekte, die Ihr Ingenieurgeschick demonstrieren.
  • Exzellente Englischkenntnisse sowie überlegene Schreib-, Artikulations- und Kommunikationsfähigkeiten.

Was wir bieten:

  • Wettbewerbsfähiges Gehalt und umfassendes Leistungspaket.
  • Chancen für berufliches Wachstum innerhalb von Nebius.
  • Flexible Arbeitsbedingungen.
  • Ein dynamisches und kollaboratives Arbeitsumfeld, das Initiative und Innovation schätzt.

Senior ML Engineer (Token Factory) Arbeitgeber: Dormont Manufacturing Co

Token Factory, als Teil von Nebius Cloud, bietet eine herausragende Arbeitsumgebung für Senior ML Engineers, die an der Spitze der GPU-Technologie arbeiten möchten. Mit einem wettbewerbsfähigen Gehalt, umfassenden Sozialleistungen und flexiblen Arbeitszeiten fördern wir eine dynamische und kollaborative Kultur, die Innovation und Eigeninitiative schätzt. Zudem bieten wir zahlreiche Möglichkeiten zur beruflichen Weiterentwicklung in einem internationalen Umfeld, das sich auf die Optimierung von KI-Modellen konzentriert.

Dormont Manufacturing Co

Kontaktdaten:

Dormont Manufacturing Co Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior ML Engineer (Token Factory) erhalten könnten

Netzwerken ist der Schlüssel

Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns gemeinsam nach Verbindungen suchen, die dir helfen können, einen Fuß in die Tür zu bekommen!

Sei proaktiv bei der Kontaktaufnahme

Wenn du eine interessante Stelle siehst, zögere nicht, direkt mit dem Team oder dem Recruiter in Kontakt zu treten. Frag nach mehr Informationen oder teile deine Begeisterung für die Position – das zeigt Initiative!

Bereite dich auf technische Interviews vor

Mach dich mit den neuesten Trends und Technologien im Bereich Machine Learning vertraut. Lass uns gemeinsam an deinen Fähigkeiten arbeiten, damit du im Interview glänzen kannst!

Bewirb dich über unsere Website

Vergiss nicht, dich direkt über unsere Website zu bewerben! Das zeigt, dass du wirklich interessiert bist und gibt dir die beste Chance, im Auswahlprozess gesehen zu werden.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior ML Engineer (Token Factory) mit Bravour zu bestehen

Verständnis der theoretischen Grundlagen des maschinellen Lernens
Kenntnisse in der Transformer-Architektur
Profilierung von GPU-Workloads mit Nsight oder PyTorch Profiler
Verständnis der GPU-Speicherhierarchie und Compute/Memory Tradeoffs
Familiarität mit wichtigen Konzepten im LLM-Bereich (z.B. MHA, RoPE, KV-cache, Flash Attention, Quantisierung)
Kenntnisse über Leistungsaspekte des Trainings großer neuronaler Netzwerke
Starke Software-Engineering-Fähigkeiten (vorwiegend Python)

Einige Tipps für deine Bewerbung 🫡

Mach deine Hausaufgaben:Bevor du mit deiner Bewerbung anfängst, schau dir unsere Website und die Projekte an, an denen wir arbeiten. Das zeigt uns, dass du wirklich interessiert bist und weißt, worum es geht.

Sei konkret und präzise:Wenn du über deine Erfahrungen sprichst, sei so konkret wie möglich. Nenne Beispiele, die zeigen, wie du Probleme gelöst hast oder welche Erfolge du erzielt hast. Das hilft uns, ein besseres Bild von deinen Fähigkeiten zu bekommen.

Zeig deine Leidenschaft für ML:Wir suchen nach Leuten, die wirklich für Machine Learning brennen. Teile in deinem Anschreiben, warum du dich für diesen Bereich interessierst und was dich motiviert, bei uns zu arbeiten. Deine Begeisterung kann den Unterschied machen!

Bewirb dich über unsere Website:Um sicherzustellen, dass deine Bewerbung nicht untergeht, bewirb dich direkt über unsere Website. So können wir deine Unterlagen schnell und effizient bearbeiten und du bist gleich im richtigen System.

Wie man sich auf ein Vorstellungsgespräch bei Dormont Manufacturing Co vorbereitet

Verstehe die Grundlagen

Mach dich mit den theoretischen Grundlagen des maschinellen Lernens und der Transformer-Architektur vertraut. Sei bereit, dein Wissen über wichtige Konzepte wie MHA, RoPE und Flash Attention zu demonstrieren. Das zeigt, dass du nicht nur die Theorie verstehst, sondern auch, wie sie in der Praxis angewendet wird.

Praktische Erfahrung zeigen

Bereite Beispiele aus deiner bisherigen Arbeit vor, die deine Erfahrungen mit GPU-Profiling und modernen Deep-Learning-Frameworks zeigen. Wenn du mit Tools wie Nsight oder dem PyTorch Profiler gearbeitet hast, bringe konkrete Ergebnisse oder Herausforderungen mit, die du gemeistert hast.

Kommunikation ist der Schlüssel

Stelle sicher, dass du deine Gedanken klar und präzise ausdrücken kannst. Übe, technische Konzepte einfach zu erklären, als würdest du es jemandem ohne technischen Hintergrund erklären. Gute Kommunikationsfähigkeiten sind entscheidend, besonders in einem dynamischen Teamumfeld.

Sei bereit für technische Fragen

Erwarte technische Fragen zu Performance-Aspekten von großen neuronalen Netzwerken und sei bereit, über Sharding-Strategien oder benutzerdefinierte Kerne zu sprechen. Zeige, dass du nicht nur die Theorie kennst, sondern auch praktische Lösungen für reale Probleme anbieten kannst.