Senior ML Engineer (Token Factory)
Senior ML Engineer (Token Factory)

Senior ML Engineer (Token Factory)

London Vollzeit 75000 - 100000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
N

Auf einen Blick

  • Aufgaben: Optimiere KI-Modelle und entwickle innovative Inferenzplattformen mit modernster Technologie.
  • Arbeitgeber: Nebius, ein führendes Unternehmen im Bereich Cloud-Computing für die globale KI-Wirtschaft.
  • Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, umfassende Sozialleistungen und flexible Arbeitszeiten.
  • Andere Informationen: Dynamisches Umfeld mit hervorragenden Entwicklungsmöglichkeiten.
  • Warum dieser Job: Arbeite an der Spitze der KI-Technologie und gestalte die Zukunft der Cloud-Infrastruktur.
  • Gewünschte Qualifikationen: Fundierte Kenntnisse in maschinellem Lernen und Erfahrung mit GPU-Workloads.

Das voraussichtliche Gehalt liegt zwischen 75000 - 100000 € pro Jahr.

Nebius ist führend in einer neuen Ära des Cloud-Computing, um die globale KI-Wirtschaft zu bedienen. Wir schaffen die Werkzeuge und Ressourcen, die unsere Kunden benötigen, um reale Herausforderungen zu lösen und Branchen zu transformieren, ohne massive Infrastrukturkosten oder die Notwendigkeit, große interne KI/ML-Teams aufzubauen.

Das Token Factory-Team ist Teil von Nebius Cloud, einer der größten GPU-Clouds der Welt, die Zehntausende von GPUs betreibt. Wir bauen eine Hochleistungsplattform für Inferenz und Feinabstimmung, die darauf ausgelegt ist, Fundamentalmuster an ihre Hardwaregrenzen zu bringen. Unsere Mission ist es, den Durchsatz zu maximieren, die Latenz zu minimieren und die Kosten pro Token über Zehntausende von GPUs zu optimieren.

Einige Richtungen, an denen wir derzeit arbeiten und an denen Sie teilnehmen können:

  • Inferenzoptimierung: Identifizierung von LLM-Inferenzengpässen zur Steigerung der Produktionsgeschwindigkeit.
  • Inferenz-Engines: Implementierung neuartiger spekulativer Dekodierungsarchitekturen, Optimierung von Komponenten verschiedener LLM-Designs und Beitrag zu Open-Source-Inferenz-Engines.
  • Niedrigpräzises Training & Inferenz: Entwurf und Produktion von niedrigpräzisen Trainings- und Inferenzpipelines mit messbaren Gewinnen in Durchsatz und Kosteneffizienz.

Wir erwarten von Ihnen:

  • Ein tiefes Verständnis der theoretischen Grundlagen des maschinellen Lernens und der Transformer-Architektur.
  • Erfahrung in der Profilerstellung von GPU-Workloads mit Nsight, PyTorch Profiler oder ähnlichen Tools.
  • Verständnis der GPU-Speicherhierarchie und der Kompromisse zwischen Berechnung und Speicher.
  • Vertrautheit mit wichtigen Ideen im LLM-Bereich, wie MHA, RoPE, KV-Cache, Flash Attention und Quantisierung.
  • Verständnis der Leistungsaspekte des Trainings großer neuronaler Netzwerke.
  • Starke Software-Engineering-Fähigkeiten (wir verwenden hauptsächlich Python).
  • Tiefe Erfahrung mit modernen Deep-Learning-Frameworks.
  • Beherrschung zeitgemäßer Software-Engineering-Ansätze, einschließlich CI/CD, Versionskontrolle und Unit-Tests.
  • Starke Kommunikations- und Führungsfähigkeiten.

Wünschenswert:

  • Erfahrung mit Open-Source-Inferenz-Engines.
  • Erfahrung mit Kernelsprachen oder DSLs.
  • Eine Erfolgsbilanz beim Aufbau und der Lieferung von Produkten in einem dynamischen, startup-ähnlichen Umfeld.
  • Starke Ingenieursfähigkeiten, einschließlich Erfahrung in der Entwicklung großer verteilter Systeme oder hochbelasteter Webdienste.
  • Open-Source-Projekte, die Ihr Ingenieurgeschick demonstrieren.
  • Exzellente Englischkenntnisse sowie überlegene Schreib-, Ausdrucks- und Kommunikationsfähigkeiten.

Was wir bieten:

  • Wettbewerbsfähiges Gehalt und umfassendes Leistungspaket.
  • Chancen für berufliches Wachstum innerhalb von Nebius.
  • Flexible Arbeitsbedingungen.
  • Ein dynamisches und kollaboratives Arbeitsumfeld, das Initiative und Innovation schätzt.

Wenn Sie bereit für die Herausforderung sind und sich für KI und ML begeistern, schließen Sie sich uns an!

Senior ML Engineer (Token Factory) Arbeitgeber: Nebius

Nebius ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, an der Spitze der KI-Cloud-Infrastruktur zu arbeiten und innovative Lösungen für reale Herausforderungen zu entwickeln. Mit einem wettbewerbsfähigen Gehalt, umfassenden Sozialleistungen und flexiblen Arbeitszeiten fördert Nebius eine dynamische und kollaborative Arbeitsumgebung, in der Initiative und Innovation geschätzt werden. Zudem gibt es zahlreiche Möglichkeiten zur beruflichen Weiterentwicklung in einem internationalen Team von über 1400 Mitarbeitern, das in Amsterdam ansässig ist und global tätig ist.
N

Kontaktperson:

Nebius HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior ML Engineer (Token Factory)

Netzwerken, Netzwerken, Netzwerken!

Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Stell Fragen, teile deine Ideen und zeig dein Interesse an den neuesten Entwicklungen im Bereich KI und ML.

Sei proaktiv!

Warte nicht darauf, dass die Stellenanzeigen auf dich zukommen. Recherchiere Unternehmen, die dich interessieren, und kontaktiere sie direkt. Zeig, dass du wirklich an ihrer Mission interessiert bist!

Bereite dich auf technische Interviews vor!

Mach dich mit typischen Fragen und Herausforderungen im Bereich ML vertraut. Übe Coding-Challenges und sei bereit, deine Lösungen zu erklären. Das zeigt dein tiefes Verständnis für die Materie.

Bewirb dich über unsere Website!

Wenn du denkst, dass du gut zu Nebius passt, bewirb dich direkt über unsere Website. So kannst du sicherstellen, dass deine Bewerbung die richtigen Leute erreicht und du die Chance bekommst, Teil unseres innovativen Teams zu werden.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior ML Engineer (Token Factory)

Verständnis der theoretischen Grundlagen des maschinellen Lernens
Kenntnisse in der Transformer-Architektur
Profilierung von GPU-Workloads mit Nsight oder PyTorch Profiler
Verständnis der GPU-Speicherhierarchie und Compute/Memory Trade-offs
Familiarität mit wichtigen Konzepten im LLM-Bereich (z.B. MHA, RoPE, KV-cache, Flash Attention, Quantisierung)
Kenntnisse über Leistungsaspekte des Trainings großer neuronaler Netzwerke
Starke Software-Engineering-Fähigkeiten (vorwiegend Python)
Erfahrung mit modernen Deep-Learning-Frameworks
Kenntnisse in CI/CD, Versionskontrolle und Unit-Tests
Starke Kommunikations- und Führungsfähigkeiten
Erfahrung mit Open-Source-Inferenz-Engines (z.B. vLLM, SGLang, TensorRT-LLM)
Kenntnisse in Kernel-Sprachen oder DSLs (z.B. Triton, Cute, CUTLASS, CUDA)
Erfahrung in der Entwicklung großer verteilter Systeme oder hochbelasteter Webdienste
Nachweisbare Erfolge in der Produktentwicklung in dynamischen Start-up-Umgebungen

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für AI und ML haben, also lass das in deinen Worten durchscheinen!

Mach es konkret!: Verwende konkrete Beispiele aus deiner bisherigen Erfahrung, um deine Fähigkeiten zu untermauern. Zeig uns, wie du Herausforderungen gemeistert hast und welche Erfolge du erzielt hast – das macht einen großen Unterschied!

Achte auf die Details!: Überprüfe deine Bewerbung auf Rechtschreib- und Grammatikfehler. Eine gut geschriebene Bewerbung zeigt, dass du dir Mühe gibst und professionell bist. Lass uns wissen, dass du die Details im Blick hast!

Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell bei uns ankommt und wir dich zügig kontaktieren können. Wir freuen uns darauf, von dir zu hören!

Wie du dich auf ein Vorstellungsgespräch bei Nebius vorbereitest

Verstehe die Grundlagen

Mach dich mit den theoretischen Grundlagen des maschinellen Lernens und der Transformer-Architektur vertraut. Sei bereit, dein Wissen über LLMs und deren Optimierung zu demonstrieren, denn das wird in deinem Interview sicher zur Sprache kommen.

Praktische Erfahrung zeigen

Bereite konkrete Beispiele aus deiner bisherigen Arbeit vor, die deine Fähigkeiten im Umgang mit GPU-Workloads und modernen Deep-Learning-Frameworks zeigen. Zeige, wie du Performance-Probleme identifiziert und gelöst hast, um deine Eignung für die Rolle zu unterstreichen.

Kommunikation ist der Schlüssel

Stelle sicher, dass du deine Gedanken klar und präzise ausdrücken kannst. Nebius sucht nach starken Kommunikationsfähigkeiten, also übe, technische Konzepte einfach zu erklären, als würdest du sie jemandem ohne technischen Hintergrund präsentieren.

Sei bereit für technische Fragen

Erwarte technische Fragen zu GPU-Speicherhierarchien, Sharding-Strategien und anderen relevanten Themen. Bereite dich darauf vor, deine Problemlösungsfähigkeiten in realistischen Szenarien zu demonstrieren, um zu zeigen, dass du die Herausforderungen der Rolle verstehst.

Senior ML Engineer (Token Factory)
Nebius
Standort: London
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>