Training Infrastructure Engineer
Training Infrastructure Engineer

Training Infrastructure Engineer

Berlin Vollzeit Home Office möglich (teilweise)
Go Premium
M

Mirelo AI is building the next generation of creative tools by generating realistic sound, speech and music from video.

We develop cutting-edge foundational generative AI models that „unmute“ silent video content and create custom, hyper-realistic audio for gaming, video platforms, and creators. Our technology empowers global storytellers to transform their content.

We recently closed a $41 million Seed round co-led by Andreessen Horowitz and Index Ventures with participation from Atlantic, and are rapidly expanding across Product, Engineering, Go-to-Market, and Growth.

About the Role

In this role, you’ll focus on the full training stack – profiling GPU behavior, debugging training pipelines, improving throughput, choosing the right parallelism strategies, and designing the infrastructure that lets us train models efficiently at scale. You’ll work across cluster management, model training, efficient data pipelines for video and audio, inference and optimizing pytorch code. Your work will shape the foundation on which all of our generative models are built and iterated.

Key Responsibilities

  • Find ideal training strategies (parallelism approaches, precision trade-offs) for a variety of model sizes and compute loads

  • Profile, debug, and optimize single and multi-GPU operations using tools like Nsight and stack trace viewers to understand what’s actually happening at the hardware level

  • Analyze and improve the whole training pipeline from start to end (efficient data storage, data loading, distributed training, checkpoint/artifact saving, logging, …)

  • Set up scalable systems for experiment tracking, data/model versioning, experiment insights.

  • Design, deploy and maintain large-scale ML training clusters running SLURM for distributed workload orchestration

Ideal Candidate Profile

  • Familiarity with the latest and most effective techniques in optimizing training and inference workloads—not from reading papers, but from implementing them

  • Deep understanding of GPU memory hierarchy and computation capabilities—knowing what the hardware can do theoretically and what prevents us from achieving it

  • Experience optimizing for both memory-bound and compute-bound operations and understanding when each constraint matters

  • Expertise with efficient attention algorithms and their performance characteristics at different scales

Nice to Have

  • Experience in implementing custom GPU kernels and integrating them into PyTorch.

  • Experience with diffusion and autoregressive models and understanding of their specific optimization challenges

  • Familiarity with high-performance storage solutions (VAST, blob storage) and understanding of their performance characteristics for ML workloads

  • Experience with managing SLURM clusters at scale

Why Join?

  • Join at a pivotal moment. We’ve secured fresh funding and are gaining traction – now is when your contributions can make a real difference to our success.

  • True ownership from day one. You’ll have genuine autonomy and responsibility. Your ideas and work will directly shape our product and company direction.

  • Competitive compensation and equity. We offer strong packages that ensure you share in the success you help create.

  • Build for the next generation of creators. Be part of the innovation that will transform how creators work and thrive.

We welcome applications from all individuals, regardless of ethnic origin, gender, disability, religion or belief, age, or sexual orientation and identity.

M

Kontaktperson:

Mirelo AI HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Training Infrastructure Engineer

✨Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Einblicken oder Tipps – viele sind bereit zu helfen!

✨Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe mit Coding-Challenges und sei bereit, deine Problemlösungsfähigkeiten unter Beweis zu stellen. Zeig, dass du die neuesten Techniken zur Optimierung von Trainings- und Inferenz-Workloads beherrschst.

✨Tipp Nummer 3

Sei proaktiv! Wenn du eine interessante Stelle siehst, bewirb dich direkt ĂĽber unsere Website. Zeig dein Interesse und deine Begeisterung fĂĽr die Rolle und das Unternehmen!

✨Tipp Nummer 4

Mach dich mit den Tools und Technologien vertraut, die wir verwenden! Kenntnisse in SLURM, PyTorch und GPU-Optimierung sind ein Muss. Je besser du vorbereitet bist, desto mehr wirst du im Interview glänzen!

Wie du dich auf ein Vorstellungsgespräch bei Mirelo AI vorbereitest

✨Verstehe die Technologie

Mach dich mit den neuesten Techniken zur Optimierung von Trainings- und Inferenz-Workloads vertraut. Lies nicht nur darĂĽber, sondern versuche, sie selbst zu implementieren. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Erfahrung.

✨Bereite dich auf technische Fragen vor

Erwarte Fragen zu GPU-Verhalten, Debugging von Trainingspipelines und Parallelisierungsstrategien. Übe, wie du deine Ansätze zur Problemlösung klar und präzise erklären kannst. Das hilft dir, dein technisches Verständnis zu demonstrieren.

✨Zeige deine Erfahrungen

Bereite konkrete Beispiele aus deiner bisherigen Arbeit vor, die deine Fähigkeiten in der Optimierung von Speicher- und Rechenoperationen zeigen. Wenn du bereits mit SLURM-Clustern gearbeitet hast, teile diese Erfahrungen und erkläre, wie du Herausforderungen gemeistert hast.

✨Fragen stellen

Bereite einige durchdachte Fragen vor, die dein Interesse an der Rolle und dem Unternehmen zeigen. Frage nach den aktuellen Herausforderungen im Team oder wie die neuen Technologien in die Produktentwicklung integriert werden. Das zeigt, dass du wirklich an der Position interessiert bist.

Training Infrastructure Engineer
Mirelo AI
Standort: Berlin
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschlieĂźlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 UnterstĂĽtzung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurĂĽck-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>