Auf einen Blick
- Aufgaben: Entwickle bahnbrechende KI-Modelle und optimiere deren Leistung in Echtzeit.
- Arbeitgeber: Innovatives Forschungsunternehmen mit einem Team aus führenden KI-Forschern und Ingenieuren.
- Mitarbeitervorteile: Attraktives Gehalt, Gesundheitsleistungen, flexible Arbeitszeiten und Unterstützung bei der beruflichen Entwicklung.
- Andere Informationen: Dynamisches Umfeld mit flachen Hierarchien und großartigen Wachstumschancen.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden, realen Herausforderungen.
- Gewünschte Qualifikationen: Erfahrung in Inferenzoptimierung und Hochleistungs-Systemen, idealerweise mit C++, CUDA oder Rust.
Das voraussichtliche Gehalt liegt zwischen 75000 - 100000 € pro Jahr.
Über Inworld
Inworld ist ein produktorientiertes Forschungslabor von führenden KI-Forschern und -Ingenieuren, das erstklassige Echtzeit-Multimodal-Modelle und die einzige Echtzeit-Orchestrierungsplattform entwickelt, die für Tausende von Anfragen pro Sekunde optimiert ist. Wir haben mehr als 125 Millionen US-Dollar von Lightspeed, Section 32, Kleiner Perkins, Microsofts M12-Venture-Fonds, Founders Fund, Meta und Stanford unter anderem gesammelt. Unsere Technologie hat Erfahrungen von Unternehmen wie NVIDIA, Microsoft Xbox, Niantic, Logitech Streamlabs, Wishroll, Little Umbrella und Bible Chat ermöglicht. Wir wurden auch von CB Insights als eines der 100 vielversprechendsten KI-Unternehmen weltweit anerkannt und gehören zu LinkedIns Top 10 Startups in den USA.
Wer wir suchen
Vor einem Jahr gab es kaum zuverlässig funktionierende agentische Systeme und sub-sekündliche multimodale Inferenz in großem Maßstab. Niemand hat hier ein Jahrzehnt Erfahrung. Daher suchen wir keine Lebensläufe, sondern starke Menschen aus unterschiedlichen Hintergründen, die schnell lernen, in Ungewissheit gedeihen und uns zeigen können, was sie gebaut, kaputt gemacht und verstanden haben.
Erfahrungen, die wir nützlich finden
- Inference Optimization: Tiefes Verständnis moderner Serving-Frameworks und Techniken wie vLLM oder TRT-LLM.
- Model Acceleration: Praktische Erfahrung mit Quantisierung, Destillation, Caching-Strategien, kontinuierlichem Batching, paged attention und spekulativem Decoding.
- High-Performance Systems: Kenntnisse in C++, CUDA, Rust oder hochoptimiertem Python. Sie wissen, wie man Code profiliert und jede Leistung aus NVIDIA GPUs herausholt.
- Distributed Systems & Scaling: Erfahrung mit Kubernetes, Ray, benutzerdefiniertem Load Balancing, Multi-GPU/Multi-Node-Inferenz und zuverlässigem Umgang mit Tausenden gleichzeitiger Verbindungen.
- Öffentliche Arbeiten: Nicht triviale Systemprogrammierungsprojekte, Open-Source-Beiträge zu wichtigen Inferenz-Engines oder tiefgehende technische Berichte.
- Full-cycle ownership: Sie können ein Modell vom Forschungsteam übernehmen, es containerisieren, seine Bereitstellung optimieren und sicherstellen, dass es zuverlässig in der Produktion läuft.
- Hintergrund: PhD in Informatik, Physik, Mathematik oder gleichwertige praktische Erfahrung im Aufbau von Backend- oder ML-Systemen.
Professionelle Englischkenntnisse (schriftlich und mündlich) sind erforderlich, da Sie täglich mit unseren in den USA ansässigen Führungskräften und Ingenieurteams zusammenarbeiten werden.
Wer hier gedeiht
Sie benötigen keinen Fahrplan, um loszulegen; Sie sind damit vertraut, eine Richtung einzuschlagen und die Karte während des Gehens zu erstellen. Sie glauben, dass Engineering erst abgeschlossen ist, wenn es ausgeliefert und stabil ist. Sie haben eine Neigung zu Auswirkungen über rein theoretische Optimierungen. Sie liefern nicht nur Code; Sie beschäftigen sich mit dem Warum. Sie sind der Erste, der eine Architektur in Frage stellt, wenn Sie denken, dass es einen besseren Weg gibt, das Kernproblem der Latenz oder des Durchsatzes zu lösen. Sie sind nicht zufrieden mit "der PM hat es gesagt". Sie gedeihen in tiefem Kontext und möchten die grundlegende Logik hinter jeder Entscheidung, die wir treffen, verstehen.
Wie es ist, hier zu arbeiten
Wir geben Ihnen unklare Probleme und erwarten, dass Sie sie klar machen. Wir schätzen Ingenieure, die sagen: "Ich weiß es noch nicht" und dann den Benchmark oder Prototyp entwerfen, der herausfindet, was es ist. Wir betrachten Leistung, Latenz und Zuverlässigkeit als erstklassige Produktmerkmale, nicht als Box, die vor dem Start abgehakt werden muss. Der Einfluss kommt vor allem anderen, obwohl wir die gemeinsame Arbeit und Open-Source-Beiträge unterstützen, die das Feld voranbringen. Ihre Arbeit sollte sichtbar sein. Flache Struktur, schnelle Iterationen, minimaler Prozessaufwand.
Für Kandidaten, die in Zukunft an einer Umsiedlung in die San Francisco Bay Area interessiert sind, können vollständige US-Visum- und Umsiedlungsunterstützung verfügbar sein, vorbehaltlich der geschäftlichen Bedürfnisse und der geltenden rechtlichen und arbeitsrechtlichen Anforderungen.
Senior / Lead Machine Learning Engineer, Serving - Germany Arbeitgeber: Inworld AI
Kontaktperson:
Inworld AI HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior / Lead Machine Learning Engineer, Serving - Germany
✨Tipp Nummer 1
Sei proaktiv! Nutze LinkedIn und andere Netzwerke, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach ihren Erfahrungen und Tipps – das kann dir helfen, einen Fuß in die Tür zu bekommen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor, indem du an realen Projekten arbeitest oder eigene Ideen umsetzt. Zeig uns, was du kannst, und bringe Beispiele mit, die deine Fähigkeiten unter Beweis stellen.
✨Tipp Nummer 3
Nutze unsere Website, um dich direkt zu bewerben. Das zeigt dein Interesse und gibt uns die Möglichkeit, dich besser kennenzulernen. Vergiss nicht, deine Leidenschaft für Machine Learning zu betonen!
✨Tipp Nummer 4
Sei bereit, über deine Fehler zu sprechen. Wir schätzen Kandidaten, die aus ihren Erfahrungen gelernt haben. Erzähl uns von Herausforderungen, die du gemeistert hast, und wie du dabei gewachsen bist.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior / Lead Machine Learning Engineer, Serving - Germany
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Wir suchen nach Menschen mit unterschiedlichen Hintergründen und Erfahrungen. Lass deine Persönlichkeit in deiner Bewerbung durchscheinen und erzähl uns von deinen Projekten und Herausforderungen.
Mach es konkret!: Statt nur allgemeine Aussagen zu machen, bring konkrete Beispiele aus deiner bisherigen Arbeit. Erzähl uns von den Systemen, die du entwickelt hast, und den Problemen, die du gelöst hast. Das gibt uns einen echten Einblick in deine Fähigkeiten.
Verstehe die Anforderungen!: Lies die Stellenbeschreibung sorgfältig durch und achte darauf, wie deine Erfahrungen und Fähigkeiten dazu passen. Zeig uns, dass du die Herausforderungen verstehst und bereit bist, sie anzugehen. Das macht einen großen Unterschied!
Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass wir alles bekommen, was wir brauchen, um dich besser kennenzulernen. Wir freuen uns auf deine Bewerbung!
Wie du dich auf ein Vorstellungsgespräch bei Inworld AI vorbereitest
✨Verstehe die Technologie
Mach dich mit den neuesten Trends und Technologien im Bereich Machine Learning vertraut. Informiere dich über Inference-Optimierung, moderne Serving-Frameworks und spezifische Techniken wie vLLM oder TRT-LLM. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast.
✨Bereite konkrete Beispiele vor
Sei bereit, über Projekte zu sprechen, an denen du gearbeitet hast. Erkläre, wie du Modelle optimiert, Containerisiert und in der Produktion stabilisiert hast. Konkrete Beispiele helfen dir, deine Fähigkeiten zu demonstrieren und zeigen, dass du die Anforderungen der Stelle verstehst.
✨Frage nach dem 'Warum'
Zeige Interesse an den Entscheidungen, die im Unternehmen getroffen werden. Frage nach den Gründen hinter bestimmten Architekturen oder Optimierungen. Dies zeigt, dass du nicht nur umsetzt, sondern auch strategisch denkst und das große Ganze im Blick hast.
✨Sei bereit für Unklarheiten
Inworld sucht nach Menschen, die mit Unsicherheiten umgehen können. Bereite dich darauf vor, Probleme zu lösen, die nicht klar definiert sind. Zeige, dass du in der Lage bist, einen Plan zu entwickeln und flexibel auf Veränderungen zu reagieren.