Auf einen Blick
- Aufgaben: Entwickle bahnbrechende KI-Modelle und optimiere deren Leistung in Echtzeit.
- Arbeitgeber: Innovatives Forschungsunternehmen mit einem Team aus führenden KI-Forschern und Ingenieuren.
- Mitarbeitervorteile: Attraktives Gehalt, Gesundheitsleistungen, flexible Arbeitszeiten und Unterstützung bei der beruflichen Entwicklung.
- Andere Informationen: Dynamisches Umfeld mit flachen Hierarchien und großartigen Wachstumschancen.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden, realen Herausforderungen.
- Gewünschte Qualifikationen: Erfahrung in Inferenzoptimierung und Hochleistungs-Systemen, idealerweise mit C++, CUDA oder Rust.
Das voraussichtliche Gehalt liegt zwischen 80000 - 110000 € pro Jahr.
Inworld ist ein produktorientiertes Forschungslabor von führenden KI-Forschern und Ingenieuren, das erstklassige Echtzeit-Multimodal-Modelle und die einzige Echtzeit-Orchestrierungsplattform entwickelt, die für Tausende von Anfragen pro Sekunde optimiert ist. Wir haben mehr als 125 Millionen US-Dollar von Lightspeed, Section 32, Kleiner Perkins, Microsofts M12-Venture-Fonds, Founders Fund, Meta und Stanford unter anderem gesammelt. Unsere Technologie hat Erfahrungen von Unternehmen wie NVIDIA, Microsoft Xbox, Niantic, Logitech Streamlabs, Wishroll, Little Umbrella und Bible Chat ermöglicht. Wir wurden auch von CB Insights als eines der 100 vielversprechendsten KI-Unternehmen weltweit anerkannt und gehören zu LinkedIns Top 10 Startups in den USA.
Wer wir suchen
Vor einem Jahr gab es kaum zuverlässig funktionierende agentische Systeme und sub-sekündliche multimodale Inferenz in großem Maßstab. Niemand hat hier ein Jahrzehnt Erfahrung. Daher suchen wir keine Lebensläufe, sondern starke Menschen aus unterschiedlichen Hintergründen, die schnell lernen, in Ungewissheit gedeihen und uns zeigen können, was sie gebaut, kaputt gemacht und verstanden haben.
Erfahrungen, die wir nützlich finden
- Inference Optimization: Tiefes Verständnis moderner Serving-Frameworks und Techniken wie vLLM oder TRT-LLM.
- Model Acceleration: Praktische Erfahrung mit Quantisierung, Destillation, Caching-Strategien, kontinuierlichem Batching, paged attention und spekulativer Dekodierung.
- High-Performance Systems: Kenntnisse in C++, CUDA, Rust oder hochoptimiertem Python. Sie wissen, wie man Code profiliert und jede Leistung aus NVIDIA GPUs herausholt.
- Distributed Systems & Scaling: Erfahrung mit Kubernetes, Ray, benutzerdefiniertem Load Balancing, Multi-GPU/Multi-Node-Inferenz und zuverlässigem Umgang mit Tausenden gleichzeitiger Verbindungen.
- Öffentliche Arbeiten: Nicht triviale Systemprogrammierungsprojekte, Open-Source-Beiträge zu wichtigen Inferenz-Engines oder tiefgehende technische Berichte.
- Full-cycle ownership: Sie können ein Modell vom Forschungsteam übernehmen, es containerisieren, seine Bereitstellung optimieren und sicherstellen, dass es zuverlässig in der Produktion läuft.
- Hintergrund: PhD in Informatik, Physik, Mathematik oder gleichwertige praktische Erfahrung im Aufbau von Backend- oder ML-Systemen.
- Berufliche Englischkenntnisse (schriftlich und mündlich) sind erforderlich, da Sie täglich mit unseren in den USA ansässigen Führungskräften und Ingenieurteams zusammenarbeiten werden.
Wer hier gedeiht
Sie benötigen keinen Fahrplan, um loszulegen; Sie sind damit vertraut, eine Richtung zu wählen und die Karte während des Gehens zu erstellen. Sie glauben, dass Engineering erst abgeschlossen ist, wenn es ausgeliefert und stabil ist. Sie haben eine Neigung zu Auswirkungen über rein theoretische Optimierungen. Sie liefern nicht nur Code; Sie beschäftigen sich mit dem Warum. Sie sind der Erste, der eine Architektur in Frage stellt, wenn Sie denken, dass es einen besseren Weg gibt, das Kernproblem der Latenz oder des Durchsatzes zu lösen. Sie sind nicht zufrieden mit "der PM hat es gesagt". Sie gedeihen in tiefem Kontext und möchten die grundlegende Logik hinter jeder Entscheidung, die wir treffen, verstehen.
Wie es ist, hier zu arbeiten
Wir geben Ihnen unklare Probleme und erwarten, dass Sie sie klar machen. Wir schätzen Ingenieure, die sagen: "Ich weiß es noch nicht" und dann den Benchmark oder Prototyp entwerfen, der herausfindet, was es ist. Wir behandeln Leistung, Latenz und Zuverlässigkeit als erstklassige Produktmerkmale, nicht als Box, die vor dem Start abgehakt werden muss. Auswirkungen kommen vor allem anderen, obwohl wir die gemeinsame Arbeit und Open-Source-Beiträge unterstützen, die das Feld voranbringen. Ihre Arbeit sollte sichtbar sein. Flache Struktur, schnelle Iterationen, minimaler Prozessaufwand.
Für Kandidaten, die an einer zukünftigen Umsiedlung in die San Francisco Bay Area interessiert sind, können vollständige US-Visum- und Umsiedlungsunterstützung verfügbar sein, vorbehaltlich der geschäftlichen Bedürfnisse und der geltenden rechtlichen und arbeitsrechtlichen Anforderungen.
Senior / Lead Machine Learning Engineer, Serving - Germany Arbeitgeber: Inworld
Kontaktperson:
Inworld HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior / Lead Machine Learning Engineer, Serving - Germany
✨Tipp Nummer 1
Sei proaktiv! Nutze LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Einblicken in die Firma oder dem Team, in dem du arbeiten möchtest. Networking kann dir helfen, einen Fuß in die Tür zu bekommen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor, indem du deine Projekte und Erfahrungen präsentierst. Zeig, was du gebaut und gelernt hast. Wir wollen sehen, wie du Probleme angehst und löst!
✨Tipp Nummer 3
Mach dir Gedanken über die Herausforderungen, die wir bei Inworld angehen. Überlege dir, wie du deine Fähigkeiten in den Bereichen Inferenzoptimierung oder verteilte Systeme einbringen kannst. Das zeigt uns, dass du wirklich interessiert bist!
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! So stellst du sicher, dass deine Bewerbung die richtigen Leute erreicht. Und vergiss nicht, deine Leidenschaft für Machine Learning und innovative Lösungen zu zeigen!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior / Lead Machine Learning Engineer, Serving - Germany
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Wir suchen nach Menschen mit unterschiedlichen Hintergründen und Erfahrungen. Lass deine Persönlichkeit in deiner Bewerbung durchscheinen und erzähl uns von deinen Projekten und Herausforderungen.
Mach es konkret!: Vermeide allgemeine Floskeln und sei spezifisch. Erzähl uns von den Technologien, die du verwendet hast, und den Ergebnissen, die du erzielt hast. Zeig uns, wie du Probleme gelöst hast und was du dabei gelernt hast.
Struktur ist wichtig!: Achte darauf, dass deine Bewerbung gut strukturiert ist. Verwende klare Absätze und Überschriften, um deine Erfahrungen und Fähigkeiten übersichtlich darzustellen. So können wir schnell erkennen, was du zu bieten hast.
Bewirb dich über unsere Website!: Wir freuen uns, wenn du dich direkt über unsere Website bewirbst. So kannst du sicherstellen, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnellstmöglich prüfen können. Lass uns gemeinsam an der Zukunft der KI arbeiten!
Wie du dich auf ein Vorstellungsgespräch bei Inworld vorbereitest
✨Verstehe die Technologie
Mach dich mit den neuesten Trends und Technologien im Bereich Machine Learning vertraut. Informiere dich über Inference-Optimierung, moderne Serving-Frameworks und die spezifischen Tools, die in der Branche verwendet werden. Zeige während des Interviews, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen hast.
✨Bereite konkrete Beispiele vor
Sei bereit, über Projekte zu sprechen, an denen du gearbeitet hast. Erkläre, wie du Herausforderungen gemeistert hast, welche Technologien du eingesetzt hast und welche Ergebnisse du erzielt hast. Konkrete Beispiele helfen, deine Fähigkeiten und deinen Erfahrungshorizont zu verdeutlichen.
✨Frage nach dem 'Warum'
Zeige Interesse an den Entscheidungen, die im Unternehmen getroffen werden. Frage nach den Beweggründen hinter bestimmten Architekturen oder Technologien. Dies zeigt, dass du nicht nur umsetzt, sondern auch strategisch denkst und das große Ganze im Blick hast.
✨Sei bereit für technische Herausforderungen
Erwarte technische Fragen oder Aufgaben während des Interviews. Übe das Lösen von Problemen unter Zeitdruck und sei bereit, deine Denkweise zu erklären. Das zeigt, dass du nicht nur die Lösung kennst, sondern auch den Prozess, wie du dorthin gelangt bist.