Auf einen Blick
- Aufgaben: Entwickle bahnbrechende KI-Modelle und arbeite an innovativen Projekten.
- Arbeitgeber: Führendes KI-Forschungslabor mit einem kreativen Team von Experten.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen und flexible Arbeitsmöglichkeiten.
- Andere Informationen: Dynamisches Umfeld mit großartigen Wachstumschancen.
- Warum dieser Job: Gestalte die Zukunft der KI und mache einen echten Unterschied.
- Gewünschte Qualifikationen: Erfahrung in maschinellem Lernen und starke Problemlösungsfähigkeiten.
Das voraussichtliche Gehalt liegt zwischen 80000 - 120000 € pro Jahr.
Inworld ist ein produktorientiertes Forschungslabor von führenden KI-Forschern und -Ingenieuren, das erstklassige Echtzeit-Multimodal-Modelle und die einzige Echtzeit-Orchestrierungsplattform entwickelt, die für Tausende von Anfragen pro Sekunde optimiert ist. Wir haben mehr als 125 Millionen US-Dollar von Lightspeed, Section 32, Kleiner Perkins, Microsofts M12-Venture-Fonds, Founders Fund, Meta und Stanford unter anderem gesammelt. Unsere Technologie hat Erfahrungen von Unternehmen wie NVIDIA, Microsoft Xbox, Niantic, Logitech Streamlabs, Wishroll, Little Umbrella und Bible Chat ermöglicht. Wir wurden auch von CB Insights als eines der 100 vielversprechendsten KI-Unternehmen weltweit anerkannt und gehören zu LinkedIns Top 10 Startups in den USA.
Wer wir suchen
Vor einem Jahr gab es kaum zuverlässig funktionierende agentische Systeme und sub-sekündliche multimodale Inferenz in großem Maßstab. Niemand hat hier ein Jahrzehnt Erfahrung. Daher suchen wir keine Lebensläufe, sondern starke Menschen aus unterschiedlichen Hintergründen, die schnell lernen, in Ungewissheit gedeihen und uns zeigen können, was sie gebaut, kaputt gemacht und verstanden haben.
Erfahrungen, die wir nützlich finden
- Inference Optimization: Tiefes Verständnis moderner Serving-Frameworks und Techniken wie vLLM oder TRT-LLM.
- Model Acceleration: Praktische Erfahrung mit Quantisierung, Destillation, Caching-Strategien, kontinuierlichem Batching, paged attention und spekulativer Dekodierung.
- High-Performance Systems: Kenntnisse in C++, CUDA, Rust oder hochoptimiertem Python. Sie wissen, wie man Code profiliert und jede Menge Leistung aus NVIDIA GPUs herausholt.
- Distributed Systems & Scaling: Erfahrung mit Kubernetes, Ray, benutzerdefiniertem Load Balancing, Multi-GPU/Multi-Node-Inferenz und zuverlässigem Umgang mit Tausenden gleichzeitiger Verbindungen.
- Öffentliche Arbeiten: Nicht triviale Systemprogrammierungsprojekte, Open-Source-Beiträge zu wichtigen Inferenz-Engines oder tiefgehende technische Berichte.
- Full-cycle ownership: Sie können ein Modell vom Forschungsteam übernehmen, es containerisieren, seine Bereitstellung optimieren und sicherstellen, dass es zuverlässig in der Produktion läuft.
- Hintergrund: PhD in Informatik, Physik, Mathematik oder gleichwertige praktische Erfahrung im Aufbau von Backend- oder ML-Systemen.
- Berufliche Englischkenntnisse (schriftlich und mündlich) sind erforderlich, da Sie täglich mit unseren in den USA ansässigen Führungskräften und Ingenieurteams zusammenarbeiten werden.
Wer hier gedeiht
Sie benötigen keinen Fahrplan, um loszulaufen; Sie sind damit vertraut, eine Richtung einzuschlagen und die Karte während des Gehens zu erstellen. Sie glauben, dass Engineering erst abgeschlossen ist, wenn es ausgeliefert und stabil ist. Sie haben eine Neigung zu Auswirkungen über rein theoretische Optimierungen. Sie liefern nicht nur Code; Sie beschäftigen sich obsessiv mit dem Warum. Sie sind der Erste, der eine Architektur in Frage stellt, wenn Sie denken, dass es einen besseren Weg gibt, das Kernproblem der Latenz oder des Durchsatzes zu lösen. Sie sind nicht zufrieden mit "der PM hat es gesagt." Sie gedeihen in tiefem Kontext und möchten die grundlegende Logik hinter jeder Entscheidung, die wir treffen, verstehen.
Wie es ist, hier zu arbeiten
Wir geben Ihnen unklare Probleme und erwarten, dass Sie sie klar machen. Wir schätzen Ingenieure, die sagen: "Ich weiß es noch nicht" und dann den Benchmark oder Prototyp entwerfen, der herausfindet, was es ist. Wir betrachten Leistung, Latenz und Zuverlässigkeit als erstklassige Produktmerkmale, nicht als Kästchen, das vor dem Start abgehakt werden muss. Auswirkungen kommen vor allem anderen, obwohl wir die gemeinsame Arbeit und Open-Source-Beiträge unterstützen, die das Feld voranbringen. Ihre Arbeit sollte sichtbar sein. Flache Struktur, schnelle Iterationen, minimaler Prozessaufwand.
Standort & Beschäftigung
Standort: remote innerhalb der Schweiz. Einstellungsmodell: Beschäftigung über einen Arbeitgeber von Aufzeichnungen (EOR). Die Kandidaten müssen bereits das rechtliche Recht haben, in der Schweiz zu arbeiten, da kein Visumsponsoring für diese Rolle verfügbar ist. Für Kandidaten, die an einer Umsiedlung in die San Francisco Bay Area in der Zukunft interessiert sind, können vollständige US-Visum- und Umsiedlungsunterstützung verfügbar sein, vorbehaltlich der geschäftlichen Bedürfnisse und der geltenden rechtlichen und arbeitsrechtlichen Anforderungen.
Staff / Principal Machine Learning Engineer, Serving Arbeitgeber: Inworld AI
Kontaktperson:
Inworld AI HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Staff / Principal Machine Learning Engineer, Serving
✨Tipp Nummer 1
Sei proaktiv! Nutze LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach ihren Erfahrungen und teile deine eigenen Projekte – das zeigt, dass du wirklich interessiert bist.
✨Tipp Nummer 2
Mach dir Gedanken über deine bisherigen Projekte und wie sie zur Stelle passen. Bereite eine kurze Präsentation oder ein Portfolio vor, das deine Fähigkeiten und Erfolge zeigt. Das hilft uns, dich besser kennenzulernen!
✨Tipp Nummer 3
Nutze unser Netzwerk! Wenn du über unsere Website bewirbst, können wir dich direkt unterstützen und dir helfen, die richtigen Leute zu erreichen. Zeig uns, was du drauf hast!
✨Tipp Nummer 4
Bereite dich auf technische Interviews vor, indem du an Coding-Challenges teilnimmst oder an Open-Source-Projekten arbeitest. Das zeigt nicht nur deine Fähigkeiten, sondern auch dein Engagement für die Community.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Staff / Principal Machine Learning Engineer, Serving
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Wir suchen nach Menschen mit unterschiedlichen Hintergründen und Erfahrungen. Lass deine Persönlichkeit in deiner Bewerbung durchscheinen und erzähl uns von deinen Projekten und Herausforderungen.
Mach es konkret!: Statt nur allgemeine Aussagen zu machen, bring konkrete Beispiele aus deiner bisherigen Arbeit. Erzähl uns von den Systemen, die du gebaut oder optimiert hast, und wie du Herausforderungen gemeistert hast. Das gibt uns einen echten Einblick in deine Fähigkeiten.
Verstehe die Anforderungen!: Lies die Stellenbeschreibung sorgfältig durch und achte darauf, wie deine Erfahrungen und Fähigkeiten dazu passen. Zeig uns, dass du die Technologien und Konzepte verstehst, die für die Rolle wichtig sind, und wie du sie in der Praxis angewendet hast.
Bewirb dich über unsere Website!: Wir freuen uns, wenn du dich direkt über unsere Website bewirbst. So können wir sicherstellen, dass deine Bewerbung schnell und effizient bearbeitet wird. Lass uns gemeinsam an der Zukunft der KI arbeiten!
Wie du dich auf ein Vorstellungsgespräch bei Inworld AI vorbereitest
✨Verstehe die Technologie
Mach dich mit den neuesten Trends und Technologien im Bereich Machine Learning vertraut. Informiere dich über Inference Optimization, moderne Serving-Frameworks wie vLLM oder TRT-LLM und zeige, dass du die Grundlagen beherrschst.
✨Präsentiere deine Projekte
Bereite dich darauf vor, konkrete Beispiele aus deiner bisherigen Arbeit zu präsentieren. Zeige, was du gebaut, gebrochen und verstanden hast. Das kann alles von Open-Source-Beiträgen bis hin zu komplexen Systemprojekten sein.
✨Frage nach dem Warum
Sei bereit, Fragen zu stellen und die Entscheidungen hinter bestimmten Architekturen zu hinterfragen. Zeige, dass du nicht nur Code schreibst, sondern auch ein tiefes Verständnis für die zugrunde liegenden Probleme und Lösungen hast.
✨Sei flexibel und anpassungsfähig
In der Welt des Machine Learning gibt es oft keine klaren Antworten. Zeige, dass du in der Lage bist, mit Unklarheiten umzugehen und kreative Lösungen zu finden. Deine Fähigkeit, Probleme zu klären und proaktiv zu handeln, wird geschätzt.