Auf einen Blick
- Aufgaben: Entwickle ein System zur Erfassung von Traces für verteilte LLM-Workloads.
- Unternehmen: Innovatives Unternehmen im Bereich KI mit flachen Hierarchien.
- Vorteile: Wettbewerbsfähige Vergütung, flexible Arbeitszeiten und Unterstützung bei Umzügen.
- Weitere Informationen: Dynamisches Team mit internationaler Zusammenarbeit und hervorragenden Entwicklungsmöglichkeiten.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten.
- Qualifikationen: Mindestens 3 Jahre Erfahrung in KI-Systemen und starke Programmierkenntnisse in Python und C++.
Das prognostizierte Gehalt liegt zwischen 60000 - 78000 € pro Jahr.
Verantwortlichkeiten
- Entwurf und Implementierung eines Trace-Sammlungssystems für verteilte LLM-Workloads, das Rechenoperationen, Kommunikationsprimitive, Speichernutzung und Cluster-Topologie über Multi-GPU- und Multi-Node-Setups erfasst.
- Validierung, dass die gesammelten Traces das tatsächliche Arbeitsverhalten genau widerspiegeln – Überprüfung der Vollständigkeit der Operationen, zeitliche Konsistenz und Datenintegrität über Inferenz- und Trainingspipelines.
- Integration und Instrumentierung wichtiger LLM-Frameworks (vLLM, TensorRT-LLM, DeepSpeed, Megatron-LM und andere), um bedeutungsvolle Ausführungsdaten zu extrahieren, ohne die Leistung zu beeinträchtigen.
- Verwendung der gesammelten Traces als Eingabe für diskrete Ereignissimulationen, die das Verhalten verteilter KI-Workloads im großen Maßstab modellieren und wiedergeben.
- Analyse von Trace-Daten zur Identifizierung von Engpässen und Ineffizienzen im gesamten Stack, von der Ausführung einzelner Kerne bis hin zu clusterweiten Kommunikationsmustern.
Qualifikationen
- Über 3 Jahre Erfahrung in KI-Systemen, ML-Infrastruktur oder einem eng verwandten Bereich.
- Praktische Erfahrung mit mindestens einem wichtigen LLM-Servierungs- oder Trainingsframework.
- Starke Kenntnisse in Python und C++, mit einem soliden Verständnis der GPU-Architektur, des Speicherbandbreiten und des Unterschieds zwischen rechenintensiven und speicherintensiven Operationen.
- Solides Verständnis der verteilten Kommunikation.
- Vertrautheit mit Parallelitätsstrategien und deren Einfluss auf das Ausführungsverhalten in großen Clustern.
- Beiträge zu Open-Source-Projekten oder veröffentlichte Forschung in relevanten Bereichen werden sehr geschätzt.
- Frühere Erfahrung in Startups ist von Vorteil – wir arbeiten schnell und schätzen Menschen, die damit vertraut sind.
Vorteile
- Wettbewerbsfähige Vergütung mit leistungsabhängigen Anreizen.
- Subventioniertes Deutschlandticket und Zugang zu einem Rabattportal.
- Flexible Arbeitszeiten mit hybriden und remote-freundlichen Optionen.
- Flache Hierarchien und schnelle Entscheidungsfindung für zügige Umsetzung.
- Diverses, internationales Team in Deutschland und den USA.
- Moderne Zentrale in der Nähe des Heidelberger Hauptbahnhofs, verfügbar für hybride oder Workshop-Treffen.
- Wahl hochwertiger Hardware und Ausrüstung.
- Umzugshilfe zur Erleichterung Ihres Umzugs.
AI Trace Generation Engineer Arbeitgeber: turbalance
Als Arbeitgeber bieten wir Ihnen die Möglichkeit, in einem dynamischen und innovativen Umfeld zu arbeiten, das sich auf die Entwicklung von KI-Systemen spezialisiert hat. Unsere moderne Zentrale in der Nähe des Heidelberger Hauptbahnhofs fördert eine flexible Arbeitsweise mit hybriden Optionen und einem internationalen Team, das Vielfalt schätzt. Wir legen großen Wert auf persönliche und berufliche Weiterentwicklung, bieten wettbewerbsfähige Vergütung sowie Anreize und unterstützen Sie bei Ihrem Umzug.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so AI Trace Generation Engineer erhalten könnten
✨Netzwerken, Netzwerken, Netzwerken!
Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst – wir sind hier, um dir zu helfen!
✨Sei proaktiv!
Warte nicht darauf, dass die Stellenanzeigen zu dir kommen. Suche aktiv nach Unternehmen, die dich interessieren, und kontaktiere sie direkt über unsere Website. Zeig dein Interesse und deine Begeisterung!
✨Bereite dich auf technische Interviews vor!
Mach dich mit den gängigen Fragen und Herausforderungen in deinem Bereich vertraut. Übe das Lösen von Problemen und das Erklären deiner Ansätze – wir können dir Ressourcen zur Verfügung stellen, um dich optimal vorzubereiten.
✨Zeige deine Leidenschaft!
Wenn du über deine Erfahrungen sprichst, lass deine Begeisterung für AI und ML durchscheinen. Teile deine Projekte oder Open-Source-Beiträge, um zu zeigen, dass du wirklich in diesem Bereich engagiert bist. Wir lieben es, wenn Bewerber ihre Leidenschaft zeigen!
Wir glauben, dass du diese Fähigkeiten brauchst, um AI Trace Generation Engineer mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wenn du deine Bewerbung schreibst, lass deine Persönlichkeit durchscheinen. Wir suchen nach authentischen Menschen, die zu unserem Team passen. Zeig uns, wer du bist und was dich motiviert!
Pass auf die Details auf:Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Nimm dir die Zeit, alles sorgfältig zu überprüfen, bevor du es abschickst.
Beziehe dich auf die Stellenbeschreibung:Nutze die Stellenbeschreibung als Leitfaden für deine Bewerbung. Hebe relevante Erfahrungen und Fähigkeiten hervor, die zu den Anforderungen passen. So zeigst du uns, dass du genau weißt, was wir suchen.
Bewirb dich über unsere Website:Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. Das macht es für uns einfacher, alles zu verwalten und sicherzustellen, dass deine Unterlagen an die richtige Stelle gelangen.
Wie man sich auf ein Vorstellungsgespräch bei turbalance vorbereitet
✨Verstehe die Technologien
Mach dich mit den wichtigsten LLM-Frameworks wie vLLM, TensorRT‑LLM und DeepSpeed vertraut. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast, um zu demonstrieren, dass du die Anforderungen der Stelle verstehst.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast. Sei bereit, darüber zu sprechen, wie du Trace-Daten analysiert und Bottlenecks identifiziert hast. Das zeigt, dass du die nötige Erfahrung mitbringst.
✨Zeige deine Problemlösungsfähigkeiten
Bereite dich darauf vor, technische Probleme zu lösen, die dir während des Interviews präsentiert werden könnten. Dies könnte das Entwerfen eines einfachen Trace-Systems oder das Erklären von Performance-Optimierungen umfassen. So kannst du deine analytischen Fähigkeiten unter Beweis stellen.
✨Sei bereit für Fragen zur Teamarbeit
Da wir ein internationales Team haben, ist es wichtig, dass du deine Teamfähigkeit zeigst. Bereite Beispiele vor, wie du in der Vergangenheit in einem Team gearbeitet hast, insbesondere in schnelllebigen Umgebungen. Das wird zeigen, dass du gut zu unserer Unternehmenskultur passt.