Auf einen Blick
- Aufgaben: Leite den gesamten Post-Training-Pipeline für multimodale Modelle und optimiere deren Qualität.
- Arbeitgeber: Innovatives Forschungslabor mit einer Kultur der Zusammenarbeit und des Wissensaustauschs.
- Mitarbeitervorteile: Flexibles Arbeiten, Reisekostenerstattung und ein unterstützendes Teamumfeld.
- Andere Informationen: Dynamisches Team mit Möglichkeiten zur persönlichen und beruflichen Weiterentwicklung.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an bahnbrechenden Projekten.
- Gewünschte Qualifikationen: Erfahrung in der Post-Training-Optimierung und starke PyTorch-Kenntnisse.
Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Post-training ist der Bereich, in dem ein Fundamentmodell zu einem Produkt wird. In dieser Rolle sind Sie für die gesamte Post-Training-Pipeline unserer multimodalen Modelle verantwortlich – von der Datenstrategie und Belohnungsmodellierung bis hin zur Präferenzoptimierung, Destillation und Sicherheitstuning – über Bilder, Bearbeitung und Video. Sie werden messbare Fortschritte in der Modellqualität vorantreiben, die Infrastruktur aufbauen, die es dem gesamten Forschungsteam ermöglicht, schnell zu iterieren, und den Stand der Technik in dem, was es bedeutet, ein generatives Modell an menschlichen Absichten auszurichten, vorantreiben.
Was Sie bearbeiten werden:
- Die vollständige Post-Training-Pipeline end-to-end besitzen – von der Datensammlung und Belohnungsmodellierung über Feinabstimmung, Präferenzoptimierung, Destillation, Sicherheitstuning, Evaluierung bis hin zur Bereitstellung.
- Techniken über den gesamten Post-Training-Stack vorantreiben: SFT, RLHF, RLAIF, DPO, Präferenzlernen und Belohnungsmodellierung, um Modelle mit menschlicher Absicht und ästhetischem Urteil in Einklang zu bringen.
- Über Modalitäten hinweg arbeiten: Text-zu-Bild, Bildbearbeitung, Multi-Referenz und Video-Post-Training.
- Personalisierungs- und Anpassungsfähigkeiten aufbauen, die es Benutzern ermöglichen, unsere Modelle an ihren eigenen kreativen Stil anzupassen.
- Hochdurchsatz-Fine-Tuning- und Evaluierungsinfrastruktur entwerfen und pflegen, um schnelle Iterationen im Forschungsteam zu unterstützen.
- Qualitäts- und Ausrichtungslücken durch rigorose Evaluierung identifizieren und diese durch gezielte Forschung und Ingenieurarbeit schließen.
Was wir suchen:
- Sie haben das Post-Training für ein fortschrittliches generatives Modell bis zur Veröffentlichung geleitet (SFT, Präferenzoptimierung (DPO oder RLHF), Destillation, Sicherheitstuning) mit messbaren Qualitätsgewinnen bei menschlichen Präferenzen oder Standardbenchmarks.
- Tiefe Erfahrung über den gesamten Post-Training-Stack, nicht nur in einem Bereich: Belohnungsmodellierung, Präferenzlernen, RLHF/RLAIF und Personalisierung.
- Komfortabel im Arbeiten über Modalitäten hinweg: Text-zu-Bild, Bildbearbeitung, Multi-Referenz und idealerweise Video.
- Starke PyTorch-Flüssigkeit; Sie schreiben Forschungs-Code, auf dem andere aufbauen können.
- Erfahrung mit Destillation (LADD, DMD, Konsistenzmodelle oder ähnliches) oder mit dem Aufbau von Hochdurchsatz-Evaluierungs-Pipelines ist ein großer Vorteil.
- Neigung zum Versenden: messbare Verbesserungen der Modellqualität, die die Benutzer erreichen, nicht nur Papiere.
Wie wir zusammenarbeiten:
Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) in Freiburg oder SF bei uns sein oder remote arbeiten mit einer monatlichen persönlichen Woche, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir glauben, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass sie für alle zugänglich sind. Wir werden besprechen, wie dies für die Rolle während unseres Interviewprozesses aussehen wird.
Alles, was wir tun, basiert auf vier Werten:
- Besessen. Wir sind ein fortschrittliches Forschungslabor. Die Wissenschaft muss stimmen, das Verständnis tief, das Produkt schön sein.
- Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt. Niemand steht über einer Aufgabe.
- Mutig. Wir setzen auf das Ambitionierte. Wir versenden, wir warten nicht darauf, dass die Bedingungen perfekt sind.
- Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme. Handlung ohne Empathie schafft Chaos.
Wenn sich das nach Arbeit anhört, die Ihnen Freude bereiten würde, würden wir uns freuen, von Ihnen zu hören.
Member of Technical Staff - Post Training Arbeitgeber: Black Forest Labs
Kontaktperson:
Black Forest Labs HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Member of Technical Staff - Post Training
✨Tipp Nummer 1
Mach dir eine Liste von Fragen, die du im Vorstellungsgespräch stellen möchtest. Zeig Interesse an der Rolle und dem Team, indem du nach den Herausforderungen fragst, die sie aktuell haben. Das zeigt, dass du nicht nur an einem Job interessiert bist, sondern auch daran, wie du einen echten Unterschied machen kannst.
✨Tipp Nummer 2
Bereite dich darauf vor, deine bisherigen Erfolge zu präsentieren. Denk an konkrete Beispiele, bei denen du post-training Pipelines erfolgreich umgesetzt hast. Zahlen und Ergebnisse sind hier Gold wert – sie zeigen, dass du nicht nur redest, sondern auch lieferst!
✨Tipp Nummer 3
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit aktuellen Mitarbeitern oder ehemaligen Kollegen in Kontakt zu treten. Frag sie nach ihren Erfahrungen und Tipps für den Bewerbungsprozess. Oft können persönliche Empfehlungen Türen öffnen, die sonst verschlossen bleiben.
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! Das zeigt, dass du wirklich an der Position interessiert bist und es vereinfacht den Prozess für uns. Außerdem kannst du sicherstellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt. Lass uns gemeinsam die Zukunft gestalten!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Member of Technical Staff - Post Training
Tipps für deine Bewerbung 🫡
Sei du selbst!: Wenn du deine Bewerbung schreibst, lass deine Persönlichkeit durchscheinen. Wir suchen nach Menschen, die nicht nur die richtigen Fähigkeiten haben, sondern auch gut ins Team passen. Zeig uns, wer du bist und was dich motiviert!
Mach es konkret!: Verwende konkrete Beispiele aus deiner bisherigen Erfahrung, um zu zeigen, wie du die Anforderungen der Stelle erfüllst. Erzähl uns von Projekten, an denen du gearbeitet hast, und den Ergebnissen, die du erzielt hast. Das macht deine Bewerbung greifbarer!
Pass auf die Details auf!: Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Nimm dir die Zeit, alles sorgfältig zu überprüfen, bevor du es abschickst.
Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und unkompliziert bei uns ankommt. Außerdem kannst du dort alle Informationen zur Stelle und zum Bewerbungsprozess finden!
Wie du dich auf ein Vorstellungsgespräch bei Black Forest Labs vorbereitest
✨Verstehe die Post-Training-Pipeline
Mach dich mit den verschiedenen Phasen der Post-Training-Pipeline vertraut, die in der Stellenbeschreibung erwähnt werden. Sei bereit, konkrete Beispiele aus deiner Erfahrung zu teilen, wie du diese Phasen erfolgreich umgesetzt hast.
✨Technische Fähigkeiten hervorheben
Stelle sicher, dass du deine Kenntnisse in PyTorch und anderen relevanten Technologien klar kommunizierst. Bereite dich darauf vor, spezifische Projekte oder Herausforderungen zu diskutieren, bei denen du diese Fähigkeiten angewendet hast.
✨Beweise deine Erfolge
Bereite messbare Ergebnisse vor, die du in früheren Positionen erzielt hast, insbesondere im Bereich der Modellqualität und Benutzerzufriedenheit. Zeige, wie deine Arbeit direkte Auswirkungen auf die Produktentwicklung hatte.
✨Kulturelle Passung betonen
Denke darüber nach, wie du zu den Werten des Unternehmens passt: Obsession für Qualität, niedriger Ego, Mut und Freundlichkeit. Bereite Beispiele vor, die zeigen, wie du diese Werte in deinem bisherigen Arbeitsumfeld gelebt hast.