Auf einen Blick
- Aufgaben: Entwickle bahnbrechende multimodale Modelle und integriere sie in unsere FLUX-Plattform.
- Arbeitgeber: Innovatives Forschungslabor mit Fokus auf kreative Technologien.
- Mitarbeitervorteile: Flexibles Arbeiten, Reisekostenerstattung und ein unterstĂĽtzendes Team.
- Andere Informationen: Dynamisches Umfeld mit echten Karrierechancen und einem wertschätzenden Team.
- Warum dieser Job: Sei Teil der Revolution in der generativen KI und forme die Zukunft der Kreativität.
- Gewünschte Qualifikationen: Erfahrung in der Entwicklung von VLMs und tiefes Verständnis für multimodale Architekturen.
Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Wir sind das Team hinter Latent Diffusion, Stable Diffusion und FLUX – grundlegende Technologien, die verändert haben, wie die Welt Bilder und Videos erstellt. Unsere Modelle treiben die Werkzeuge an, die von Millionen von Kreativen, Entwicklern und Unternehmen weltweit genutzt werden, und FLUX gehört zu den fortschrittlichsten generativen Systemen der Welt. Mit Hauptsitz in Freiburg, Deutschland, und einer wachsenden Präsenz in San Francisco, wachsen wir schnell, während wir uns treu bleiben: Forschungsexzellenz, offene Wissenschaft und der Aufbau von Technologien, die die menschliche Kreativität erweitern.
Warum diese Rolle
Vision-Sprachmodelle werden grundlegend dafür, wie Menschen mit generativer KI interagieren – aber die meisten VLM-Forschungen erfolgen isoliert vom Generierungsstapel. Bei Black Forest Labs integrieren wir VLMs direkt in FLUX auf eine Weise, die unsere Modelle leistungsfähiger, kontrollierbarer und besser auf die tatsächlichen Bedürfnisse der Kreativen abgestimmt macht. Diese Rolle dreht sich um die Pionierarbeit bei dieser Integration. Sie werden keine handelsüblichen VLMs anwenden – Sie entwickeln neuartige Ansätze, innovieren an Architekturen und beantworten Fragen, die bisher nicht gelöst wurden: wie sich visuelle und sprachliche Darstellungen gegenseitig informieren, wie multimodales Verständnis die Generierungsqualität verbessert und wie diese Fähigkeiten skalierbar gemacht werden können, ohne das Besondere an FLUX zu beeinträchtigen.
Was Sie bearbeiten werden
- Leitung der Entwicklung und des Trainings von hochmodernen multimodalen Vision-Sprachmodellen innerhalb des FLUX-Stacks – Innovation an Architekturen, nicht nur Anwendung bestehender Modelle
- Entwicklung von Feinabstimmungsstrategien, die VLMs an spezialisierte kreative Anwendungsfälle (Beschriftung, Bearbeitungsanweisungen, Auffrischung von Eingabeaufforderungen) anpassen, die allgemeine Modelle nicht bewältigen können
- Forschung zu Integrationen zwischen VLM/LLM-Fähigkeiten und unseren Diffusions- und Fluss-Pipelines – kreative Wege finden, um die Generierungsqualität und Kontrollierbarkeit ohne rechnerische Engpässe zu verbessern
- Bewertung neuer multimodaler Architekturen und Ăśbersetzung der besten aktuellen Forschung in praktische Verbesserungen
Was wir suchen
- Sie haben ein VLM vortrainiert oder erheblich weiterentwickelt (nicht nur SFT'd oder LoRA'd), das in einem Produktionssystem eingesetzt oder öffentlich veröffentlicht wurde
- Starke Publikationsbilanz oder unmissverständliche Produktionsbilanz, die zeigt, dass Sie die Grenzen multimodaler Architekturen verschieben
- Tiefes Verständnis dafür, wie visuelle und sprachliche Darstellungen interagieren: Tokenisierung, Ausrichtung, Verankerung, cross-modale Aufmerksamkeit und die Fehlerarten jeder
- Erfahrung mit verteiltem Training im Multi-Node-MaĂźstab
- Komfortabel an der Grenze zwischen Forschung und Produktion – Ihnen ist wichtig, ob die Arbeit ausgeliefert wird und generalisiert, nicht nur, ob sie gut lesbar ist
- Erfahrung mit Diffusions- oder flussbasierten generativen Modellen ist ein großer Vorteil – insbesondere wenn Sie darüber nachgedacht haben, wie autoregressive und Diffusionsparadigmen zusammenspielen können
Wie wir zusammenarbeiten
Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) in Freiburg oder SF bei uns sein oder remote arbeiten mit einer monatlichen persönlichen Woche, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir glauben, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass es für alle zugänglich ist.
Kernwerte
- Besessen. Wir sind ein Forschungsinstitut an der Front. Die Wissenschaft muss stimmen, das Verständnis tief, das Produkt schön.
- Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt. Niemand steht ĂĽber einer Aufgabe.
- Mutig. Wir gehen das ehrgeizige Risiko ein. Wir liefern, wir warten nicht darauf, dass die Bedingungen perfekt sind.
- Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme. Handlungsmacht ohne Empathie schafft Chaos.
Gleichberechtigter Arbeitgeber
Wir laden Bewerber ein, ihre demografischen Hintergründe zu teilen. Wenn Sie sich entscheiden, diese Umfrage auszufüllen, können Ihre Antworten verwendet werden, um Bereiche zur Verbesserung unseres Einstellungsprozesses zu identifizieren. Wir diskriminieren nicht aufgrund von geschützten Gruppenstatus gemäß geltendem Recht. Für Regierungsberichterstattungszwecke können wir Informationen gemäß dem Vietnam Era Veterans Readjustment Assistance Act (VEVRAA) sammeln, um die Wirksamkeit von Outreach- und positiven Rekrutierungsbemühungen zu messen.
Member of Technical Staff - VLM Arbeitgeber: Black Forest Labs Inc.
Kontaktperson:
Black Forest Labs Inc. HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Member of Technical Staff - VLM
✨Tipp Nummer 1
Mach dir ein starkes Netzwerk! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Oft sind es persönliche Empfehlungen, die den Unterschied machen.
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe Coding-Challenges und sei bereit, deine Denkweise zu erklären. Zeig, dass du nicht nur die Lösungen kennst, sondern auch verstehst, warum sie funktionieren.
✨Tipp Nummer 3
Sei proaktiv und zeig dein Interesse! Wenn du eine Stelle im Auge hast, zögere nicht, direkt Kontakt aufzunehmen. Frag nach, ob es offene Positionen gibt oder wie der Bewerbungsprozess aussieht.
✨Tipp Nummer 4
Bewirb dich ĂĽber unsere Website! Das zeigt, dass du wirklich an uns interessiert bist. AuĂźerdem kannst du sicherstellen, dass deine Bewerbung direkt bei den richtigen Leuten landet.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Member of Technical Staff - VLM
Tipps für deine Bewerbung 🫡
Sei kreativ und zeig deine Leidenschaft: Wenn du deine Bewerbung schreibst, lass deine Begeisterung für VLMs und generative KI durchscheinen. Erzähl uns, warum du für diese Rolle brennst und was dich an unserer Arbeit fasziniert!
Betone deine Erfahrungen: Stell sicher, dass du deine bisherigen Erfahrungen mit VLMs klar darstellst. Zeig uns, wie du innovative Ansätze entwickelt hast und welche Erfolge du in der Vergangenheit erzielt hast. Das macht einen großen Unterschied!
Mach es persönlich: Vermeide Standardfloskeln und bringe deine Persönlichkeit in die Bewerbung ein. Wir suchen nach Menschen, die zu unserem Team passen und sich mit unseren Werten identifizieren. Sei authentisch!
Bewirb dich über unsere Website: Um sicherzustellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt, bewirb dich direkt über unsere Website. So können wir deine Unterlagen schnell und effizient bearbeiten!
Wie du dich auf ein Vorstellungsgespräch bei Black Forest Labs Inc. vorbereitest
✨Verstehe die Technologien
Mach dich mit den Grundlagen von Latent Diffusion, Stable Diffusion und FLUX vertraut. Zeige im Interview, dass du nicht nur die Technologien kennst, sondern auch verstehst, wie sie miteinander interagieren und welche Herausforderungen es bei der Integration von VLMs gibt.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Forschungsergebnisse, bei denen du VLMs entwickelt oder signifikant verbessert hast. Sei bereit, diese Erfahrungen zu teilen und zu erklären, wie deine Ansätze zur Lösung komplexer Probleme beigetragen haben.
✨Zeige deine Innovationskraft
Bereite dich darauf vor, über innovative Ansätze zu sprechen, die du in der Vergangenheit verfolgt hast. Überlege dir, wie du bestehende Architekturen herausgefordert und neue Ideen entwickelt hast, um die Qualität und Kontrolle von generativen Modellen zu verbessern.
✨Sei bereit für technische Fragen
Erwarte tiefgehende technische Fragen zu Themen wie Tokenisierung, cross-modale Aufmerksamkeit und die Interaktion zwischen visuellen und sprachlichen Repräsentationen. Stelle sicher, dass du die Konzepte gut verstehst und in der Lage bist, sie klar zu erklären.