Auf einen Blick
- Aufgaben: Entwickle bahnbrechende multimodale Modelle und integriere sie in unsere FLUX-Plattform.
- Arbeitgeber: Innovatives Unternehmen, das die Kreativität durch fortschrittliche Technologien fördert.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Reisekostenerstattung für persönliche Treffen.
- Andere Informationen: Dynamisches Arbeitsumfeld mit hervorragenden Wachstums- und Entwicklungsmöglichkeiten.
- Warum dieser Job: Sei Teil eines Teams, das die Zukunft der generativen KI gestaltet und echte Auswirkungen hat.
- Gewünschte Qualifikationen: Erfahrung in der Entwicklung von VLMs und tiefes Verständnis für multimodale Architekturen.
Das voraussichtliche Gehalt liegt zwischen 80000 - 110000 € pro Jahr.
Über Black Forest Labs
Wir sind das Team hinter Latent Diffusion, Stable Diffusion und FLUX – grundlegende Technologien, die verändert haben, wie die Welt Bilder und Videos erstellt. Unsere Modelle treiben die Werkzeuge an, die von Millionen von Kreativen, Entwicklern und Unternehmen weltweit genutzt werden, und FLUX gehört zu den fortschrittlichsten generativen Systemen der Welt. Mit Hauptsitz in Freiburg, Deutschland, und einer wachsenden Präsenz in San Francisco, wachsen wir schnell, während wir uns treu bleiben: Forschungsexzellenz, offene Wissenschaft und der Aufbau von Technologien, die die menschliche Kreativität erweitern.
Warum diese Rolle
Vision-Sprachmodelle (VLM) werden grundlegend dafür, wie Menschen mit generativer KI interagieren – aber die meisten VLM-Forschungen erfolgen isoliert vom Generierungsstapel. Bei Black Forest Labs integrieren wir VLMs direkt in FLUX auf eine Weise, die unsere Modelle leistungsfähiger, kontrollierbarer und besser auf die Bedürfnisse der Kreativen abgestimmt macht. Diese Rolle dreht sich um die Pionierarbeit dieser Integration. Sie werden keine handelsüblichen VLMs anwenden – Sie entwickeln neuartige Ansätze, innovieren an Architekturen und beantworten Fragen, die bisher ungelöst sind: wie sich visuelle und sprachliche Darstellungen gegenseitig beeinflussen, wie multimodales Verständnis die Generierungsqualität verbessert und wie diese Fähigkeiten skalierbar gemacht werden können, ohne das Besondere an FLUX zu beeinträchtigen. Dies ist eine Staff / Senior IC-Rolle. Wir suchen jemanden, der ein VLM vortrainiert oder erheblich weiterentwickelt hat, nicht nur feinjustiert.
Woran Sie arbeiten werden
- Leitung der Entwicklung und des Trainings von hochmodernen multimodalen Vision-Sprachmodellen innerhalb des FLUX-Stacks – Innovation an Architekturen, nicht nur Anwendung bestehender Modelle
- Entwicklung von Feinabstimmungsstrategien, die VLMs an spezialisierte kreative Anwendungsfälle (Beschriftung, Bearbeitungsanweisungen, Auffrischung von Eingabeaufforderungen) anpassen, die allgemeine Modelle nicht bewältigen können
- Forschung zu Integrationen zwischen VLM/LLM-Fähigkeiten und unseren Diffusions- und Fluss-Pipelines – kreative Wege finden, um die Generierungsqualität und Kontrollierbarkeit ohne rechnerische Engpässe zu verbessern
- Bewertung neuer multimodaler Architekturen und Übersetzung der besten aktuellen Forschung in praktische Verbesserungen
Was wir suchen
- Sie haben ein VLM vortrainiert oder erheblich weiterentwickelt (nicht nur SFT'd oder LoRA'd), das in einem Produktionssystem eingesetzt oder öffentlich veröffentlicht wurde
- Starke Publikationsbilanz oder unmissverständliche Produktionsbilanz, die zeigt, dass Sie die Grenzen multimodaler Architekturen verschieben
- Tiefes Verständnis dafür, wie visuelle und sprachliche Darstellungen interagieren: Tokenisierung, Ausrichtung, Verankerung, cross-modale Aufmerksamkeit und die Fehlerarten jeder einzelnen
- Erfahrung mit verteiltem Training im Multi-Node-Maßstab
- Komfortabel an der Grenze zwischen Forschung und Produktion – Ihnen ist wichtig, ob die Arbeit ausgeliefert wird und verallgemeinert, nicht nur, ob sie gut lesbar ist
- Erfahrung mit Diffusions- oder flussbasierten generativen Modellen ist ein großer Vorteil – insbesondere wenn Sie darüber nachgedacht haben, wie autoregressive und Diffusionsparadigmen zusammenspielen können
Wie wir zusammenarbeiten
Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) in Freiburg oder SF bei uns sein oder remote arbeiten mit einer monatlichen persönlichen Woche, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir glauben, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass sie für alle zugänglich sind. Wir werden besprechen, wie dies für die Rolle während unseres Interviewprozesses aussehen wird.
Alles, was wir tun, basiert auf vier Werten:
- Besessen. Wir sind ein Forschungsinstitut an der Front. Die Wissenschaft muss stimmen, das Verständnis tief, das Produkt schön.
- Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt. Niemand steht über einer Aufgabe.
- Mutig. Wir gehen die ambitionierte Wette ein. Wir liefern, wir warten nicht darauf, dass die Bedingungen perfekt sind.
- Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme. Handlungsmacht ohne Empathie schafft Chaos.
Wenn sich das nach Arbeit anhört, die Ihnen Freude bereiten würde, würden wir uns freuen, von Ihnen zu hören.
Member of Technical Staff - VLM Arbeitgeber: Black Forest Labs
Kontaktperson:
Black Forest Labs HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Member of Technical Staff - VLM
✨Tipp Nummer 1
Mach dir ein starkes Netzwerk! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe mit Coding-Challenges und technischen Fragen, die für die Rolle relevant sind. Wir können dir helfen, die besten Ressourcen zu finden!
✨Tipp Nummer 3
Zeige deine Leidenschaft für das Thema! Sprich über deine Projekte und Erfahrungen, die zeigen, dass du wirklich für VLMs brennst. Lass uns gemeinsam an deiner Präsentation arbeiten!
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt. Wir freuen uns darauf, von dir zu hören!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Member of Technical Staff - VLM
Tipps für deine Bewerbung 🫡
Sei authentisch!: Zeig uns, wer du wirklich bist! Deine Persönlichkeit und Leidenschaft für VLMs sollten in deiner Bewerbung deutlich werden. Lass uns wissen, warum du dich für diese Rolle interessierst und was dich motiviert.
Betone deine Erfahrungen: Wenn du bereits an VLMs gearbeitet hast, erzähl uns davon! Hebe deine spezifischen Projekte und Erfolge hervor, die zeigen, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Erfahrung in der Entwicklung und dem Training von Modellen.
Forschung und Innovation: Wir suchen nach jemandem, der die Grenzen des Möglichen verschiebt. Teile deine Ideen und Ansätze, wie du VLMs innovativ in unsere FLUX-Architektur integrieren würdest. Zeig uns, dass du kreativ denkst und bereit bist, neue Wege zu gehen.
Bewirb dich über unsere Website: Der einfachste Weg, um Teil unseres Teams zu werden, ist, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell und effizient bearbeitet wird. Wir freuen uns darauf, von dir zu hören!
Wie du dich auf ein Vorstellungsgespräch bei Black Forest Labs vorbereitest
✨Verstehe die Technologien
Mach dich mit den Technologien vertraut, die Black Forest Labs entwickelt. Lies über Latent Diffusion und Stable Diffusion, um ein tiefes Verständnis für die Modelle zu bekommen, die du möglicherweise weiterentwickeln wirst. Zeige im Interview, dass du nicht nur die Grundlagen kennst, sondern auch, wie sie in der Praxis angewendet werden.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Forschungsergebnisse, bei denen du VLMs signifikant vorangetrieben hast. Sei bereit, diese Erfahrungen detailliert zu erläutern und zu zeigen, wie deine Ansätze innovative Lösungen hervorgebracht haben. Das wird dir helfen, deine Expertise zu untermauern.
✨Fragen zur Teamdynamik
Bereite Fragen vor, die sich auf die Teamkultur und die Arbeitsweise bei Black Forest Labs beziehen. Zeige Interesse an der Zusammenarbeit im Team und wie du dich in die bestehende Struktur einfügen kannst. Das zeigt, dass du nicht nur an der Technik interessiert bist, sondern auch an der Zusammenarbeit mit anderen.
✨Sei bereit für technische Herausforderungen
Erwarte technische Fragen oder Aufgaben während des Interviews, die dein Wissen über multimodale Architekturen testen. Übe, wie du komplexe Probleme angehst und erkläre deine Denkweise klar und strukturiert. Das wird dir helfen, deine Problemlösungsfähigkeiten zu demonstrieren.