Auf einen Blick
- Aufgaben: Verbessere die Leistung und Stabilität von großangelegten Trainingssystemen für generative Modelle.
- Unternehmen: Innovatives Forschungslabor, das an bahnbrechenden Technologien arbeitet.
- Vorteile: Attraktives Gehalt, Aktienoptionen und flexible Arbeitsmodelle.
- Weitere Informationen: Dynamisches Team mit Möglichkeiten zur persönlichen und beruflichen Weiterentwicklung.
- Warum dieser Job: Arbeite an der Spitze der KI-Forschung und gestalte die Zukunft der Bild- und Videoerstellung.
- Qualifikationen: Erfahrung in der Arbeit mit großen Trainingssystemen und starke PyTorch-Kenntnisse.
Über Black Forest Labs
Wir sind das Team hinter Latent Diffusion, Stable Diffusion und FLUX – grundlegende Technologien, die verändert haben, wie die Welt Bilder und Videos erstellt. Wir entwickeln die generativen Modelle, die die Art und Weise, wie Menschen Bilder und Videos erstellen, antreiben – Werkzeuge, die von Millionen von Kreativen, Entwicklern und Unternehmen weltweit genutzt werden. Unsere FLUX-Modelle gehören zu den fortschrittlichsten der Welt, und wir stehen erst am Anfang. Mit Hauptsitz in Freiburg, Deutschland, und einer wachsenden Präsenz in San Francisco, wachsen wir schnell, während wir uns treu bleiben: Forschungsexzellenz, offene Wissenschaft und der Aufbau von Technologien, die die menschliche Kreativität erweitern.
Warum diese Rolle
Das Training in großem Maßstab ist der Ort, an dem Forschungsideen real werden und wo viele der schwierigsten Probleme nicht mehr klar in „Forschung“ oder „Ingenieurwesen“ unterteilt sind. Eine vielversprechende Architektur ist nur dann von Bedeutung, wenn wir sie stabil, effizient und korrekt über große GPU-Flotten trainieren können. In dieser Rolle werden Sie in das Produktionstraining eingebettet und helfen dort, wo die schwierigsten System- und Leistungsprobleme auftreten: Aufmerksamkeitsleistung, benutzerdefinierte Kerne, Low-Precision-Training, Profilierung, Speicherverhalten, Datenbewegung, Stabilität des verteilten Trainings und Durchsatzregressionen. Sie arbeiten direkt mit Forschern zusammen, aber Ihr Output wird oft Code, Messungen, Kerne, Debugging-Tools und Änderungen am Trainingssystem sein, die bessere Forschung ermöglichen. Wir sind offen für eine Reihe von Erfahrungsgraden für diese Rolle. Der gemeinsame Nenner ist tiefes technisches Eigentum: Sie sollten in der Lage sein, Fortschritte bei mehrdeutigen Problemen im Trainingssystem zu erzielen, Ihre Ergebnisse zu überprüfen und das Ergebnis zu verantworten.
Woran Sie arbeiten werden
- Verbesserung der Leistung, Zuverlässigkeit und numerischen Stabilität von Produktionstrainingsläufen für große multimodale generative Modelle
- Profilierung vollständiger Trainingsschritte über Modellcode, Aufmerksamkeit, Kerne, Datenladung, Encoder, Kommunikation, Optimierungsschritte, Checkpointing und Speicherbelastung
- Implementierung und Validierung von GPU-Optimierungen auf Ebene der GPU: fusionierte Kerne, Aufmerksamkeitswege, Low-Precision-Matmuls, Quantisierungskerne, CUDA/Triton/CuTe/CUTLASS-Experimente und No-Compile-Alternativen, wo es sinnvoll ist
- Vorantreiben des Low-Precision-Trainings, einschließlich FP8 / MXFP8 / FP4-Stilen, Gewicht- und Aktivierungsquantisierung, Akkumulationsentscheidungen, Konvergenzrisiken und Qualitätskompromissen im Vergleich zu Basistrainingsläufen
- Zusammenarbeit mit Forschern, um Architekturänderungen in effiziente Trainingsimplementierungen zu übersetzen und echte Fortschritte in der Modellqualität von Änderungen zu unterscheiden, die nur in einem Mikrobenchmark gut aussehen
- Debugging von Fehlern im verteilten Training: NaNs, Verlustspitzen, stiller numerischer Drift, Speicherlecks, Stragglers, fehlerhafte Knoten, NCCL-Probleme und Durchsatzklippen
- Aufbau von Benchmarking- und Profilierungswerkzeugen, die Leistungsansprüche über Hardware, Formen, Sequenzlängen und Trainingskonfigurationen vertrauenswürdig machen
- Hilfe für das Trainingsteam, schnell zu handeln, wenn ein dringender Engpass auftritt, während wiederholte Fehler in bessere Abstraktionen und Werkzeuge umgewandelt werden
Was wir suchen
- Erfahrung in der tiefen Arbeit an groß angelegten Trainingssystemen, idealerweise als Teil einer Trainingsgruppe, die eng mit Forschern zusammenarbeitet
- Starke PyTorch-Flüssigkeit, einschließlich der Fähigkeit, niedrigstufigen Trainingscode zu lesen und zu ändern, anstatt nur hochgradige APIs zu verwenden
- Erfahrung mit Konzepten des verteilten Trainings wie FSDP, Tensor-/Modell-/Kontext-/Sequenzparallelismus, Aktivierungs-Checkpointing, NCCL und Überlappung von Berechnung und Kommunikation
- Praktische Erfahrung in der Verbesserung des Trainingsdurchsatzes, des Speicherbedarfs oder der Stabilität in realen Trainingsläufen
- Erfahrung in der Profilierung von GPU-Workloads mit Tools wie Nsight Systems, Nsight Compute, Torch Profiler, Trace Viewers oder benutzerdefinierter Telemetrie
- Praktisches Urteilsvermögen zur GPU-Leistung: Sie können moderne Codierungsagenten und -tools so viel verwenden, wie Sie möchten, aber Sie müssen das Verständnis haben, um Korrektheit, numerisches Verhalten und Leistung zu überprüfen und das Ergebnis zu verantworten
- Verständnis der Kompromisse beim Low-Precision-Training und der Quantisierung: FP8, MXFP8, FP4/NVFP4-Stile, Skalierung, Akkumulation, numerische Validierung und Konvergenzrisiko
- Gutes Forschungsurteil: Sie können mit Forschern an Ablationen zusammenarbeiten, verstehen, was die Messungen beweisen und was nicht, und die Optimierungsarbeit an die Ergebnisse der Modellqualität binden
- Komfortables Arbeiten in Mehrdeutigkeit: Manchmal ist die Aufgabe eine saubere Implementierung, manchmal ein Produktionsfeuer, und manchmal herauszufinden, welche von drei plausiblen Erklärungen tatsächlich wahr ist
Wir wären besonders begeistert, wenn Sie:
- Das Training eines Grenzmodell, das versendet oder eine wichtige Veröffentlichung erreicht hat, unterstützt oder mitbesessen haben
- Vorwärts-/Rückwärts-GPU-Kerne geschrieben oder erheblich verbessert haben oder gezeigt haben, dass Sie Fortschritte bei der Arbeit auf Kernel-Ebene mit starker Mess- und Validierungsdisziplin machen können
- An der Aufmerksamkeitsleistung, dem Training variabler Sequenzlängen oder nicht-standardisierten Aufmerksamkeitsmustern gearbeitet haben
- Erfahrung mit Hopper- oder Blackwell-Klassen-GPUs haben
- An Low-Precision-Training gearbeitet haben
- Erfahrung mit Diffusion, Flussanpassung, DiT und multimodalem generativem Modelltraining haben; wenn Ihr tiefstes Wissen in autoregressiven oder LLM-Trainingssystemen liegt, sind Sie bereit, schnell den Diffusions- und multimodalen Modellierungsstapel zu lernen
- Natürlich zwischen Profiler-Traces, Kernel-Code, Fehlern in verteilten Systemen und Forschungsdiskussionen wechseln können
Wie wir zusammenarbeiten
Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) in Freiburg oder SF bei uns sein oder remote arbeiten mit einer monatlichen persönlichen Woche, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir denken, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass sie für alle zugänglich sind. Wir werden besprechen, wie dies für die Rolle während unseres Interviewprozesses aussehen wird.
Alles, was wir tun, basiert auf vier Werten:
- Besessen. Wir sind ein Grenzforschungsinstitut. Die Wissenschaft muss richtig sein, das Verständnis tief, das Produkt schön.
- Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt. Niemand steht über einer Aufgabe.
- Mutig. Wir gehen die ambitionierte Wette ein. Wir versenden, wir warten nicht darauf, dass die Bedingungen perfekt sind.
- Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme. Handlung ohne Empathie schafft Chaos.
Wenn sich das nach Arbeit anhört, die Ihnen Freude bereiten würde, würden wir uns freuen, von Ihnen zu hören.
Jahresgrundgehalt: US $180.000 - $290.000 + Eigenkapital
Member of Technical Staff - Research Engineer Arbeitgeber: Black Forest Labs
Black Forest Labs ist ein hervorragender Arbeitgeber, der eine inspirierende Arbeitsumgebung in Freiburg bietet, wo Forschungsexzellenz und offene Wissenschaft im Mittelpunkt stehen. Unsere Mitarbeiter profitieren von einer Kultur, die Kreativität fördert, sowie von umfangreichen Wachstums- und Entwicklungsmöglichkeiten in einem dynamischen Team, das an der Spitze der Technologie steht. Zudem ermöglichen wir flexible Arbeitsmodelle und unterstützen persönliche Verbindungen durch regelmäßige persönliche Treffen.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Member of Technical Staff - Research Engineer erhalten könnten
✨Sei aktiv in lokalen Datenbank-Communities
Schau dir lokale Meetup-Gruppen oder Online-Communities an, die sich mit Datenbanken beschäftigen. Dort kannst du nicht nur dein Netzwerk erweitern, sondern auch wertvolle Kontakte knüpfen, die dir bei der Jobsuche helfen können. Viele Unternehmen schätzen Empfehlungen aus diesen Communities.
✨Zeige deine Skills in Open-Source-Projekten
Beteilige dich an Open-Source-Projekten, die mit Datenbanken arbeiten. So kannst du deine Fähigkeiten unter Beweis stellen und gleichzeitig einen beeindruckenden Portfoliobereich aufbauen, den du potenziellen Arbeitgebern präsentieren kannst.
✨Besuche Jobmessen und Recruiting-Events
Jobmessen sind eine großartige Gelegenheit, um direkt mit Unternehmen in Kontakt zu treten. Informiere dich über lokale Jobmessen, die sich auf Tech- und Datenbankrollen konzentrieren, und bereite uns vor, um unseren Lebenslauf und unser Interesse an der Rolle zu präsentieren.
✨Bewirb dich direkt bei Black Forest Labs
Wir empfehlen dir, auch direkt über unsere Website bei Black Forest Labs für die Stelle als Member of Technical Staff - Research Engineer zu bewerben. Zeig uns deine Leidenschaft für Datenbanken und warum du Teil unseres Teams werden möchtest. Jede Bewerbung zählt!
Wir glauben, dass du diese Fähigkeiten brauchst, um Member of Technical Staff - Research Engineer mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Datenbank-Skills hervorheben:In deinem Lebenslauf solltest du unbedingt deine Erfahrungen mit verschiedenen Datenbankmanagementsystemen (DBMS) wie MySQL, PostgreSQL oder MongoDB betonen. Wenn du spezielle Projekte oder Aufgaben in deinem letzten Job hast, die deine Fähigkeiten im Umgang mit Datenbanken zeigen, nenn diese unbedingt!
Projekte und Zertifikate erwähnen:Falls du an relevanten Projekten oder Kursen in Bezug auf Datenbanken teilgenommen hast, pack sie in dein Portfolio oder erwähne sie in deinem Anschreiben. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Anwendungskonzepte beherrschst!
Motivation und Teamfähigkeit zeigen:Da du dich auf eine Vollzeitstelle bewirbst, ist es wichtig, dass du in deinem Anschreiben deutlich machst, warum du leidenschaftlich an der Arbeit mit Datenbanken interessiert bist und wie gut du im Team arbeiten kannst. Unternehmen suchen oft nach Mitarbeitern, die auch über die technischen Fähigkeiten hinaus ins Team passen.
Die richtige Struktur im Lebenslauf:Gestalte deinen Lebenslauf klar und strukturiert – in der Datenbankbranche kommt es nicht nur auf die Inhalte an, sondern auch auf die Art und Weise, wie du sie präsentierst. Nutze klare Überschriften und Absätze, um deine Fähigkeiten und Erfahrungen hervorzuheben. Und vergiss nicht, dein Lebenslauf sollte so aufbereitet sein, dass man sofort erkennt, dass du ein wahres Datenbanktalent bist!
Wie man sich auf ein Vorstellungsgespräch bei Black Forest Labs vorbereitet
✨Sei bereit für technische Fragen zur Datenbankverwaltung
Egal, ob es um SQL-Abfragen, Datenmodellierung oder Performance-Optimierung geht, du solltest die Grundlagen perfekt beherrschen. Bereite dich darauf vor, praktische Probleme zu lösen und deine Lösungsansätze zu erklären – das zeigt, dass du nicht nur Theorie kennst, sondern auch praktisch umgehen kannst!
✨Portfolio nicht vergessen!
Wenn du bereits an Datenbankprojekten gearbeitet hast, bringe Beispiele mit, die deine Fähigkeiten zeigen. Zeige, wie du Probleme gelöst hast und wie deine Ansätze zur Effizienz der Datenbank beigetragen haben. Ein starkes Portfolio kann dich von anderen Kandidaten abheben!
✨Verstehe die spezifischen Tools der Branche
Je nach Black Forest Labs könnte es sein, dass ihr spezifische Datenbankmanagementsysteme nutzt. Mach dich mit diesen vertraut und zeige dein Wissen über die neuesten Tools und Technologien. Das zeigt, dass du aufmerksam bist und dich bereits mit ihrer Arbeitsweise beschäftigt hast.
✨Motivation und Entwicklung in den Vordergrund stellen
Da es sich um eine Vollzeitstelle handelt, wollen sie wissen, dass du langfristig motiviert bist. Erkläre, warum dich die Arbeit in der Datenbankverwaltung begeistert und wie du deine Fähigkeiten weiterentwickeln möchtest, um einen Mehrwert für Black Forest Labs zu schaffen.