Member of Technical Staff - Infrastructure Engineer

Member of Technical Staff - Infrastructure Engineer

Vollzeit 100000 - 230000 € / Jahr (geschätzt) Kein Homeoffice möglich
B

Auf einen Blick

  • Aufgaben: Wartung und Skalierung der Forschungsinfrastruktur sowie Optimierung der Systemkomponenten.
  • Unternehmen: Black Forest Labs ist bekannt für Technologien wie Latent Diffusion und Stable Diffusion.
  • Vorteile: Jahresgehalt zwischen 100.000 € und 230.000 € in der EU plus Equity.
  • Weitere Informationen: Hybridmodell mit Büros in Freiburg und San Francisco.
  • Warum dieser Job: Arbeiten Sie an fortschrittlichen Modellen zur Entwicklung visueller Intelligenz.
  • Qualifikationen: Erfahrung mit großen Trainingsplattformen und verteilten Systemen ist erforderlich.

Das prognostizierte Gehalt liegt zwischen 100000 - 230000 € pro Jahr.

Über Black Forest Labs

Wir sind das Team hinter Latent Diffusion, Stable Diffusion und FLUX – grundlegende Technologien, die verändert haben, wie die Welt Bilder und Videos erstellt. Wir entwickeln die generativen Modelle, die die Art und Weise, wie Menschen Bilder und Videos erstellen, antreiben – Werkzeuge, die von Millionen von Kreativen, Entwicklern und Unternehmen weltweit genutzt werden. Unsere FLUX-Modelle gehören zu den fortschrittlichsten der Welt, und wir fangen gerade erst an. Mit Hauptsitz in Freiburg, Deutschland, und einer wachsenden Präsenz in San Francisco, wachsen wir schnell, während wir uns treu bleiben: Forschungsexzellenz, offene Wissenschaft und der Aufbau von Technologien, die die menschliche Kreativität erweitern.

Warum diese Rolle

Wir suchen Ingenieure, die die Engine aufbauen und warten, die unsere Mission zur Entwicklung visueller Intelligenz antreibt. Von der Wartung und Skalierung von Clustern bis hin zum Aufbau von Forschungsplattformen zur Beschleunigung des Innovationsprozesses operiert dieses Team mit großer Breite und Tiefe. Wir bauen Systeme, die mehrwöchiges Training möglich machen, um Ressourcen in großem Maßstab zu orchestrieren und gleichzeitig effizient zu arbeiten, was das nächste bahnbrechende Modell ermöglicht. Wenn Sie besessen von verteilten Systemen im großen Maßstab, Infrastrukturzuverlässigkeit, Skalierbarkeit, Sicherheit und kontinuierlicher Verbesserung sind, wäre dieses Team perfekt für Sie.

Woran Sie arbeiten werden

  • Wartung der Forschungsinfrastruktur, Sicherstellung der Gesundheit und Optimierung der Komponenten zur Maximierung der Leistung des Systems (sowohl auf Anwendungs- als auch auf Infrastrukturseite)
  • Skalierung der Infrastruktur, um den wachsenden Forschungsanforderungen gerecht zu werden, während Zuverlässigkeit und Leistung aufrechterhalten werden
  • Zusammenarbeit mit Forschungsteams, um ihre Infrastrukturbedürfnisse tiefgehend zu verstehen und Lösungen zu entwerfen, die Leistung mit Kosteneffizienz in Einklang bringen
  • Identifizierung und Behebung von Leistungsengpässen und Kapazitäts-Hotspots durch tiefgehende Analyse verteilter Systeme im großen Maßstab
  • Aufbau und Weiterentwicklung von Telemetrie- und Überwachungssystemen, um tiefe Einblicke in die Infrastrukturleistung, -nutzung und -kosten über unsere Cloud- und Rechenzentrumsflotten zu bieten
  • Teilnahme an Bereitschaftsdiensten und Vorfallreaktionen zur Aufrechterhaltung der Systemzuverlässigkeit

Technischer Fokus

  • Python, Bash, Go
  • Kubernetes
  • Nvidia GPU-Treiber und -Operatoren
  • OTel, Prometheus

Was wir suchen

  • Erfahrung im Aufbau oder Betrieb von groß angelegten Trainingsplattformen
  • Erfahrung mit großen Compute-Clustern (GPUs)
  • Nachgewiesene Fähigkeit, Leistungs- und Zuverlässigkeitsprobleme über große verteilte Flotten zu debuggen
  • Starke Problemlösungsfähigkeiten und die Fähigkeit, unabhängig zu arbeiten
  • Starke Kommunikationsfähigkeiten und die Fähigkeit, effektiv mit internen und externen Partnern zusammenzuarbeiten
  • Tiefes Wissen über moderne Cloud-Infrastruktur, einschließlich Kubernetes, Infrastructure as Code, AWS und GCP
  • Erfahrung mit SLURM

Wie wir zusammenarbeiten

Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) bei uns in Freiburg oder SF sein oder remote arbeiten mit einer monatlichen persönlichen Woche, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir glauben, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass sie für alle zugänglich sind. Wir werden besprechen, wie dies für die Rolle während unseres Interviewprozesses aussehen wird.

Alles, was wir tun, basiert auf vier Werten:

  • Besessen. Wir sind ein Forschungsinstitut an der Front. Die Wissenschaft muss stimmen, das Verständnis tief, das Produkt schön sein.
  • Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt. Niemand steht über einer Aufgabe.
  • Mutig. Wir gehen das ehrgeizige Risiko ein. Wir liefern, wir warten nicht darauf, dass die Bedingungen perfekt sind.
  • Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme. Handlung ohne Empathie schafft Chaos.

Wenn sich das nach Arbeit anhört, die Ihnen Freude bereiten würde, würden wir uns freuen, von Ihnen zu hören.

Basisjahresgehalt: EU €100.000 - €230.000 + Eigenkapital US $150.000 - $300.000 + Eigenkapital Diese Rolle basiert in unserem Büro in Freiburg / San Francisco. Wir betreiben ein hybrides Modell und übernehmen angemessene Reisekosten – eine Umsiedlung wird empfohlen, aber nicht erforderlich. Wir erwarten jedoch eine bedeutende persönliche Präsenz, und wir werden besprechen, wie das für Ihre Situation während des Prozesses aussieht.

Member of Technical Staff - Infrastructure Engineer Arbeitgeber: BlackForestLabs

Black Forest Labs hat seinen Sitz in Freiburg, Deutschland, und fördert eine Kultur der offenen Wissenschaft. Das Unternehmen bietet ein wettbewerbsfähiges Gehalt und Equity-Optionen. Das Team ist auf Forschungsexzellenz fokussiert und arbeitet an innovativen Technologien zur Erweiterung menschlicher Kreativität.

B

Kontaktdaten:

BlackForestLabs Recruiting-Team

Wir glauben, dass du diese Fähigkeiten brauchst, um Member of Technical Staff - Infrastructure Engineer mit Bravour zu bestehen

Python
Bash
Go
Kubernetes
Nvidia GPU-Treiber und Operatoren
OTel
Prometheus