Member of Technical Staff - ML Infrastructure Engineer
Member of Technical Staff - ML Infrastructure Engineer

Member of Technical Staff - ML Infrastructure Engineer

San Francisco Vollzeit Home Office möglich (teilweise)
Go Premium
B

Auf einen Blick

  • Aufgaben: Entwickle und verwalte ML-Infrastruktur für bahnbrechende KI-Forschung.
  • Arbeitgeber: Innovatives Unternehmen, das die Welt der Bild- und Videoerstellung revolutioniert.
  • Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten und Reisekostenerstattung.
  • Andere Informationen: Dynamisches Team mit Fokus auf Zusammenarbeit und persönlichem Wachstum.
  • Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten mit echten Auswirkungen.
  • Gewünschte Qualifikationen: Erfahrung in der Verwaltung von ML-Infrastruktur und Cloud-Plattformen.

Über Black Forest Labs

Wir sind das Team hinter Latent Diffusion, Stable Diffusion und FLUX – grundlegende Technologien, die die Art und Weise verändert haben, wie die Welt Bilder und Videos erstellt. Wir entwickeln die generativen Modelle, die die Art und Weise bestimmen, wie Menschen Bilder und Videos erstellen – Werkzeuge, die von Millionen von Kreativen, Entwicklern und Unternehmen weltweit genutzt werden. Unsere FLUX-Modelle gehören zu den fortschrittlichsten der Welt, und wir stehen erst am Anfang. Mit Hauptsitz in Freiburg, Deutschland, und einer wachsenden Präsenz in San Francisco wachsen wir schnell, während wir uns treu bleiben: Forschungsexzellenz, offene Wissenschaft und der Aufbau von Technologien, die die menschliche Kreativität erweitern.

Warum diese Rolle

Sie entwerfen, implementieren und warten die ML-Infrastruktur, die die Forschung im Bereich KI ermöglicht. Dies ist keine abstrakte Systemarbeit – jede Entscheidung, die Sie treffen, hat direkte Auswirkungen darauf, ob ein mehrwöchiger Trainingslauf erfolgreich ist, ob die Inferenz schnell genug für die Produktion bleibt oder ob Forscher schnell iterieren können oder Stunden auf Ressourcen warten müssen.

Woran Sie arbeiten werden

  • Entwurf, Implementierung und Wartung von cloudbasierten ML-Trainingsclustern (Slurm) und Inferenzclustern (Kubernetes), auf die Forscher und Produkte angewiesen sind.
  • Implementierung und Verwaltung netzwerkbasierter Cloud-Dateisysteme und Blob/S3-Speicherlösungen, die für ML-Workloads in großem Maßstab optimiert sind.
  • Entwicklung und Wartung von Infrastructure as Code (IaC) für die Ressourcenbereitstellung.
  • Implementierung und Optimierung von CI/CD-Pipelines für ML-Workflows.
  • Entwurf und Implementierung benutzerdefinierter Autoskalierungslösungen für ML-Workloads.
  • Sicherstellung von Sicherheitsbest Practices über den gesamten ML-Infrastruktur-Stack.
  • Bereitstellung entwicklerfreundlicher Tools und Praktiken, die ML-Operationen effizient machen.

Was wir suchen

Sie haben ML-Infrastruktur in großem Maßstab aufgebaut und verwaltet und verstehen, dass die Unterstützung der KI-Forschung grundlegend anders ist als die traditionelle Cloud-Infrastruktur. Sie haben möglicherweise Folgendes:

  • Starke Kenntnisse in Cloud-Plattformen (AWS, Azure oder GCP) mit Fokus auf ML/AI-Dienste.
  • Umfangreiche Erfahrung mit Kubernetes und Slurm-Clusterverwaltung in Produktionsumgebungen.
  • Expertise in Infrastructure as Code-Tools (Terraform, Ansible usw.).
  • Nachweisliche Erfolge bei der Verwaltung und Optimierung netzwerkbasierter Cloud-Dateisysteme und Objektspeicher für ML-Workloads.
  • Erfahrung mit CI/CD-Tools und -Praktiken (CircleCI, GitHub Actions, ArgoCD usw.) in ML-Kontexten.
  • Starkes Verständnis von Sicherheitsprinzipien und Best Practices in Cloud-Umgebungen.
  • Erfahrung mit Überwachungs- und Beobachtbarkeitstools (Prometheus, Grafana, Loki usw.).
  • Vertrautheit mit ML-Workflows und GPU-Infrastrukturmanagement.
  • Nachgewiesene Fähigkeit, komplexe Migrationen und Änderungen in Produktionsumgebungen zu bewältigen.

Wir wären besonders begeistert, wenn Sie:

  • Erfahrung im Aufbau benutzerdefinierter Autoskalierungslösungen für ML-Workloads haben.
  • Kenntnisse über Kostenoptimierungsstrategien für cloudbasierte ML-Infrastruktur mitbringen.
  • Mit MLOps-Praktiken und -Tools vertraut sind.
  • Erfahrung mit Hochleistungsrechnerumgebungen (HPC) haben.
  • Datenversionierung und Experimentverfolgung für ML verstehen.
  • Netzwerkoptimierungstechniken für verteiltes ML-Training kennen.
  • Mit Multi-Cloud- oder Hybrid-Cloud-Architekturen gearbeitet haben.
  • Mit Container-Sicherheits- und Schwachstellenscanning-Tools vertraut sind.

Wie wir zusammenarbeiten

Wir sind ein verteiltes Team mit echten Büros, die die Leute tatsächlich nutzen. Je nach Ihrer Rolle werden Sie entweder mindestens 2 Tage pro Woche (oder eine volle Woche alle zwei Wochen) in Freiburg oder SF bei uns sein oder remote arbeiten mit einem monatlichen persönlichen Treffen, um verbunden zu bleiben. Wir übernehmen angemessene Reisekosten, um dies zu ermöglichen. Wir denken, dass persönliche Zeit wichtig ist, und haben die Dinge so strukturiert, dass sie für alle zugänglich sind. Wir werden besprechen, wie dies für die Rolle während unseres Interviewprozesses aussehen wird.

Alles, was wir tun, basiert auf vier Werten:

  • Besessenheit. Wir sind ein Forschungsinstitut an der Front. Die Wissenschaft muss stimmen, das Verständnis tief und das Produkt schön sein.
  • Niedriger Ego. Die Arbeit spricht. Die beste Idee gewinnt, egal wer sie gesagt hat. Anerkennung wird geteilt.
  • Mutig. Wir setzen auf das Ambitionierte. Wir liefern, wir warten nicht auf perfekte Bedingungen.
  • Freundlich. Menschen über Politik. Wir behandeln uns gegenseitig mit echter Wärme.

Wenn sich das nach Arbeit anhört, die Ihnen Freude bereiten würde, würden wir uns freuen, von Ihnen zu hören.

Jahresgrundgehalt: 180.000–300.000 USD

Wir sind in Europa ansässig und schätzen Tiefe über Lärm, Zusammenarbeit über Held*innenkultur und ehrliche technische Gespräche über Hype.

Member of Technical Staff - ML Infrastructure Engineer Arbeitgeber: Black Forest Labs

Black Forest Labs ist ein hervorragender Arbeitgeber, der eine inspirierende Arbeitsumgebung in Freiburg bietet, wo Innovation und Kreativität im Mittelpunkt stehen. Mit einem starken Fokus auf Forschungsexzellenz und offener Wissenschaft fördern wir eine Kultur des Lernens und der Zusammenarbeit, die es unseren Mitarbeitern ermöglicht, sich kontinuierlich weiterzuentwickeln. Unsere flexiblen Arbeitsmodelle und die Möglichkeit, an bahnbrechenden Technologien zu arbeiten, machen uns zu einem attraktiven Ort für talentierte Fachkräfte, die einen bedeutungsvollen Beitrag zur Zukunft der KI leisten möchten.
B

Kontaktperson:

Black Forest Labs HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Member of Technical Staff - ML Infrastructure Engineer

Tipp Nummer 1

Mach dir ein starkes Netzwerk! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe mit Coding-Challenges und sei bereit, deine Erfahrungen im Bereich ML-Infrastruktur zu teilen. Wir können dir helfen, die besten Ressourcen zu finden!

Tipp Nummer 3

Zeig deine Leidenschaft für ML und AI! Teile Projekte oder Beiträge, die du gemacht hast, um dein Wissen zu demonstrieren. Lass uns wissen, wenn du Hilfe beim Erstellen deines Portfolios brauchst!

Tipp Nummer 4

Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtigen Leute erreicht. Wir freuen uns darauf, von dir zu hören!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Member of Technical Staff - ML Infrastructure Engineer

Cloud-Plattformen (AWS, Azure, GCP)
Kubernetes
Slurm Cluster Management
Infrastructure as Code (Terraform, Ansible)
Netzwerkbasierte Cloud-Dateisysteme
CI/CD-Tools (CircleCI, GitHub Actions, ArgoCD)
Sicherheitsprinzipien in Cloud-Umgebungen
Überwachungs- und Observabilitätswerkzeuge (Prometheus, Grafana, Loki)
GPU-Infrastrukturmanagement
MLOps-Praktiken und -Werkzeuge
Hochleistungsrechnen (HPC) Umgebungen
Datenversionierung und Experimentverfolgung
Netzwerkoptimierungstechniken für verteiltes ML-Training
Multi-Cloud oder Hybrid-Cloud-Architekturen
Container-Sicherheit und Schwachstellenscanning

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für ML-Infrastruktur haben und das auch in ihren Worten ausdrücken können.

Mach es konkret!: Verwende konkrete Beispiele aus deiner bisherigen Erfahrung, um zu zeigen, wie du ML-Infrastruktur aufgebaut und verwaltet hast. Erzähl uns von Herausforderungen, die du gemeistert hast, und wie du Lösungen gefunden hast.

Pass auf die Details auf!: Achte darauf, dass deine Bewerbung gut strukturiert und fehlerfrei ist. Ein klarer und präziser Schreibstil zeigt uns, dass du Wert auf Qualität legst – genau wie wir bei StudySmarter.

Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und unkompliziert bei uns ankommt. Wir freuen uns darauf, von dir zu hören!

Wie du dich auf ein Vorstellungsgespräch bei Black Forest Labs vorbereitest

Verstehe die Technologie

Mach dich mit den spezifischen Technologien vertraut, die Black Forest Labs verwendet, wie Kubernetes und Slurm. Zeige im Interview, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast, die du in deine Antworten einfließen lassen kannst.

Bereite konkrete Beispiele vor

Denke an konkrete Situationen, in denen du ML-Infrastruktur erfolgreich entworfen oder optimiert hast. Sei bereit, diese Beispiele zu teilen, um deine Fähigkeiten und Erfahrungen zu untermauern. Das zeigt, dass du die Herausforderungen verstehst, die mit der Unterstützung von AI-Forschung verbunden sind.

Fragen stellen

Bereite einige durchdachte Fragen vor, die zeigen, dass du dich mit der Unternehmenskultur und den Projekten von Black Forest Labs auseinandergesetzt hast. Fragen zur Teamdynamik oder zu aktuellen Herausforderungen im Bereich ML-Infrastruktur können dir helfen, einen positiven Eindruck zu hinterlassen.

Sicherheit und Best Practices

Sei bereit, über Sicherheitspraktiken in Cloud-Umgebungen zu sprechen. Zeige, dass du die Balance zwischen Sicherheit und Geschwindigkeit verstehst und wie du sicherstellen kannst, dass die Infrastruktur sowohl sicher als auch benutzerfreundlich ist.

Member of Technical Staff - ML Infrastructure Engineer
Black Forest Labs
Standort: San Francisco
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>