Staff Machine Learning Systems Engineer (MLOps)

Staff Machine Learning Systems Engineer (MLOps)

Vollzeit Kein Homeoffice möglich
Dormont Manufacturing Co

Auf einen Blick

  • Aufgaben: Entwickle und betreibe die Infrastruktur für KI bei Hims & Hers.
  • Unternehmen: Führende Gesundheitsplattform mit Fokus auf innovative Lösungen.
  • Vorteile: Wettbewerbsfähiges Gehalt, unbegrenzter Urlaub und umfassende Gesundheitsleistungen.
  • Weitere Informationen: Dynamisches Team mit großartigen Entwicklungsmöglichkeiten und einem starken Fokus auf Diversität.
  • Warum dieser Job: Gestalte die Zukunft der Gesundheitsversorgung durch KI und mache einen echten Unterschied.
  • Qualifikationen: Erfahrung in Infrastruktur und MLOps, insbesondere mit Kubernetes und Cloud-Technologien.

Hims & Hers ist die führende Gesundheits- und Wellness-Plattform, die sich zum Ziel gesetzt hat, der Welt zu helfen, sich durch bessere Gesundheit großartig zu fühlen. Wir definieren das Gesundheitswesen neu, indem wir den Kunden in den Mittelpunkt stellen und Zugang zu Pflege bieten, die erschwinglich, zugänglich und persönlich ist, von der Diagnose bis zur Behandlung und Lieferung. Wir bieten Zugang zu personalisierter Pflege, die auf Ergebnisse ausgelegt ist.

Über die Rolle: Wir suchen einen Staff ML Systems Engineer, um die Produktionsinfrastruktur zu entwerfen, zu bauen und zu betreiben, die KI bei Hims & Hers antreibt. Dies ist eine tief technische, praktische Infrastrukturrolle, die sich auf die Systeme unterhalb der KI konzentriert — die Kubernetes-Plattform, CI/CD- und GitOps-Pipelines, Infrastruktur als Code, Inferenz- und Modellbereitstellungsinfrastruktur sowie den Observabilitäts- und Tracing-Stack, der KI-Dienste zuverlässig, debugbar und konform in der Produktion hält.

Sie werden nicht nur Modelle bereitstellen — Sie werden die Maschinen besitzen, die es jedem KI-Team ermöglichen, sicher zu versenden und zu betreiben. Sie werden kritische Systeme wie unsere EKS-Cluster, Bereitstellungs- und Autoskalierungsinfrastruktur, IAM- und Geheimnisverwaltung, LLM-Tracing/Observabilitäts-Pipelines (Langfuse, Datadog, OpenTelemetry) und die Entwicklerplattform, auf die KI- und Produkttechniker täglich angewiesen sind, besitzen.

Sie werden mit ML-Ingenieuren, Produkttechnikern und klinischen Teams zusammenarbeiten, um sicherzustellen, dass unsere KI-Systeme zuverlässig, beobachtbar, sicher und vertrauenswürdig in einer regulierten Gesundheitsumgebung sind. Diese Rolle ist ideal für jemanden, der in Systemen und Infrastruktur denkt, sich tief um Zuverlässigkeit, Sicherheit und Kosten kümmert und definieren möchte, wie KI in der Produktion in einem Unternehmen läuft, in dem sie direkte Auswirkungen auf die Patientenergebnisse hat.

Sie werden:

  • Die AI-Compute- und Bereitstellungsplattform besitzen und skalieren.
  • Unsere containerisierte Anwendungsbereitstellungsplattform und verwandte Systeme für KI-Workloads weiterentwickeln.
  • GitOps-basierte Bereitstellungspipelines erstellen und pflegen.
  • Inferenz- und Modellbereitstellungsinfrastruktur aufbauen und skalieren.
  • Die LLM/AI-Observabilitäts- und Tracing-Stack besitzen.
  • Die AI-Entwicklerplattform und CI/CD verbessern.
  • Sicherheits-, Compliance- und Governance-Maßnahmen auf Systemeebene vorantreiben.
  • Technische Richtungen festlegen und Standards erhöhen.

Sie haben:

  • 8+ Jahre Berufserfahrung in Infrastruktur, Plattform, DevOps oder SRE-Engineering — davon mindestens 3 Jahre mit Fokus auf ML/AI-Systeme in der Produktion.
  • Tiefe praktische Erfahrung mit Kubernetes (idealerweise EKS) und dem cloud-nativen Ökosystem.
  • Starke Fähigkeiten in Infrastruktur als Code (Terraform).
  • Starke Kenntnisse in Python.
  • 2+ Jahre Erfahrung im Betrieb von LLM-basierten Systemen in der Produktion.
  • Erfahrung mit Observabilitäts-/Tracing-Stacks.
  • Erfahrung in der Gestaltung und Wartung von CI/CD-Pipelines.
  • Ein system- und operationsorientiertes Denken.
  • Erfahrung im Schreiben und Führen technischer Entwurfsdokumente.
  • Starke Zusammenarbeit mit verschiedenen Teams.
  • Eine tiefe Wertschätzung für Sicherheit, Datenschutz und Compliance.

Warum uns beitreten: Bei Hims & Hers sind Sie Teil eines kleinen, hochwirksamen Teams, das definiert, wie KI-Infrastruktur in der Produktion für das Gesundheitswesen funktioniert. Die Plattform, die Sie aufbauen — Compute, Bereitstellung, Inferenz, Observabilität und Sicherheit — ist die Grundlage, auf der jede KI-gestützte Erfahrung basiert.

Unsere Vorteile: Wettbewerbsfähiges Gehalt & Aktienvergütung, unbegrenzter PTO, umfassende Gesundheitsleistungen, Mitarbeiteraktienprogramm (ESPP), 401k-Leistungen mit Arbeitgeberbeiträgen und Teamausflüge.

Staff Machine Learning Systems Engineer (MLOps) Arbeitgeber: Dormont Manufacturing Co

Hims & Hers ist ein hervorragender Arbeitgeber, der eine dynamische und unterstützende Arbeitsumgebung bietet, in der Innovation und Teamarbeit im Mittelpunkt stehen. Mit einem flexiblen Arbeitsansatz und umfangreichen Vorteilen wie unbegrenztem Urlaub, umfassenden Gesundheitsleistungen und einem starken Fokus auf Mitarbeiterentwicklung, ermöglicht das Unternehmen seinen Mitarbeitern, ihre Karriere in einem bedeutungsvollen Bereich der Gesundheitsversorgung voranzutreiben. Hier haben Sie die Möglichkeit, an der Spitze der KI-Infrastruktur zu arbeiten und direkt zur Verbesserung der Patientenversorgung beizutragen.

Dormont Manufacturing Co

Kontaktdaten:

Dormont Manufacturing Co Recruiting-Team

Wir glauben, dass du diese Fähigkeiten brauchst, um Staff Machine Learning Systems Engineer (MLOps) mit Bravour zu bestehen

Kubernetes
CI/CD
GitOps
Infrastructure-as-Code (Terraform)
Python
LLM Operations (LLMOps)
Observability (Datadog, OpenTelemetry, Langfuse)