Machine Learning Systems Engineer

Machine Learning Systems Engineer

Vollzeit 75000 - 95000 € / Jahr (geschätzt) Kein Homeoffice möglich
T

Auf einen Blick

  • Aufgaben: Entwickle skalierbare Backend-Systeme für eine Medienintelligenz-Plattform mit KI-Integration.
  • Unternehmen: Innovatives Unternehmen im Bereich Medienintelligenz mit einem dynamischen Team.
  • Vorteile: Attraktives Gehalt, flexible Arbeitszeiten, Weiterbildungsmöglichkeiten und ein kreatives Arbeitsumfeld.
  • Weitere Informationen: Wachstumsorientierte Umgebung mit vielen Möglichkeiten zur beruflichen Weiterentwicklung.
  • Warum dieser Job: Gestalte die Zukunft der Medienverarbeitung mit modernster Technologie und mache einen echten Unterschied.
  • Qualifikationen: Erfahrung in Backend-Engineering und Integration von KI/ML-Systemen erforderlich.

Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.

Wir entwickeln eine hoch skalierbare Medienintelligenzplattform, die große Mengen an Multimedia-Inhalten über Text, Bild, Video und Audio verarbeitet, analysiert und strukturiert. Als Senior Applied ML Engineer werden Sie die Kern-Backend-Systeme entwerfen und aufbauen, die die Medienaufnahme, Verarbeitungsabläufe, Metadatengenerierung, KI-basierte Analyse, semantische Suche und Abruf über große Mediatheken unterstützen.

Wir suchen einen Senior Applied ML Engineer, der in der Lage ist, eine produktionsreife Moderationspipeline mit Open-Source-Modellen zu entwerfen, zu implementieren, zu optimieren und zu bewerten. Diese Rolle erfordert tiefgehende Backend-Engineering-Expertise, starke Systemdesignfähigkeiten und praktische Erfahrung bei der Integration von KI/ML-Systemen in Produktionsabläufe.

Sie werden an komplexen Medienverarbeitungs-Pipelines, Video-/Audioanalysen, OCR, Sprach-zu-Text, Einbettungsgenerierung, Vektorsuche, multimodalen Modellintegrationen und hochgradig asynchronen Arbeitslasten arbeiten. Sie werden eng mit der technischen Leitung zusammenarbeiten, um die Backend-Architektur zu definieren, die Zuverlässigkeit und Skalierbarkeit zu verbessern und andere Ingenieure bei der Bereitstellung sicherer, beobachtbarer und leistungsstarker Systeme zu unterstützen.

Verantwortlichkeiten
  • Backend-Architektur & Systemverantwortung: Entwerfen, bauen und betreiben Sie skalierbare Backend-Dienste für eine Medienintelligenzplattform mit Fokus auf saubere, wartbare und produktionsbereite Systeme.
  • Besitzen Sie kritische Backend-Komponenten von Anfang bis Ende, vom Systemdesign und API-Verträgen über Implementierung, Bereitstellung, Überwachung und Iteration.
  • Treffen Sie architektonische Entscheidungen über APIs, Verarbeitungs-Pipelines, verteilte Berechnungen, Speicherung, Suche, Beobachtbarkeit, Cloud-Infrastruktur und Modellbereitstellungsabläufe.
  • Entwerfen Sie Datenmodelle und Speicherstrukturen für Medienassets, generierte Metadaten, Einbettungen, Verarbeitungsjobs, Modelloutputs, Suchindizes und Audit-Trails.
  • Entwerfen Sie hochgradige Medienaufnahme- und Verarbeitungs-Pipelines für große Mengen an Video-, Audio-, Bild- und Textinhalten.
  • Bauen Sie verteilte, ereignisgesteuerte Arbeitsabläufe für die Medienverarbeitung unter Verwendung von Warteschlangen und Pub/Sub-Systemen wie SQS, Kafka, Pub/Sub oder gleichwertigen Technologien.
  • Implementieren Sie zuverlässige asynchrone Verarbeitungsmuster, einschließlich Wiederholungen, Idempotenz, Dead-Letter-Warteschlangen, Backpressure-Handling und fehlertolerante Jobausführung.
AI/ML-Integration & Modellarbeitsabläufe:
  • Leiten Sie die Entwicklung und Optimierung von Metadatenextraktion, Inhaltsanalyse, Szenenerkennung, Transkription, Einbettungsgenerierung und multimodalen KI-Inferenzarbeitsabläufen.
  • Integrieren und optimieren Sie KI/ML-Dienste innerhalb von Backend-Arbeitsabläufen, einschließlich Modell-APIs, Einbettungspipelines, OCR, Sprach-zu-Text, Szenenanalysen, multimodaler Inferenz, Batching, Caching und Fallback-Strategien.
  • Zusammenarbeit mit ML-Ingenieuren, Datenwissenschaftlern oder externen Modellanbietern zur Benchmarking von Modellen, zum Vergleich von Qualitäts-/Latenztrade-offs und zur sicheren Einführung von Modell-Upgrades.
Modellbereitstellung & Leistungsoptimierung:
  • Optimieren Sie KI/ML-Inferenzarbeitsabläufe hinsichtlich Latenz, Durchsatz, Zuverlässigkeit und Kosten sowohl für Echtzeit- als auch für Batch-Verarbeitungswege.
  • Arbeiten Sie mit Modellbereitstellungssystemen wie vLLM, Triton, TGI, SageMaker, Vertex AI oder benutzerdefinierten Inferenzdiensten, um Batching, Parallelität, Warmup-Verhalten, Timeout-Handling, Autoskalierung und GPU-Nutzung zu verbessern.
  • Bewerten und wenden Sie praktische Modelloptimierungstechniken wie Quantisierung, Modell-Destillation, Batching, Caching, Prompt-Optimierung und Routing auf kleinere oder günstigere Modelle an, wo dies angebracht ist.
  • Entwerfen und pflegen Sie Vektorsuch- und Indizierungssysteme unter Verwendung von Technologien wie Pinecone, Weaviate, Qdrant, Elastic Vectors, FAISS, pgvector oder ähnlichen Tools.
  • Bauen Sie Abrufarbeitsabläufe, die semantische Suche, Ähnlichkeitsabgleich, Duplikaterkennung, Medienentdeckung und strukturierte Metadatensuche unterstützen.
  • Überwachen Sie die Modell- und Systemleistung in der Produktion, einschließlich API-Latenz, Warteschlangentiefe, Verarbeitungszeit, Modellfehlerquoten, GPU-Nutzung, Vertrauensverteilungen, Drift-Signale und Kosten pro verarbeitetem Element.
Infrastruktur, Zuverlässigkeit & Beobachtbarkeit:
  • Bereitstellen und Betreiben von Systemen auf AWS, GCP, Azure oder gleichwertigen Cloud-Plattformen, einschließlich Berechnung, Speicherung, Netzwerk, Warteschlangen, Modellbereitstellungsinfrastruktur und Überwachungssystemen.
  • Sicherstellen der Systemzuverlässigkeit durch Protokollierung, Metriken, Nachverfolgung, Alarmierung, Dashboards, betriebliche Handbücher und bewährte Verfahren zur Reaktion auf Vorfälle.
Zusammenarbeit & technische Führung:
  • Zusammenarbeit mit Produkt-, Design-, Daten- und ML-Teams zur Bereitstellung medienreicher, KI-gesteuerter Produktfunktionen.
  • Mentoring von Junior- und Mid-Level-Ingenieuren, Unterstützung bei der technischen Planung, Überprüfung von Designs und Verbesserung der Ingenieursqualität im Team.
  • Teilnahme an Code-Reviews, Dokumentation, technischer Planung und kontinuierlicher Verbesserung der Ingenieurpraktiken.
  • Sicherstellen der Codequalität durch Tests, Peer-Review, klare Dokumentation und wartbare Implementierungsmuster.
Bildung & Erfahrung:
  • Abschluss in Informatik, Ingenieurwesen oder gleichwertiger praktischer Erfahrung.
  • 5-7+ Jahre Erfahrung im Backend-Engineering, idealerweise beim Aufbau skalierbarer verteilter Systeme, Medienplattformen, Datenpipelines oder hochgradiger Backend-Dienste.
  • Frühere Erfahrung in der vollständigen Verantwortung für wichtige Backend-Module, einschließlich Architektur, Implementierung, Bereitstellung, Überwachung und Produktionsbetrieb.
  • 3+ Jahre Erfahrung in der Integration von KI/ML-Inferenzsystemen in Backend-Arbeitsabläufe, einschließlich Modell-APIs, Einbettungspipelines, OCR, Sprach-zu-Text, Szenenerkennung oder multimodalen Modellausgaben.
  • Praktische Erfahrung in der Erstellung von KI-gesteuerten Verarbeitungs-Pipelines für Bild-, Video-, Audio- oder Textanalysen.
  • Praktische Erfahrung mit der Optimierung von Produktionsmodellen, insbesondere für Bild-, Video-, Einbettungs- oder multimodale Modelle, einschließlich Batching, Caching, Quantisierung, Prompt-Optimierung, Routing-Strategien, Latenzreduzierung und Kostenoptimierung.
  • Frühere Erfahrung mit Vektorsuche, semantischer Suche, Medienabruf oder Ähnlichkeitsabgleichssystemen wird stark bevorzugt.
  • Erfahrung im Mentoring von Ingenieuren, in der Leitung technischer Diskussionen und in der Beeinflussung architektonischer Entscheidungen über Backend-, Infrastruktur- und KI/ML-Arbeitsabläufe.
Technische Fähigkeiten:
  • Starke Expertise in Python und/oder Node.js mit tiefem Verständnis für den Aufbau skalierbarer RESTful APIs und Backend-Architekturen.
  • Erfahrung mit dem HuggingFace Transformers-Ökosystem und Deep-Learning-Frameworks wie PyTorch und TensorFlow.
  • Starke Erfahrung mit SQL/NoSQL-Datenbanken, Schema-Design und Datenmodellierung.
  • Bevorzugte Kenntnisse in verteilten Systemen, Microservices, asynchroner Verarbeitung und ereignisgesteuerten Mustern mit SQS, Pub/Sub, Kafka oder anderen Warteschlangen-/Pub-Sub-Systemen.
  • Erfahrung in der Bereitstellung von Produktionssystemen auf AWS, GCP oder ähnlichen Cloud-Plattformen.
  • Kenntnisse über Infrastrukturmuster (Berechnung, Speicherung, Netzwerk, Beobachtbarkeit).
AI/ML-Integration:
  • Erfahrung in der Orchestrierung von Einbettungsgenerierung, Szenenerkennung, OCR, Sprach-zu-Text, Bildklassifizierung, Videoanalyse und multimodalen Modellintegrationen.
  • Erfahrung in der Optimierung von Inferenzarbeitsabläufen hinsichtlich Latenz, Durchsatz, Zuverlässigkeit und Kosten.
  • Erfahrung in der Arbeit mit skalierbaren und optimierten Inferenz-Einstellungen, einschließlich der Feinabstimmung von Sampling-Parametern, der Verwaltung von Ausgabeformaten und der Konfiguration von reasoning-bezogenen Verhaltensweisen.
  • Vertrautheit mit praktischen Modelloptimierungstechniken wie Batching, Caching, Quantisierung, Modell-Destillation, Prompt-Optimierung, Fallback-Routing und der Verwendung kleinerer Modelle, wo dies angebracht ist.
  • Erfahrung in der Arbeit mit Modellbereitstellungssystemen wie vLLM, Triton, TGI, SageMaker, Vertex AI oder benutzerdefinierten Inferenzdiensten ist bevorzugt.
  • Erfahrung in der Arbeit mit LLM- und multimodalen Evaluierungs- und Benchmarking-Frameworks sowie domänenspezifischen Benchmarks mit der Fähigkeit, Ergebnisse zu interpretieren und die Modellleistung entsprechend zu optimieren.
Systemdesign & Architektur:
  • Bevorzugtes Verständnis von verteilten Systemen, Skalierungsmustern und Leistungsengineering.
  • Fähigkeit, modulare, wartbare und effiziente Architekturen zu entwerfen.
  • Erfahrung mit API-Versionierung, Modularisierung und dem Entwurf von langlaufenden Arbeitsabläufen.
  • Verständnis von Leistungsengpässen und latenzarmen Backend-Mustern.

Machine Learning Systems Engineer Arbeitgeber: Tether Operations Limited

Unser Unternehmen bietet eine dynamische und innovative Arbeitsumgebung, in der Sie als Senior Applied ML Engineer an einer hochskalierbaren Medienintelligenzplattform arbeiten werden. Wir fördern eine Kultur der Zusammenarbeit und des kontinuierlichen Lernens, bieten umfangreiche Möglichkeiten zur beruflichen Weiterentwicklung und unterstützen Sie dabei, Ihre technischen Fähigkeiten in einem spannenden, technologiegetriebenen Umfeld zu erweitern. Darüber hinaus profitieren Sie von flexiblen Arbeitszeiten und der Möglichkeit, remote zu arbeiten, was Ihnen eine ausgewogene Work-Life-Balance ermöglicht.

T

Kontaktdaten:

Tether Operations Limited Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Machine Learning Systems Engineer erhalten könnten

Engagier dich in Entwickler-Communities!

Lass uns mal ehrlich sein: In der Software-Entwicklung sind Netzwerke Gold wert! Tummel dich in GitHub-Projekten, nehme an lokalen Meetups oder Hackathons teil und vernetze dich mit anderen Entwicklern. So steigerst du nicht nur deine Sichtbarkeit, sondern lernst auch die neuesten Trends und Technologien kennen.

Zeig deine Fähigkeiten!

Erstelle ein Portfolio, das deine besten Projekte und Code-Examples zeigt. Nichts überzeugt mehr als ein praktischer Beweis deiner Skills. Das kann auch helfen, bei Tether Operations Limited anzuklopfen, wenn du dich auf die Stelle als Machine Learning Systems Engineer bewirbst – so wissen sie gleich, was sie von dir erwarten können!

Nutze Jobplattformen speziell für Tech-Jobs!

Plattformen wie Stack Overflow Jobs oder AngelsList sind perfekte Orte, um Vollzeitstellen in der Software-Entwicklung zu finden. Hier sind viele tolle Unternehmen auf der Suche nach Talenten wie uns, also schau regelmäßig vorbei und bewirb dich direkt über die Website.

Such dir Mentoren und Feedback!

Hol dir Feedback von erfahrenen Entwicklern, die dir Tipps geben können, was Recruiter wirklich suchen. Ob über LinkedIn oder persönliche Kontakte: Menschen, die sich in der Branche auskennen, können enorm wertvoll sein, um dir zu helfen, dich optimal auf deine Bewerbung bei Tether Operations Limited vorzubereiten!

Wir glauben, dass du diese Fähigkeiten brauchst, um Machine Learning Systems Engineer mit Bravour zu bestehen

Backend-Architektur
Systemdesign
API-Entwicklung
Ereignisgesteuerte Verarbeitung
Asynchrone Verarbeitung
AI/ML-Integration
Modelloptimierung

Einige Tipps für deine Bewerbung 🫡

Highlights deiner Coding-Skills:In der Software-Entwicklung kommt es auf konkrete Fähigkeiten an. Vergiss nicht, relevante Programmiersprachen und Frameworks in deinen Lebenslauf aufzunehmen. Zeig uns, was du kannst – vielleicht mit einem Link zu deinem GitHub-Profil oder einer Übersicht deiner Side Projects, die deine Programmierkenntnisse illustrieren.

Dokumentation deiner Erfolge:Gerade bei einer Vollzeitstelle in der Software-Entwicklung sind konkrete Ergebnisse Gold wert. Nenn uns Zahlen und Ergebnisse aus deinen vorherigen Projekten. Hast du den Code optimiert oder Systemfehler behoben? Solche Erfolge zeigen, dass du die Sprache der Entwickler sprichst und einen echten Mehrwert bringst.

Attraktive Projektbeschreibungen:Wenn du an Projekten gearbeitet hast, die hervorstechen, beschreibe sie ausführlich in deinem Lebenslauf. Was war das Problem, das du gelöst hast? Welche Technologien hast du eingesetzt? Das gibt uns einen klaren Einblick in deine Herangehensweise und Problemlösungsfähigkeiten.

Motivation zeigen:In deinem Anschreiben solltest du deine Motivation für die Stelle im Bereich Software-Entwicklung bei Tether Operations Limited klar herausstellen. Warum sprichst gerade du die Anforderungen für diese Vollzeitrolle an? Mach deutlich, was dich an der Arbeit bei uns reizt und wie du über das rein Technische hinaus wachsen möchtest.

Wie man sich auf ein Vorstellungsgespräch bei Tether Operations Limited vorbereitet

Technische Vorbereitung auf die Coding-Challenges

In der Software-Entwicklung sind technische Fragen oft ein zentraler Teil des Interviews. Macht euch mit Plattformen wie LeetCode oder HackerRank vertraut, um eure Problemlösungsfähigkeiten zu trainieren. Zeigt im Interview viel Selbstbewusstsein beim Erklären eurer Ansätze!

Das eigene Portfolio im besten Licht präsentieren

Stellt sicher, dass ihr ein aussagekräftiges Portfolio habt, das einige eurer besten Projekte zeigt. Seid bereit, darüber zu sprechen, was eure Rolle war, welche Technologien ihr verwendet habt und welche Herausforderungen es gab. Das gibt den Interviewern einen Einblick in eure praktische Erfahrung.

Teamfähigkeit und Kommunikation betonen

In einer Vollzeit-Position wird Kommunikation im Team sehr wichtig sein. Seid bereit, Beispiele aus der Vergangenheit zu teilen, in denen ihr effektiv im Team gearbeitet habt. Dies zeigt, dass ihr nicht nur technische Fähigkeiten habt, sondern auch gut ins Team passt.

Vorbereitung auf Fragen zur Software-Architektur

Bereitet euch darauf vor, Fragen zur Software-Architektur zu beantworten. Themen wie RESTful APIs, Microservices und Cloud-Architekturen können Teil eures Interviews sein. Zeigt euer Verständnis durch Diskussionen und Beispiele aus eurer bisherigen Arbeit oder Projekte.