Senior Research Data Engineer - Foundation Models
Senior Research Data Engineer - Foundation Models

Senior Research Data Engineer - Foundation Models

Vollzeit 72000 - 84000 € / Jahr (geschätzt) Home Office möglich (teilweise)
Go Premium
DeepL

Auf einen Blick

  • Aufgaben: Entwickle und verwalte Datenpipelines für große unstrukturierte Datenmengen.
  • Arbeitgeber: DeepL, ein innovatives KI-Unternehmen mit globaler Reichweite.
  • Mitarbeitervorteile: Hybridarbeit, flexible Arbeitszeiten, 30 Tage Urlaub und regelmäßige Teamevents.
  • Warum dieser Job: Arbeite an bahnbrechenden KI-Projekten und forme die Zukunft der Kommunikation.
  • Gewünschte Qualifikationen: Erfahrung in Python und Datenengineering, idealerweise mit unstrukturierten Daten.
  • Andere Informationen: Werde Teil eines vielfältigen Teams aus über 90 Nationalitäten.

Das voraussichtliche Gehalt liegt zwischen 72000 - 84000 € pro Jahr.

DeepL ist ein globales KI-Produkt- und Forschungsunternehmen, das sich auf den Aufbau sicherer, intelligenter Lösungen für komplexe Geschäftsprobleme konzentriert. Über 200.000 Geschäftskunden und Millionen von Einzelpersonen in 228 globalen Märkten vertrauen heute auf die Sprach-KI-Plattform von DeepL für menschenähnliche Übersetzungen, verbessertes Schreiben und Echtzeit-Sprachübersetzung.

Was uns auszeichnet, ist unsere Kombination aus modernster KI-Technologie, sinnvollen Arbeiten und einer Kultur, in der Menschen wirklich gedeihen. Wir sind ein Team von Innovatoren, Forschern und Kreativen, die von einem gemeinsamen Ziel angetrieben werden: das menschliche Potenzial freizusetzen, indem wir die Arbeit einfacher, intelligenter und vernetzter machen.

Jede neue Innovation bei DeepL beginnt in der Forschungsabteilung, in den Köpfen und Händen von Forschern, Ingenieuren und Entwicklern, die leidenschaftlich daran interessiert sind, KI voranzutreiben. Daten sind das Lebenselixier, das diese Leidenschaft antreibt, und ein entscheidender Teil unserer Arbeit, von der Modellentwicklung bis zur Qualitätsevaluation.

Sie werden unserem Foundation Model Track beitreten. Als interdisziplinäre Gruppe von Forschungswissenschaftlern und Dateningenieuren, die sich auf maschinelles Lernen spezialisiert haben, entwickeln wir Grundmodelle für die Verwendung in unseren KI-Produkten. Unsere Dateningenieure erstellen, verfeinern und verwalten multimodale Trainingskorpora und sind für die damit verbundenen Datensammlungs- und Vorbereitungspipelines verantwortlich. Wir arbeiten mit unstrukturierten Daten im Petabyte-Maßstab und zehntausenden von Kernen in einer hybriden Cloud-Umgebung, um unsere ehrgeizigsten Projekte zu unterstützen.

Ihre Verantwortlichkeiten

  • Arbeiten Sie an ehrgeizigen Forschungsprojekten als Teil eines Teams von Forschungswissenschaftlern und Forschungsdateningenieuren.
  • Architektur, Design und Aufbau von Datenpipelines, die Petabytes von multimodalen unstrukturierten Daten verarbeiten können.
  • Aufbau eines modernen Datenengineering-Stacks, der auf modernster Technologie für Orchestrierung und parallele Berechnung basiert, und umfangreiche Nutzung aktiv entwickelter Open-Source-Lösungen.
  • Identifizieren von Leistungsengpässen, Debugging von Problemen und Erstellen von Pipelines mit Fokus auf Stabilität.
  • Nutzung unserer großen On-Premise-Datenzentren und AWS-Cloud-Infrastruktur für blitzschnelle Datenverarbeitung.
  • Über das „Big Data“ und ETL hinausgehen und komplexe Python-Datenlösungen für reale unstrukturierte Daten einschließlich Text, Code, Bild und Audio-Modi entwickeln und betreiben.
  • Zusammenarbeit mit Stakeholdern, Forschungswissenschaftlern, anderen Forschungsdateningenieuren sowie Datenwerkzeug- und Plattformteams.
  • Erhöhung des Standards für Exzellenz und Übernahme der Verantwortung für die Qualität und Verfügbarkeit unserer Trainingsdaten für Grundmodelle.
  • Sicherstellung der mission-kritischen Zuverlässigkeit von Datenpipeline-Jobs und Pflege von qualitativ hochwertigem Code.
  • Nutzen Sie Ihre Stärken und tragen Sie mit Kreativität, Gründlichkeit, Pragmatismus, Weitblick, Einfallsreichtum, Beharrlichkeit und allem, was das Team hebt, bei.

Qualitäten, die wir suchen

  • Berufserfahrung in Daten-, Plattform- oder Softwareengineering, idealerweise mit Fokus auf großangelegte unstrukturierte Daten.
  • Python: Umfangreiche Berufserfahrung in der Python-Softwareentwicklung. Idealerweise Erfahrung in der Wartung proprietärer oder Open-Source-Softwareprodukte.
  • Daten: Erfahrung mit explorativer Datenanalyse, Bereinigung, Validierung und Qualitätskontrolle über den Bereich Business Intelligence und Analytics hinaus.
  • Pipelines: Erfahrung im Aufbau reproduzierbarer Pipelines zur Speicherung und Verarbeitung von Petabytes an Daten.
  • Betrieb: Kenntnisse in Containerisierung und automatischer Bereitstellung. Idealerweise Erfahrung mit Container-Orchestrierung mit Kubernetes und Cloud-Infrastruktur.
  • Skalierung: Erfahrung mit hochgradig skalierbaren, parallelen Rechenlasten (z.B. Dask, Ray, Celery).
  • Leistung: Erfahrung im Schreiben und Optimieren von hochperformantem Code.
  • Interdisziplinäre Affinität: Fähigkeit, direkt mit unseren Forschern und technischen Stakeholdern zusammenzuarbeiten, um deren Bedürfnisse in Datenprodukte mit der gewünschten Benutzererfahrung und Leistung zu übersetzen.
  • Soziale Fähigkeiten: Ausgezeichnete Problemlösungsfähigkeiten, starke Kommunikationsfähigkeiten und eine kollaborative Denkweise.

Idealerweise haben Sie fachspezifische Erfahrungen

  • Vorbereitung von Trainingsdaten für LLM oder VLM.
  • NLP, Textklassifikation, Reinforcement Learning, modellbasierte/GPU-Workflows.
  • Dynamische Workflow-Orchestrierungsframeworks wie Argo Workflows, Airflow, Dagster oder Flyte.
  • Expertise in Linguistik oder mehrere Sprachen sprechen.
  • Erfahrung in einer Hochleistungsprogrammiersprache wie C++, Go oder Rust.

Was wir bieten:

  • Vielfältiges und international verteiltes Team: Der Beitritt zu unserem Team bedeutet, Teil einer großen, globalen Gemeinschaft mit Menschen aus mehr als 90 Nationalitäten zu werden.
  • Offene Kommunikation, regelmäßiges Feedback: Wir schätzen die Bedeutung klarer, ehrlicher Kommunikation.
  • Hybrides Arbeiten, flexible Arbeitszeiten: Wir bieten einen hybriden Arbeitszeitplan, bei dem die Teammitglieder zweimal pro Woche ins Büro kommen.
  • Regelmäßige persönliche Teamevents: Wir verbinden uns über lebendige Veranstaltungen, die so einzigartig sind wie unser Team.
  • Monatliche ganztägige Hack-Sessions: Jeden Monat haben wir Hack Freitage, an denen Sie an einem Projekt arbeiten können, das Ihnen am Herzen liegt.
  • 30 Tage Jahresurlaub: Wir schätzen Ihr Wohlbefinden.
  • Wettbewerbsfähige Leistungen: Unser Leistungspaket spiegelt die Vielfalt unseres Teams wider.

Wenn diese Rolle und unsere Mission mit Ihnen übereinstimmen, zögern Sie nicht, sich zu bewerben – lassen Sie uns Ihr Potenzial gemeinsam entdecken. Wir freuen uns darauf, Sie kennenzulernen!

Wir sind ein Arbeitgeber, der Chancengleichheit bietet. Sie sind bei DeepL willkommen, so wie Sie sind – wir schätzen Authentizität hier.

Senior Research Data Engineer - Foundation Models Arbeitgeber: DeepL

DeepL ist ein herausragender Arbeitgeber, der eine dynamische und innovative Arbeitsumgebung bietet, in der Mitarbeiter ihre Fähigkeiten in der KI-Forschung und Datenverarbeitung entfalten können. Mit einem internationalen Team von über 1.000 leidenschaftlichen Fachleuten fördert DeepL eine Kultur des offenen Austauschs, der regelmäßigen Rückmeldungen und der flexiblen Arbeitszeiten, um das Wohlbefinden und die persönliche Entwicklung zu unterstützen. Die Möglichkeit, an bedeutenden Projekten zu arbeiten und monatliche Hack-Tage zu genießen, macht DeepL zu einem attraktiven Arbeitsplatz für alle, die einen positiven Einfluss auf die Welt der Sprache und Kommunikation haben möchten.
DeepL

Kontaktperson:

DeepL HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior Research Data Engineer - Foundation Models

Tipp Nummer 1

Nutze LinkedIn, um dich mit Leuten aus der Branche zu vernetzen. Folge DeepL und interagiere mit ihren Beiträgen, um sichtbar zu werden und dein Interesse zu zeigen.

Tipp Nummer 2

Bereite dich auf das Vorstellungsgespräch vor, indem du die neuesten Trends in der KI und Datenverarbeitung recherchierst. Zeige, dass du nicht nur die Anforderungen erfüllst, sondern auch ein echter Innovator bist.

Tipp Nummer 3

Sei bereit, deine technischen Fähigkeiten in praktischen Tests zu demonstrieren. Übe Coding-Challenges und Datenpipeline-Projekte, um sicherzustellen, dass du im Gespräch glänzen kannst.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! Das zeigt dein echtes Interesse an DeepL und gibt dir die Möglichkeit, dich von anderen Bewerbern abzuheben.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior Research Data Engineer - Foundation Models

Python
Datenanalyse
Pipeline-Entwicklung
Containerisierung
Kubernetes
Cloud-Infrastruktur
Skalierbare parallele Berechnungen
Leistungsoptimierung
Zusammenarbeit mit interdisziplinären Teams
Problemlösungsfähigkeiten
Kommunikationsfähigkeiten
Erfahrung mit unstrukturierten Daten
Datenqualitätssicherung
Agilität im Lernen

Tipps für deine Bewerbung 🫡

Sei authentisch!: Wenn du dich bewirbst, sei einfach du selbst! Zeig uns, was dich antreibt und warum du Teil unseres Teams werden möchtest. Authentizität kommt immer gut an!

Mach es persönlich!: Vermeide Standardanschreiben. Sprich direkt an, warum du für die Rolle als Senior Research Data Engineer bei DeepL geeignet bist. Zeig uns deine Leidenschaft für Daten und KI!

Betone deine Erfahrungen!: Erzähle uns von deinen bisherigen Projekten und wie sie dich auf diese Position vorbereitet haben. Wir lieben es, wenn du konkrete Beispiele bringst, die deine Fähigkeiten unter Beweis stellen.

Bewirb dich über unsere Website!: Der einfachste Weg, um Teil von DeepL zu werden, ist, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell und unkompliziert bei uns ankommt!

Wie du dich auf ein Vorstellungsgespräch bei DeepL vorbereitest

Verstehe die Technologie

Mach dich mit den neuesten Entwicklungen in der KI und den spezifischen Technologien, die DeepL verwendet, vertraut. Zeige im Interview, dass du nicht nur die Grundlagen verstehst, sondern auch, wie diese Technologien in der Praxis angewendet werden.

Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, die deine Fähigkeiten in der Datenverarbeitung und im Umgang mit unstrukturierten Daten demonstrieren. Sei bereit, diese Beispiele zu teilen und zu erklären, wie du Herausforderungen gemeistert hast.

Zeige Teamgeist

DeepL legt großen Wert auf Zusammenarbeit. Bereite dich darauf vor, Fragen zu beantworten, die deine Fähigkeit zur Zusammenarbeit mit anderen Forschern und Ingenieuren betreffen. Betone, wie du in der Vergangenheit erfolgreich im Team gearbeitet hast.

Frage nach der Unternehmenskultur

Nutze die Gelegenheit, um mehr über die Kultur bei DeepL zu erfahren. Stelle Fragen, die zeigen, dass du an einem positiven Arbeitsumfeld interessiert bist und dass dir Werte wie Kommunikation und Empathie wichtig sind.

Senior Research Data Engineer - Foundation Models
DeepL
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>