Lead Data Engineer - ML Pipelines

Lead Data Engineer - ML Pipelines

Zürich Vollzeit 72000 - 84000 € / Jahr (geschätzt) Kein Homeoffice möglich
Decentriq

Auf einen Blick

  • Aufgaben: Übernehme die Verantwortung für Datenpipelines und verbessere ML-Modelle für AdTech.
  • Unternehmen: Decentriq ist ein führendes Unternehmen in der Daten-Clean-Room-Technologie mit Sitz in Zürich.
  • Vorteile: Vollständige Remote-Arbeit, wettbewerbsfähiges Gehalt und viele Entwicklungsmöglichkeiten.
  • Weitere Informationen: Kein Motivationsschreiben nötig, einfach Lebenslauf und kurze Punkte zur Begeisterung senden.
  • Warum dieser Job: Gestalte die Zukunft der Werbung mit und arbeite in einem dynamischen, internationalen Team.
  • Qualifikationen: Bachelor/Master/PhD in Informatik oder verwandten Bereichen und 5+ Jahre Erfahrung erforderlich.

Das prognostizierte Gehalt liegt zwischen 72000 - 84000 € pro Jahr.

Decentriq is the rising leader in data-clean-room technology. With Decentriq, advertisers, retailers, and publishers securely collaborate on 1st-party data for optimal audience targeting and campaign measurement. Headquartered in Zürich, Decentriq is trusted by renowned institutions in the DACH market and beyond, such as RTL Ad Alliance, Publicis Media, and PostFinance.

Our analytics & ML pipelines are the heartbeat of this platform. Built in Python (pandas) and Apache Spark, they run either in Databricks workspaces or on our own Spark clusters deployed inside confidential-computing enclaves. We are looking for a Senior Data Engineer (≥ 80 %, start as soon as possible) to take end-to-end ownership of these pipelines, raise their resilience to the next level, and push the boundaries of privacy-preserving machine-learning for AdTech. The role can be fully remote (± 4 h CET) or based in our Zürich/Berlin office.

Would you like to help us make the advertising industry ready for the 1st-party era? Then we’d love to hear from you!

Tasks

  • Own, Design & Operate Data Pipelines – Take full responsibility for all pandas- and Spark-based pipelines, from development through production and monitoring.
  • Advance our ML Models – Improve and productionise models for AdTech use-cases such as look-a-like modelling, audience expansion, and campaign measurement.
  • Engineer for the Invisible – Because data inside confidential enclaves is literally invisible (even to root), build extra-robust validation at the data source, exhaustive test coverage, and self-healing jobs to guarantee reliability.
  • Collaborate Cross-Functionally – Work closely with data scientists, backend engineers (Rust), and product teams to ship features end-to-end.
  • AI-Powered Productivity – Leverage LLM-based code assistants, design generators, and test-automation tools to move faster and raise the quality bar. Share your workflows with the team
  • Drive Continuous Improvement – Profile, benchmark, and tune Spark workloads, introduce best practices in orchestration & observability, and keep our tech stack future-proof.

Requirements

  • (Must have) Bachelor/Master/PhD in Computer Science, Data Engineering, or a related field and 5+ years of professional experience.
  • (Must have) Expert-level Python plus solid hands-on experience with pandas, PySpark/Scala Spark, and distributed-data processing.
  • (Must have) Proven track record building resilient, production-grade data pipelines with rigorous data-quality and validation checks.
  • (Must have) Working knowledge of ML lifecycle and model serving; familiarity with techniques for audience segmentation or look-a-like modelling is a big plus.
  • (Plus) Experience running workloads in Databricks , Spark on Kubernetes, or other cloud/on-prem big-data platforms.
  • (Plus) Exposure to confidential computing , secure enclaves, homomorphic encryption, or similar privacy-preserving tech.
  • (Plus) Rust proficiency (we use it for backend services and compute-heavy client-side modules).
  • (Plus) Data-platform skills: operating Spark clusters, job schedulers, or orchestration frameworks (Airflow, Dagster, custom schedulers).

Benefits

  • Join Decentriq's Engineering team as in individual contribuor and earn growing responsibilities
  • Being able to create, shape, and benefit from a young company.
  • An amazing and fun team that is distributed all over Europe.
  • Competitive salary.
  • A lot of opportunities for self-development.

No need for a formal motivational letter. Just send your CV along with a few bullet points about why you're excited to work with us. We look forward to your application!

#J-18808-Ljbffr

Lead Data Engineer - ML Pipelines Arbeitgeber: Decentriq

Decentriq ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, in einem dynamischen und innovativen Umfeld zu arbeiten. Mit einem starken Fokus auf persönliche Entwicklung und einem großartigen Team, das über ganz Europa verteilt ist, fördert Decentriq eine Kultur der Zusammenarbeit und des Wissensaustauschs. Die flexible Arbeitsweise, sei es remote oder im Büro in Zürich/Berlin, sowie ein wettbewerbsfähiges Gehalt machen Decentriq zu einem attraktiven Arbeitsplatz für alle, die im Bereich Data Engineering und Machine Learning tätig sein möchten.

Decentriq

Kontaktdaten:

Decentriq Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Lead Data Engineer - ML Pipelines erhalten könnten

Netzwerken ist der Schlüssel

Nutze Plattformen wie LinkedIn, um mit aktuellen Mitarbeitern von Decentriq in Kontakt zu treten. Stelle Fragen zu ihrer Arbeit und den Herausforderungen im Bereich Data Engineering, um ein besseres Verständnis für die Unternehmenskultur und die spezifischen Anforderungen der Rolle zu bekommen.

Technische Fähigkeiten demonstrieren

Bereite dich darauf vor, deine Kenntnisse in Python, Pandas und Apache Spark in einem technischen Gespräch zu demonstrieren. Überlege dir konkrete Beispiele aus deiner bisherigen Berufserfahrung, die zeigen, wie du robuste Datenpipelines entwickelt hast.

Verstehe die Branche

Informiere dich über aktuelle Trends und Technologien im AdTech-Bereich, insbesondere im Hinblick auf datenschutzfreundliche Lösungen. Dies zeigt dein Interesse an der Branche und deine Bereitschaft, innovative Ansätze zu verfolgen.

Fragen vorbereiten

Bereite gezielte Fragen für das Vorstellungsgespräch vor, die sich auf die ML-Pipelines und die Herausforderungen bei der Arbeit mit vertraulichen Daten beziehen. Dies zeigt dein Engagement und deine proaktive Denkweise.

Wir glauben, dass du diese Fähigkeiten brauchst, um Lead Data Engineer - ML Pipelines mit Bravour zu bestehen

Expertenkenntnisse in Python
Erfahrung mit pandas und PySpark/Scala Spark
Kenntnisse in der Verarbeitung verteilter Daten
Erfahrung im Aufbau robuster, produktionsreifer Datenpipelines
Fähigkeit zur Durchführung rigoroser Datenqualitäts- und Validierungsprüfungen
Vertrautheit mit dem ML-Lebenszyklus und Modellbereitstellung
Kenntnisse in Techniken zur Zielgruppensegmentierung oder Look-a-like-Modellierung

Einige Tipps für deine Bewerbung 🫡

Verstehe die Anforderungen:Lies die Stellenbeschreibung sorgfältig durch und achte auf die geforderten Qualifikationen und Erfahrungen. Stelle sicher, dass du alle relevanten Punkte in deinem Lebenslauf und deinen Bullet Points ansprichst.

Betone deine technischen Fähigkeiten:Da die Rolle einen starken Fokus auf Python, Pandas und Spark hat, solltest du deine Erfahrungen mit diesen Technologien klar hervorheben. Nenne spezifische Projekte oder Erfolge, die deine Expertise belegen.

Bullet Points erstellen:Anstatt ein formelles Motivationsschreiben zu verfassen, erstelle prägnante Bullet Points, die deine Begeisterung für die Position und das Unternehmen zeigen. Konzentriere dich darauf, wie deine Fähigkeiten und Erfahrungen zur Vision von Decentriq passen.

Prüfe deine Unterlagen:Bevor du deine Bewerbung einreichst, überprüfe alle Dokumente auf Vollständigkeit und Richtigkeit. Achte darauf, dass dein Lebenslauf aktuell ist und alle relevanten Informationen enthält.

Wie man sich auf ein Vorstellungsgespräch bei Decentriq vorbereitet

Verstehe die Technologie

Mach dich mit den Technologien vertraut, die Decentriq verwendet, insbesondere mit Python, pandas und Apache Spark. Sei bereit, spezifische Fragen zu diesen Tools zu beantworten und zeige, dass du praktische Erfahrungen in der Entwicklung von Datenpipelines hast.

Bereite Beispiele vor

Denke an konkrete Beispiele aus deiner bisherigen Berufserfahrung, die deine Fähigkeiten im Bereich Datenengineering und maschinelles Lernen demonstrieren. Zeige, wie du Herausforderungen gemeistert und Lösungen implementiert hast, die die Resilienz von Pipelines verbessert haben.

Zeige Teamfähigkeit

Da die Rolle eine enge Zusammenarbeit mit Data Scientists und Backend-Entwicklern erfordert, solltest du Beispiele für erfolgreiche Teamprojekte parat haben. Betone deine Fähigkeit, cross-funktional zu arbeiten und wie du zur Verbesserung der Teamdynamik beigetragen hast.

Frage nach der Unternehmenskultur

Bereite Fragen vor, die dir helfen, die Unternehmenskultur von Decentriq besser zu verstehen. Frage nach den Werten des Unternehmens, der Teamstruktur und wie Innovation gefördert wird. Dies zeigt dein Interesse an der Firma und hilft dir, festzustellen, ob sie zu dir passt.