Data Engineer / Data Scientist

Data Engineer / Data Scientist

Schlieren Vollzeit 45000 - 65000 € / Jahr (geschätzt) Kein Homeoffice möglich
L

Auf einen Blick

  • Aufgaben: Entwickle und visualisiere Daten für innovative photonic integrated circuits.
  • Unternehmen: Lightium, ein aufstrebendes Unternehmen im Bereich Photonik.
  • Vorteile: Wettbewerbsfähiges Gehalt, Aktienoptionen, großzügiger Urlaub und umfassende Sozialleistungen.
  • Weitere Informationen: Dynamisches Startup-Umfeld mit großartigen Wachstumschancen.
  • Warum dieser Job: Gestalte die Zukunft der Telekommunikation mit modernster Technologie.
  • Qualifikationen: Abschluss in Informatik oder verwandten Bereichen; starke Python- und SQL-Kenntnisse.

Das prognostizierte Gehalt liegt zwischen 45000 - 65000 € pro Jahr.

Lightium entwickelt die nächste Generation photonischer integrierter Schaltungen auf dünnen Lithiumniobat (TFLN). Wir suchen einen Dateningenieur/Datenwissenschaftler, der uns hilft, unsere technischen Daten zu analysieren und zu visualisieren sowie zur Skalierung der Infrastruktur beizutragen, die diese Daten in Erkenntnisse umwandelt.

Position Zusammenfassung

Dies ist eine praktische Rolle. Sie werden eng mit dem Leiter der Datenabteilung und unserem technischen Charakterisierungsteam zusammenarbeiten, um Datenpipelines, Transformationen und analytische Modelle zu entwerfen und umzusetzen, die unser Labor, die Fertigung und die Unternehmenssysteme in eine kohärente Datenplattform integrieren. Wir suchen jemanden, der gerne produktiven Python-Code schreibt, klar über Datenmodellierung nachdenken kann und begeistert ist, maschinelles Lernen und KI-Tools auf reale wissenschaftliche und betriebliche Probleme anzuwenden.

Verantwortlichkeiten

  • Datenengineering & Pipeline-Entwicklung: Entwerfen, erstellen und pflegen von skalierbaren Datenpipelines, die Daten aus Laborinstrumenten, PLM (Aras Innovator), ERP (Oracle NetSuite), MES und anderen Betriebssystemen aufnehmen.
  • Entwickeln und verwalten von ELT/ETL-Transformationen mit Python und DBT, unter Anwendung bewährter Praktiken der Softwareentwicklung: Versionskontrolle, Tests, Modularität und Dokumentation.
  • Arbeiten mit Apache Iceberg und Cloud-Objektspeicher (AWS S3 oder GCP GCS), um einen skalierbaren Data Lake zu erstellen und zu verwalten, der sowohl Batch- als auch inkrementelle Verarbeitungsmuster unterstützt.
  • Erstellen und Betreiben verteilter Datenverarbeitungs-Workflows mit Apache Spark für großangelegte Transformationen, Aggregationen und Merkmalsengineering-Aufgaben.
  • Implementieren von Datenqualitätsprüfungen, Schema-Validierung und Pipeline-Überwachung, um sicherzustellen, dass die durch die Plattform fließenden Daten zuverlässig, nachvollziehbar und zweckmäßig sind.
  • Verwalten und Weiterentwickeln der Data Warehouse-Schicht (Tabellendesign, Partitionierungsstrategien, Namenskonventionen und Zugriffssteuerungen), um wachsende analytische Arbeitslasten zu unterstützen.
  • Datenmodellierung & Transformation: Rohdaten aus verschiedenen Quellen (Instrumentenausgaben, optische oder SEM-Bilder, Prozessprotokolle, ERP-Exporte, Metrologie-Dateien) in saubere, gut strukturierte analytische Datensätze übersetzen.
  • Definieren und Pflegen von DBT-Modellen, die Geschäftslogik, Prozessmetriken und systemübergreifende Joins in einer versionskontrollierten, testbaren Weise implementieren.
  • Mit Fachexperten im Bereich integrierte Photonik und RF zusammenarbeiten, um die Datensemantik zu verstehen und sicherzustellen, dass die Modelle die physikalische Realität genau widerspiegeln.
  • Dokumentieren der Datenherkunft, Transformationslogik und Modelldefinitionen, damit nachgelagerte Benutzer vertrauen und verstehen können, womit sie arbeiten.
  • Dashboarding, Reporting & Fertigungssichtbarkeit: Entwerfen und Erstellen von Dashboards, die Prozess- und Designingenieuren, Fertigungsmitarbeitern und der Führungsebene Echtzeit-Einblicke in Wafer-Ausbeute, Prozesskontrollmetriken, schichtweise Leistung und Trends in der Gerätecharakterisierung geben.
  • Entwickeln von geplanten und bedarfsorientierten Berichten, die umsetzbare Fertigungsinformationen (Ausbeutenausreißer, parametrischer Drift, Losgenealogie und Vergleiche zwischen Durchläufen) ohne manuelle Datenaufbereitung bereitstellen.
  • Selbstbedienungs-Datenzugriffstools und gut dokumentierte Datensätze erstellen, damit Ingenieure ihre eigenen Fragen schnell beantworten können.
  • Mit Charakterisierungs- und Prozess-Teams zusammenarbeiten, um die KPIs, Kontrollkarten und Echtzeit-Datenvisualisierungen, statistische Prozesskontrollansichten (SPC), die für die tägliche Entscheidungsfindung in der Fertigung am wichtigsten sind, zu definieren.
  • Die Berichtsebene kontinuierlich verbessern, während neue Prozessschritte, Messarten und Gerätegenerationen eingeführt werden.
  • Fertigungsanalytik, Ausbeute & Prozessoptimierung: Statistische Modelle und maschinelle Lernpipelines entwickeln, die sich auf die Analyse der Wafer-Ausbeute konzentrieren.
  • Prozessoptimierungsmodelle entwickeln, die upstream Prozessparameter mit downstream Geräteleistungen korrelieren, um Analysen des Versuchsdesigns (DOE) und Ursachenuntersuchungen zu unterstützen.
  • Systeme zur Anomalieerkennung erstellen, die außer Kontrolle geratene Prozessbedingungen frühzeitig kennzeichnen, bevor sie zu Ausbeuteverlusten oder Gerätefehlern führen.
  • Modelle in Python mit Bibliotheken wie scikit-learn oder PyTorch erstellen, bewerten und iterieren.
  • Aktuell bleiben mit Fortschritten in wissenschaftlichem ML und Halbleiterprozessanalytik; aufkommende Methoden anwenden, wo sie echte Verbesserungen gegenüber bestehenden Ansätzen bieten.
  • Zusammenarbeit & Dokumentation: Eng mit dem Leiter der Datenabteilung, Charakterisierungsingenieuren und Prozess-Teams zusammenarbeiten, um die Datenbedürfnisse zu verstehen und in gut umschriebene Ingenieurarbeiten zu übersetzen.
  • Klare Dokumentation der Pipeline-Logik, Modelldefinitionen, Datensatz-Schemas und bekannten Datenqualitätsprobleme pflegen.
  • Fortschritte, Blockaden und Erkenntnisse klar schriftlich kommunizieren; zu einer Kultur der Transparenz und des Wissensaustauschs in den Daten- und Engineering-Teams beitragen.

Was Sie mitbringen:

  • Ein kürzlich graduierter oder Branchenexperte mit einem Abschluss in Informatik, Datenwissenschaft, Statistik, Physik, Ingenieurwesen oder einem verwandten quantitativen Bereich.
  • Hintergrund in physikalischen Wissenschaften, Physik, Photonik, Ingenieurwesen, Chemie.
  • Starke Python-Kenntnisse – Sie schreiben sauberen, wartbaren Code und sind mit der Arbeit in einem gemeinsamen Code-Repository mit Versionskontrolle vertraut.
  • Solide SQL-Grundlagen: Sie können komplexe Abfragen schreiben, über die Abfrageleistung nachdenken und ein sinnvolles Schema entwerfen.
  • Vertrautheit mit Cloud-Datenplattformen (AWS oder GCP bevorzugt), einschließlich Objektspeicher, verwalteter Berechnung und cloud-nativer Datenservices.
  • Erfahrung mit Data Warehousing, Apache Iceberg und Cloud-Objektspeicher (AWS S3 oder GCP GCS).
  • Einige praktische Erfahrungen mit Datenpipeline-Tools (DBT, Dagster oder ähnliches).
  • Ein funktionales Verständnis der Grundlagen des maschinellen Lernens: Sie haben Modelle trainiert, sie ordnungsgemäß bewertet und sorgfältig über Überanpassung, Leakage und Generalisierung nachgedacht.
  • Neugier auf LLMs und KI-Agenten.
  • Eine rigorose, detailorientierte Denkweise, und Sie nehmen Datenqualität ernst.

Startup-Mentalität:

  • Eine ergebnisorientierte Denkweise mit einer Leidenschaft für Innovation und Problemlösung. Sie sind proaktiv, übernehmen Verantwortung für Ihre Erfolge und Misserfolge und gedeihen in einem dynamischen Umfeld.

Kommunikation:

  • Ausgezeichnete schriftliche und mündliche Kommunikationsfähigkeiten. Fließend in Englisch ist erforderlich.

Was wir bieten:

  • Wettbewerbsfähiges Vergütungs- und Leistungspaket, einschließlich eines Mitarbeiteraktienoptionsplans (ESOP), vollständig abgedecktem Säule Zwei und großzügigem Urlaub.
  • Eine einzigartige Gelegenheit, eine bahnbrechende Fertigungsinitiative im schnell wachsenden Bereich der Photonik zu leiten.
  • Ein kollaboratives und innovatives Arbeitsumfeld, in dem Ihre Beiträge die Zukunft der Telekommunikation, Datacom und darüber hinaus gestalten werden.
  • Werden Sie ein Schlüsselspieler in einem Startup in der frühen Phase und schließen Sie sich einem jungen, motivierten und energiegeladenen Team an. Sie haben die einzigartige Gelegenheit, Ihre beruflichen Fähigkeiten schnell zu entwickeln und auszubauen.

Abschließende Gedanken:

Wir würden uns freuen, von Ihnen zu hören, wenn Sie leidenschaftlich daran interessiert sind, neue Technologien von Grund auf zu entwickeln und in einem kollaborativen und ergebnisorientierten Umfeld zu gedeihen.

Lightium ist ein Arbeitgeber, der Chancengleichheit bietet. Wir feiern Vielfalt und setzen uns dafür ein, ein integratives Umfeld für alle Mitarbeiter zu schaffen.

Data Engineer / Data Scientist Arbeitgeber: Lightium AG

Lightium bietet eine herausragende Arbeitsumgebung für Data Engineers und Data Scientists, die an der Spitze der photonischen Technologie arbeiten möchten. Mit einem wettbewerbsfähigen Vergütungspaket, flexiblen Arbeitszeiten und einem starken Fokus auf persönliche und berufliche Weiterentwicklung fördert das Unternehmen eine innovative Kultur, in der Teamarbeit und Kreativität geschätzt werden. Hier haben Sie die Möglichkeit, in einem dynamischen Start-up-Umfeld zu wachsen und Ihre Fähigkeiten schnell auszubauen, während Sie an bedeutenden Projekten mitarbeiten, die die Zukunft der Telekommunikation gestalten.

L

Kontaktdaten:

Lightium AG Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Data Engineer / Data Scientist erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der Branche in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden und vielleicht sogar Empfehlungen zu erhalten.

Tipp Nummer 2

Bereite dich auf Vorstellungsgespräche vor, indem du häufige Fragen zu Datenengineering und -wissenschaft übst. Zeige dein Wissen über Python, SQL und Machine Learning, und sei bereit, praktische Beispiele aus deinen bisherigen Projekten zu teilen.

Tipp Nummer 3

Sei proaktiv und zeige Initiative! Wenn du eine interessante Stelle bei uns findest, bewirb dich direkt über unsere Website. Lass uns wissen, warum du die perfekte Ergänzung für unser Team bist!

Tipp Nummer 4

Bleib am Ball und lerne ständig dazu! Verfolge aktuelle Trends in der Datenanalyse und -visualisierung, um immer einen Schritt voraus zu sein. Das zeigt nicht nur dein Engagement, sondern macht dich auch zu einem wertvollen Kandidaten.

Wir glauben, dass du diese Fähigkeiten brauchst, um Data Engineer / Data Scientist mit Bravour zu bestehen

Python
Datenmodellierung
ETL/ELT-Transformationen
DBT
Apache Iceberg
Cloud-Datenplattformen (AWS, GCP)
SQL

Einige Tipps für deine Bewerbung 🫡

Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die leidenschaftlich sind und sich für das, was sie tun, begeistern.

Mach es klar und präzise:Halte deine Bewerbung übersichtlich und auf den Punkt. Verwende klare Sprache und vermeide unnötigen Jargon. Wir wollen schnell verstehen, was du kannst und was du mitbringst!

Zeig deine Fähigkeiten:Nutze die Gelegenheit, um deine technischen Fähigkeiten und Erfahrungen hervorzuheben. Erzähl uns von Projekten, an denen du gearbeitet hast, und wie du Probleme gelöst hast. Das ist wichtig für uns!

Bewirb dich über unsere Website:Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnell bearbeiten können.

Wie man sich auf ein Vorstellungsgespräch bei Lightium AG vorbereitet

Mach dich mit den Technologien vertraut

Bevor du zum Interview gehst, solltest du dir die Technologien und Tools, die in der Stellenbeschreibung erwähnt werden, genau anschauen. Verstehe die Grundlagen von Python, SQL und den Cloud-Plattformen wie AWS oder GCP. Wenn du mit Apache Iceberg oder DBT gearbeitet hast, bringe konkrete Beispiele mit, um deine Erfahrung zu zeigen.

Bereite praktische Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, die du in der Vergangenheit hattest, die relevant für die Rolle sind. Sei bereit, über Herausforderungen zu sprechen, die du gemeistert hast, und wie du Datenpipelines oder analytische Modelle entwickelt hast. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Fähigkeiten.

Fragen stellen ist wichtig

Bereite einige Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und dem Unternehmen. Frage nach den aktuellen Projekten im Bereich Datenanalyse oder wie das Team die Zusammenarbeit zwischen den verschiedenen Abteilungen gestaltet. So kannst du auch herausfinden, ob die Unternehmenskultur zu dir passt.

Zeige deine Leidenschaft für Innovation

In einem Startup-Umfeld ist es wichtig, dass du deine Begeisterung für neue Technologien und Problemlösungen zeigst. Sprich darüber, wie du dich über aktuelle Trends in der Datenwissenschaft und Photonik informierst und wie du diese Kenntnisse in die Praxis umsetzen möchtest. Deine Neugierde und dein Innovationsgeist können entscheidend sein!