Auf einen Blick
- Aufgaben: Architect and scale ETL/ELT pipelines for healthcare datasets while improving data quality workflows.
- Unternehmen: H1 focuses on innovative healthcare solutions, partnering with biotech and life sciences companies.
- Vorteile: Offers a full suite of health insurance, generous paid time off, and flexible work hours.
- Weitere Informationen: Position offers stock options and remote work flexibility.
- Warum dieser Job: Join a critical role in shaping the Data Lake architecture with opportunities for leadership growth.
- Qualifikationen: Requires 8 years of experience in data engineering and strong proficiency in Python and SQL.
Das prognostizierte Gehalt liegt zwischen 60000 - 84000 € pro Jahr.
Als Staff Data Engineer im Data Lake-Team bei H1 spielen Sie eine entscheidende Rolle bei der Gestaltung der Architektur, Skalierbarkeit, Zuverlässigkeit und langfristigen Ausrichtung unserer Kern-Datenplattform. Diese Rolle ist für einen hochqualifizierten Ingenieur konzipiert, der sich darauf freut, in eine Engineering-Manager-Rolle zu wachsen, während er weiterhin tief technisch tätig bleibt.
- Architektur, Aufbau und Skalierung verteilter ETL/ELT-Pipelines und großangelegter Ingestionsframeworks über strukturierte und unstrukturierte Gesundheitsdatensätze.
- Leitung der Weiterentwicklung der Data Lake-Architektur von H1 mit Fokus auf Skalierbarkeit, Beobachtbarkeit, Zuverlässigkeit und Kostenoptimierung.
- Verantwortung für die Verbesserung der Datenqualität, Validierung, Normalisierung und Standardisierungsworkflows über Tausende von globalen Datenquellen.
- Entwurf und Optimierung von Batch- und nahezu Echtzeit-Datenverarbeitungsframeworks unter Verwendung cloud-nativer verteilter Systeme.
- Optimierung verteilter Rechen- und Speichersysteme, einschließlich Spark-Workloads, Abfrageleistung, Partitionierungsstrategien und Infrastruktur-Effizienz.
- Förderung von Verbesserungen in den Bereichen Überwachung, Governance, betriebliche Exzellenz und Produktionszuverlässigkeit über die Plattform.
- Fehlerbehebung bei komplexen Produktionsdaten- und Infrastrukturproblemen über verteilte Systeme.
- Enger Austausch mit Produkt-, Infrastruktur-, Sicherheits-, Compliance- und nachgelagerten Engineering-Teams zur Unterstützung einer skalierbaren und sicheren Datenbereitstellung.
- Mentoring von Ingenieuren durch technische Führung, Architekturüberprüfungen und bewährte Verfahren im Engineering.
- Hilfe bei der Definition technischer Roadmap-Prioritäten und Beitrag zur langfristigen Plattformstrategie und Ausführungsplanung.
- Unterstützung des Produktionsbetriebs, der Vorfallreaktion und der Plattformgesundheit als Teil des Gesamtbesitzes des Data Lake-Ökosystems.
Sie sind ein hochqualifizierter Dateningenieur, der in schlanken, hochverantwortlichen Umgebungen gedeiht und es genießt, komplexe Herausforderungen in verteilten Systemen zu lösen. Sie sind begeistert von der Möglichkeit, die technische Richtung zu beeinflussen, Ingenieure zu betreuen und in breitere Führungsverantwortlichkeiten im Engineering zu wachsen, während Sie weiterhin praktisch tätig sind.
- Sie haben umfassende Erfahrung in der Gestaltung und Skalierung verteilter Datenplattformen und großangelegter Pipelines in cloud-nativen Umgebungen.
- Sie sind hervorragend darin, zuverlässige, beobachtbare und wartbare Datensysteme zu erstellen, die kritische Geschäfts- und Analyse-Workloads unterstützen.
- Sie verfügen über umfangreiche Kenntnisse in der verteilten Verarbeitung, Leistungsoptimierung und modernen Datenarchitekturmustern.
- Sie sind damit vertraut, technische Initiativen zu leiten und Architekturentscheidungen über Teams hinweg zu beeinflussen.
- Sie kommunizieren effektiv mit sowohl technischen als auch nicht-technischen Stakeholdern.
- Sie genießen es, Ingenieure zu betreuen und den Engineering-Standard in Teams zu heben.
- Sie sind motiviert durch Verantwortung, Autonomie und das Lösen von mehrdeutigen technischen Herausforderungen.
ANFORDERUNGEN
- 8 Jahre Erfahrung in der Datenverarbeitung, Softwareentwicklung oder verwandten Bereichen mit umfangreicher Erfahrung im Aufbau und der Skalierung verteilter Datenplattformen.
- Nachgewiesene Erfahrung in der technischen Führung mit Interesse an oder Erfahrung in der Betreuung und Leitung von Ingenieuren.
- Starke Kenntnisse in Python (PySpark), Java, Scala oder ähnlichen Programmiersprachen.
- Fortgeschrittene SQL-Kenntnisse, einschließlich Leistungsoptimierung und -tuning über große Datensätze.
- Tiefe Erfahrung mit Apache Spark und cloud-nativen Big-Data-Plattformen, vorzugsweise in AWS-Umgebungen (EMR, Glue, S3, Athena, Redshift oder ähnlich).
- Erfahrung in der Gestaltung und Skalierung moderner cloud-nativer Data Lake-Architekturen und großangelegter Ingestionsframeworks.
- Erfahrung mit Orchestrierungs- und Workflow-Management-Tools wie Argo, Airflow oder ähnlichen Technologien.
- Starkes Verständnis von verteilten Speichersystemen, Partitionierungsstrategien und Dateiformaten wie Parquet, Avro und ORC.
- Erfahrung mit Docker, Kubernetes und modernen Containerisierungstechnologien.
- Erfahrung in der Implementierung von Überwachungs-, Beobachtungs- und Datenqualitätsframeworks in Produktionsumgebungen.
- Erfahrung mit großangelegter Datenbereinigung, Parsing, Normalisierung und Validierungsworkflows ist von Vorteil.
- Erfahrung in der Arbeit mit Gesundheits-, Lebenswissenschafts-, Publikations- oder großangelegten Entitätsauflösungsdatensätzen ist von Vorteil.
- Kenntnisse in ML/AI-gesteuerten Datenanreicherungs-, Parsing- oder Validierungsworkflows sind ein Plus.
- Erfahrung mit KI-unterstützten Codierungswerkzeugen (z.B. GitHub Copilot, Claude Code), um die Entwicklung zu beschleunigen und gleichzeitig die Qualität aufrechtzuerhalten, wird empfohlen.
VERGÜTUNG
Diese Rolle zahlt 170.000 bis 190.000 USD pro Jahr, basierend auf der Erfahrung, zusätzlich zu Aktienoptionen.
Geplantes Ende der Rolle: 01.08.2026
H1 BIETET
- Vollständige Palette von Krankenversicherungsoptionen sowie großzügige bezahlte Freizeit.
- Geplante unternehmensweite Wellness-Feiertage.
- Rentenoptionen.
- Gesundheits- und gemeinnützige Spendenstipendien.
- Wirkungsvolle Business Resource Groups.
- Flexible Arbeitszeiten und die Möglichkeit, von überall aus zu arbeiten.
- Die Möglichkeit, mit führenden Biotech- und Lebenswissenschaftsunternehmen in einer innovativen Branche zu arbeiten, die sich zum Ziel gesetzt hat, die Gesundheitsversorgung weltweit zu verbessern.
H1 ist stolz darauf, ein Arbeitgeber zu sein, der Chancengleichheit bietet, Vielfalt feiert und sich verpflichtet, einen integrativen Arbeitsplatz mit gleichen Chancen für alle Bewerber und Teamkollegen zu schaffen. H1 verpflichtet sich, mit Bewerbern mit geistigen und/oder körperlichen Behinderungen zusammenzuarbeiten und ihnen Zugang und angemessene Unterkünfte zu bieten. Wenn Sie eine Unterkunft benötigen, wenden Sie sich bitte an Ihren Recruiter, sobald Sie den Interviewprozess begonnen haben.
Staff Data Engineer- Data Lake Arbeitgeber: H1
H1 is located in a dynamic industry focused on improving global healthcare. Employees enjoy wellness holidays and a commitment to diversity and inclusion. The team collaborates closely with leading biotech firms, enhancing their impact in life sciences.