Die Transformation globaler Lebensmittelsysteme ist entscheidend, um die Klimakrise zu bekämpfen und Menschen sowie den Planeten zu schützen. Wir glauben, dass eine neue und andere Art von Transparenz erforderlich ist, um diesen Wandel voranzutreiben. Deshalb haben wir OpenSC gegründet - mitinitiiert von WWF und der Boston Consulting Group. Unsere Plattform nutzt Daten direkt aus den Lieferketten unserer Kunden und analysiert sie, um direkte, umsetzbare Erkenntnisse über nachhaltige und ethische Produktion zu schaffen.
Diese neue Art von Transparenz ermöglicht es unseren Kunden, die Nachhaltigkeit ihrer Lieferketten zu kennen, zu beeinflussen und nachzuweisen.
Aufgaben:
- Weiterentwicklung und Aufbau der OpenSC-Datenplattform in allen Datenbereichen: Sammlung, Speicherung, Transformation und Analyse
- Entwicklung hochwertiger Datenpipelines, die strukturierte, semi-strukturierte und unstrukturierte Daten aus verschiedenen Quellen in ein standardisiertes Datenmodell transformieren
- Erweiterung des OpenSC-Datenmodells zur Berücksichtigung einer wachsenden Anzahl von Anwendungsfällen
- Übernahme der Verantwortung für die geschäftliche Interpretation von Daten und aktive Mitwirkung an Datenwissenschafts- und Analyseprojekten
- Einhalten von Best Practices der Softwareentwicklung hinsichtlich Versionskontrolle, Tests, Code-Reviews, Bereitstellung usw.
- Bereitstellung von Unterstützung und Anleitung zu Themen der Datensicherheit und Cloud-Infrastruktur, um eine sichere und effiziente Handhabung von Daten zu gewährleisten
- Effektive Kommunikation mit technischen und nicht-technischen Stakeholdern
- Beitrag zur Weiterentwicklung des Teams durch Wissensaustausch über Best Practices im Bereich Datenengineering
Anforderungen:
- 4+ Jahre relevante Branchenerfahrung in der Entwicklung produktionsreifer Datenprodukte
- Nachgewiesene solide Grundlage in den Kernkonzepten der Daten (z.B. Integration, Modellierung, Sicherheit, Herkunft, Governance usw.)
- Ausgezeichnete Python-Kenntnisse und fortgeschrittene Kompetenzen mit den wichtigsten Bibliotheken des Datenökosystems
- Fortgeschrittene Kenntnisse in SQL und relationalen Datenbanken (z.B. PostgreSQL, dbt)
- Kenntnisse in Cypher und Graphdatenbanken (z.B. Neo4j, Kuzu usw.)
- Erfahrung mit Orchestrierungstools für Datenpipelines (z.B. Dagster, Airflow usw.)
- Erfahrung in der Arbeit mit Cloud-Infrastruktur und -Diensten (idealerweise auf AWS)
- Erfahrung mit verschiedenen Datenmodellierungsmustern und die Fähigkeit, komplexe reale Informationen in eine standardisierte Datenmodellbeschreibung zu abstrahieren
- Nachgewiesene Vertrautheit mit Versionskontrolle (Git), Containerisierung (Docker, Kubernetes), CI/CD (z.B. CircleCi, Github Actions), IaC (Terraform)
- Starke zwischenmenschliche Fähigkeiten und die Fähigkeit, in einem multidisziplinären und multikulturellen Team zu arbeiten
Data Engineer Arbeitgeber: OpenSC

Kontaktperson:
OpenSC HR Team