Data Engineer (m/f/d)

Data Engineer (m/f/d)

Berlin Vollzeit 45000 - 65000 € / Jahr (geschätzt) Homeoffice möglich
Noxtua

Auf einen Blick

  • Aufgaben: Entwickle und optimiere ETL-Pipelines für rechtliche Daten aus verschiedenen Jurisdiktionen.
  • Unternehmen: Noxtua, Europas führendes Unternehmen für rechtliche KI mit innovativer Kultur.
  • Vorteile: 100% Remote-Arbeit, flexible Arbeitszeiten, 26 Urlaubstage plus zusätzliche Tage.
  • Weitere Informationen: Dynamisches Team mit exzellenten Wachstums- und Entwicklungsmöglichkeiten.
  • Warum dieser Job: Gestalte die Zukunft der rechtlichen KI und arbeite an bedeutenden Projekten.
  • Qualifikationen: Mindestens 2 Jahre Erfahrung in der Datenverarbeitung und starke Python-Kenntnisse.

Das prognostizierte Gehalt liegt zwischen 45000 - 65000 € pro Jahr.

Ihr Team

Als Data Engineer (f/d/m) spielen Sie eine Schlüsselrolle in unserem Data Expansion Squad, der für die Integration und Operationalisierung von rechtlichen Daten aus mehreren Jurisdiktionen verantwortlich ist. Das Team transformiert heterogene Quelldaten in eine einheitliche, qualitativ hochwertige Grundlage, die Such-, Abruf- und KI-unterstützte Workflows in unseren Produkten antreibt. Felix, unser VP AI & Data Engineering, wird Sie auf Ihrer Reise bei Noxtua begleiten. Mit tiefem Fachwissen in KI-Systemen führt Felix mit einer Leidenschaft für Innovation und einem kollaborativen Ansatz, um sicherzustellen, dass jedes Teammitglied gedeiht. Sie werden eng mit Experten aus den Bereichen KI, Technik und Recht zusammenarbeiten, um bestehende Daten-Workflows für neue Kundendatensätze und Quellformate anzupassen und zu erweitern. Ihre Arbeit konzentriert sich auf das Verständnis von Quellstrukturen, die Definition robuster Zuordnungen, die Standardisierung und Anreicherung von Inhalten sowie die Gewährleistung, dass Daten auf eine zuverlässige, skalierbare und benutzerfreundliche Weise in nachgelagerten Systemen integriert werden.

Unser Tech-Team besteht aus rund 32 Personen, darunter UI-Engineers, UI-Designer, AI-Engineers, Data Engineers sowie Fullstack-, Backend- und DevOps-Engineers. Innerhalb dieses Teams bietet das Data Expansion Team die Datenbasis, Struktur und Metadaten, die benötigt werden, damit unsere agentenbasierten Systeme relevante rechtliche Informationen effizient und zuverlässig über Jurisdiktionen hinweg abrufen können.

Über Sie

  • Erfahrung: mindestens 2 Jahre Berufserfahrung im Bereich Data Engineering und Beteiligung an erfolgreich umgesetzten Projekten
  • Programmierung: Starke Python-Kenntnisse mit Erfahrung im Entwurf robuster Datenpipelines
  • Technische Expertise: Erfahrung im Aufbau und in der Wartung zuverlässiger ET- und RAG-Pipelines sowie ein solides Verständnis von Datenmodellierung, Qualität, Filterung, Validierung und Konsistenz
  • Infrastruktur: Vertrautheit mit Containerisierung (Docker), CI/CD-Pipelines und Versionskontrolle (Git)
  • Fundamente: Starkes Verständnis von Datenstrukturen, Algorithmen, Prinzipien des Systemdesigns und Best Practices der Softwareentwicklung
  • Zusätzliche Kenntnisse: Expertise in der Arbeit mit Graphdatenbanken und Vertrautheit mit der Entwicklung und Bereitstellung von NLP-Modellen ist ein Bonus
  • Sprache: Englischkenntnisse auf C2-Niveau

Ihre Aufgaben

  • Entwerfen, bauen und optimieren Sie End-to-End-ETL-Pipelines für rechtliche Daten aus mehreren Jurisdiktionen, einschließlich Reinigung, Transformation, Chunking, Validierung, Einbettung und Eingabe in Vektordatenbanken
  • Arbeiten Sie intensiv mit XML-basierten rechtlichen Datenfeeds: Parsen, Validieren, Normalisieren und Transformieren von XML-Strukturen in skalierbare interne Schemata und einheitliche Dokumentformate
  • Entwickeln und pflegen Sie Datenmodelle und Speicherschemata, die kontinuierlich aktualisierte Datensätze unterstützen und dabei Konsistenz, Skalierbarkeit und Genauigkeit über verschiedene Datensätze und große Datenmengen hinweg gewährleisten
  • Koordinieren Sie die Datenübergabe und -integration von mehreren internen und externen Datenanbietern, einschließlich offizieller Quellen, APIs und Web-Scraping-Pipelines, um zuverlässige und zeitnahe Updates sicherzustellen
  • Implementieren und verfeinern Sie kontinuierlich Strategien zur Anreicherung von Metadaten, um die Durchsuchbarkeit, die Qualitätsbewertung und die Relevanz rechtlicher Informationen in Vektordatenbanken zu maximieren
  • Aufbauen und pflegen Sie eine leistungsstarke Such- und Abrufinfrastruktur, die es agentenbasierten Systemen ermöglicht, Suchfunktionen aufzurufen und die relevantesten rechtlichen Informationen effizient abzurufen
  • Zusammenarbeiten mit Produkt-, KI- und Rechtsexperten, um qualitativ hochwertige, zuverlässige Datenlösungen zu liefern
  • Verantwortung für die Datenintegration einer Jurisdiktion von Anfang bis Ende

Unser Angebot an Sie

Den Aufbau von Europas souveräner Legal AI ist ehrgeizige, sinnvolle Arbeit – und wir möchten, dass die Menschen, die dies tun, gut betreut werden. Unsere Vorteile basieren auf Flexibilität, Echtzeit-Auszeiten zum Auftanken und der Möglichkeit, von überall aus Ihre beste Arbeit zu leisten.

  • Remote: 100% Remote-Arbeit möglich (bei Wohnsitz in Deutschland), andere Länder auf Anfrage
  • Arbeitszeiten: Flexible Arbeitszeiten
  • Urlaub: 26 Tage + 24. und 31. Dezember frei, + 1 zusätzlicher Urlaubstag pro Jahr der Beschäftigung (bis zu 30 Tage)
  • Rabatte: z.B. Urban Sports Club Mitgliedschaft, je nach Standort
  • Ausstattung: Laptop (Lenovo oder Mac), plus 1.000 € netto Budget für die Homeoffice-Ausstattung (ausgezahlt mit Ihrem ersten Gehalt)

Über uns

Noxtua ist Europas souveräne Legal AI. Diese rechtlich kompetente KI deckt das gesamte Spektrum der rechtlichen Textarbeit ab – von der Informationsbeschaffung (Recherche) und Analyse komplexer Fragestellungen (Verständnis) bis hin zur Dokumentenerstellung (Entwurf). Die rechtlich konforme KI erfüllt die professionellen, strafrechtlichen und datenschutzrechtlichen Anforderungen für Anwälte (z.B. § 203 StGB, § 43e BRAO), ist nach BSI C5, TISAX, ISO 27001, 9001, 27018, 27017 und 42001 zertifiziert. Das Technologieunternehmen Noxtua hat exklusive Partnerschaften mit führenden europäischen Verlagen aus Deutschland, Österreich, der Schweiz, Polen, der Tschechischen Republik und der Slowakei für die Legal AI Workspaces Beck-Noxtua, MANZ-Noxtua, Swiss-Noxtua, Beck-Noxtua Polen, Beck-Noxtua Tschechische Republik und Beck-Noxtua Slowakei geschlossen. Gegründet 2017 in der deutschen Hauptstadt als Ergebnis eines Forschungsprojekts von Dr. Leif-Nissen Lundbæk und Professor Dr. Michael Huth an der Universität Oxford und dem Imperial College London, hat das europäische Legal-Tech-Unternehmen viele Jahre Erfahrung in der Entwicklung von GDPR-konformen KI-Lösungen und hat jetzt Büros in Paris, Berlin, Zagreb und München. Strategische Partner, darunter Deutschlands führender Rechtsverlag C.H.BECK sowie die führenden Kanzleien CMS und Dentons, haben rund 81 Millionen Euro in das europäische Scaleup im Rahmen seiner Series B investiert. Wir ermutigen ausdrücklich Frauen zur Bewerbung, da sie derzeit unterrepräsentiert sind. Unser Ziel ist es, ein diverses und inklusives Arbeitsumfeld zu schaffen, das unterschiedliche Perspektiven wertschätzt. Natürlich begrüßen wir Bewerbungen von allen qualifizierten Personen – unabhängig von Geschlecht, ethnischer Herkunft, Religion, Behinderung, Alter oder sexueller Identität.

Data Engineer (m/f/d) Arbeitgeber: Noxtua

Noxtua ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, an bedeutenden und innovativen Projekten im Bereich der rechtlichen KI zu arbeiten. Mit flexiblen Arbeitszeiten, der Option auf 100% Remote-Arbeit und einem großzügigen Urlaubspaket von bis zu 30 Tagen fördert das Unternehmen eine ausgewogene Work-Life-Balance. Zudem legt Noxtua großen Wert auf persönliche Entwicklung und bietet ein unterstützendes, inklusives Arbeitsumfeld, in dem Vielfalt geschätzt wird.

Noxtua

Kontaktdaten:

Noxtua Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Data Engineer (m/f/d) erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach ihren Erfahrungen und Tipps – das kann dir helfen, einen Fuß in die Tür zu bekommen.

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe Coding-Challenges und sei bereit, deine Datenpipelines und -modelle zu erklären. Zeig, dass du nicht nur die Theorie kennst, sondern auch praktisch anwenden kannst.

Tipp Nummer 3

Sei proaktiv und zeig dein Interesse! Wenn du eine Stelle siehst, die dir gefällt, bewirb dich direkt über unsere Website. Lass uns wissen, warum du perfekt ins Team passt und was du beitragen kannst.

Tipp Nummer 4

Mach dich mit den neuesten Trends in der Datenverarbeitung vertraut! Sei es durch Online-Kurse oder Webinare – je mehr du weißt, desto besser kannst du im Gespräch punkten und zeigen, dass du am Puls der Zeit bist.

Wir glauben, dass du diese Fähigkeiten brauchst, um Data Engineer (m/f/d) mit Bravour zu bestehen

Datenengineering
Python
ETL-Pipelines
Datenmodellierung
Datenqualität
Containerisierung (Docker)
CI/CD-Pipelines

Einige Tipps für deine Bewerbung 🫡

Sei du selbst!:Wir wollen dich kennenlernen, also zeig uns, wer du wirklich bist! Lass deine Persönlichkeit in deiner Bewerbung durchscheinen und sei authentisch. Das macht einen großen Unterschied!

Pass auf die Details auf!:Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können schnell einen schlechten Eindruck hinterlassen. Nimm dir die Zeit, alles gründlich zu überprüfen!

Zeig deine Erfahrungen!:Erzähle uns von deinen bisherigen Projekten und Erfahrungen im Bereich Data Engineering. Konkrete Beispiele helfen uns, deine Fähigkeiten besser einzuschätzen und zu verstehen, wie du ins Team passt.

Bewirb dich über unsere Website!:Der einfachste Weg, um Teil unseres Teams zu werden, ist die Bewerbung über unsere Website. So stellst du sicher, dass deine Unterlagen direkt bei uns landen und wir sie schnellstmöglich prüfen können!

Wie man sich auf ein Vorstellungsgespräch bei Noxtua vorbereitet

Verstehe die Datenstrukturen

Mach dich mit den verschiedenen Datenstrukturen und -formaten vertraut, die in der Stellenbeschreibung erwähnt werden. Zeige im Interview, dass du die Herausforderungen bei der Integration von rechtlichen Daten aus verschiedenen Jurisdiktionen verstehst und bereit bist, Lösungen zu entwickeln.

Zeige deine Programmierkenntnisse

Bereite dich darauf vor, deine Python-Kenntnisse zu demonstrieren. Du könntest gebeten werden, ein Beispiel für einen robusten ETL-Prozess zu erläutern oder sogar eine kleine Programmieraufgabe zu lösen. Übe vorher, um sicherzustellen, dass du selbstbewusst auf technische Fragen antworten kannst.

Sprich über Teamarbeit

Da die Rolle viel Zusammenarbeit mit Experten aus verschiedenen Bereichen erfordert, sei bereit, Beispiele für erfolgreiche Teamprojekte zu teilen. Betone, wie du in der Vergangenheit mit anderen zusammengearbeitet hast, um komplexe Datenlösungen zu entwickeln und welche Rolle du dabei gespielt hast.

Bereite Fragen vor

Stelle sicher, dass du einige durchdachte Fragen an die Interviewer hast. Frage nach den aktuellen Herausforderungen des Data Expansion Teams oder wie sie die Qualität der Daten sicherstellen. Das zeigt dein Interesse an der Position und hilft dir, mehr über das Unternehmen zu erfahren.