Data Engineer

Data Engineer

Berlin Vollzeit 36000 - 60000 € / Jahr (geschätzt) Home Office möglich
Go Premium
N

Auf einen Blick

  • Aufgaben: Entwickle und optimiere ETL-Pipelines für juristische Daten und arbeite mit generativer KI.
  • Arbeitgeber: Innovatives Unternehmen im Bereich KI und Datenengineering mit einem kollaborativen Team.
  • Mitarbeitervorteile: Flexible Arbeitszeiten, 100% Remote-Arbeit, 26 Tage Urlaub plus Home Office Budget.
  • Warum dieser Job: Gestalte die Zukunft der juristischen Datenverarbeitung und arbeite an spannenden Projekten.
  • Gewünschte Qualifikationen: Erfahrung in AI-Entwicklung oder Datenengineering und starke Python-Kenntnisse.
  • Andere Informationen: Dynamisches Umfeld mit exzellenten Karrierechancen und einem unterstützenden Team.

Das voraussichtliche Gehalt liegt zwischen 36000 - 60000 € pro Jahr.

Unser Angebot für Sie: Als Data Engineer (m/w/d) unterstützen Sie die Entwicklung unserer rechtlichen Daten- und Suchinfrastruktur von Anfang bis Ende. Sie entwerfen, warten und optimieren robuste ETL-Pipelines, die XML-basierte rechtliche Daten aus mehreren Jurisdiktionen bereinigen und normalisieren, während Sie skalierbare Datenmodelle und Strategien zur Anreicherung von Metadaten entwickeln, um die Durchsuchbarkeit, semantische Relevanz und Benutzerfreundlichkeit von rechtlichen Informationen für nachgelagerte KI-Agenten und Produkte zu maximieren.

Ein wichtiger Teil Ihrer Rolle wird es sein, generative KI dort einzusetzen, wo es sinnvoll ist, um die Datenverarbeitung und die Generierung von Metadaten zu verbessern, während Sie kontinuierlich die Datenbank- und Suchleistung benchmarken und optimieren, um eine effiziente, latenzarme Abfrage in großem Maßstab sicherzustellen.

Sie arbeiten eng mit Produktteams, KI-Forschern und Experten im Rechtsbereich zusammen, um qualitativ hochwertige, zuverlässige Datenlösungen zu liefern, die den Wert komplexer, mehrsprachiger rechtlicher Inhalte erschließen.

Ihr Team: Sie werden unserem Data Team beitreten, das eng mit einer Gruppe von etwa 5 Datenexperten zusammenarbeitet. Dieses hochgradig kollaborative Team konzentriert sich darauf, die Grenzen von generativer KI, natürlicher Sprachverarbeitung und datenschutzfreundlichen maschinellen Lernlösungen im Rechtsbereich zu erweitern.

Ihr Einstellungsmanager: Felix, unser Direktor für KI & Datenengineering, wird Sie auf Ihrer Reise bei Noxtua begleiten. Mit tiefem Fachwissen in KI-Systemen führt Felix mit einer Leidenschaft für Innovation und einem kollaborativen Ansatz, um sicherzustellen, dass jedes Teammitglied gedeiht.

Vorteile:

  • Arbeitszeiten: Flexible Arbeitszeiten
  • Urlaub: 26 Tage + 24. und 31. Dezember frei, +1 Tag für jedes Jahr der Anstellung (maximal 30 Tage)
  • Remote: 100% Remote-Arbeit möglich (bei Vorliegen eines EU-Aufenthalts-/Arbeitserlaubnis in einem der folgenden Länder: Österreich, Kroatien, Deutschland, Polen & Slowakei) mit der Flexibilität, unsere Büros in Berlin, München, Paris oder Zagreb zu nutzen
  • Home Office Setup Budget: 1.000 € bei Ihrem ersten Gehalt zur Schaffung Ihres idealen Remote-Arbeitsplatzes
  • Ausrüstung: Laptop (Lenovo oder Mac)
  • Rabatte: z.B. Urban Sports Club Mitgliedschaft je nach Standort

Ihre Verantwortlichkeiten:

  • Entwerfen, Erstellen und Optimieren von End-to-End-ETL-Pipelines für rechtliche Daten aus mehreren Jurisdiktionen, einschließlich Aufnahme, Validierung, Bereinigung, Transformation, Chunking, Einbettung und Aufnahme in Vektordatenbanken.
  • Umfassende Arbeit mit XML-basierten rechtlichen Datenfeeds: Parsen, Validieren, Normalisieren und Transformieren komplexer XML-Strukturen in skalierbare interne Schemata und einheitliche Dokumentformate.
  • Entwickeln und Pflegen von Datenmodellen und Speicherschemata, die kontinuierlich aktualisierte Datensätze unterstützen und dabei Konsistenz, Skalierbarkeit und Genauigkeit über verschiedene Datensätze und große Datenmengen hinweg sicherstellen.
  • Koordinieren der Datenübergabe und -integration von mehreren internen und externen Datenanbietern, einschließlich offizieller Quellen, APIs und Web-Scraping-Pipelines, um zuverlässige und zeitnahe Updates sicherzustellen.
  • Implementieren und kontinuierlich Verfeinern von Strategien zur Anreicherung von Metadaten, um die Durchsuchbarkeit, die Qualität des Rankings und die Relevanz von rechtlichen Informationen in Vektordatenbanken zu maximieren.
  • Aufbauen und Pflegen einer leistungsstarken Such- und Abrufinfrastruktur, die es agentenbasierten Systemen ermöglicht, Suchfunktionen aufzurufen und die relevantesten rechtlichen Informationen effizient abzurufen.
  • Erforschen und Integrieren von Techniken der generativen KI zur Verbesserung von Datenverarbeitungsabläufen wie strukturierter Feldeextraktion, Metadatengenerierung und Dokumentnormalisierung.
  • Experimentieren mit verschiedenen Einbettungs- und Chunking-Strategien, einschließlich Evaluierung.
  • Durchführen von Leistungsbenchmarks und Tuning von Datenbanken, um eine effiziente Abfrageausführung und Skalierbarkeit sicherzustellen.
  • Zusammenarbeiten mit Produkt-, KI- und Rechtsexperten, um qualitativ hochwertige, zuverlässige Datenlösungen zu liefern.

Was Sie nach 6 Monaten erwarten können:

Unsere Tech-Stack:

  • Programmiersprachen: Python
  • Datenformat: XML, Parquet
  • Vektorsuche: ElasticSearch, Qdrant
  • Graphdatenbanken: Neo4j, Amazon Neptune
  • Bibliotheken: HuggingFace, Transformers, NumPy, Pandas, Pydantic, FastAPI, OpenAI & PyTorch
  • Deployment-Tools: Docker
  • Cloud-Infrastruktur: OTC, AWS
  • Pipelines-Orchestrierung: Apache Airflow
  • Ticket-System: Atlassian JIRA
  • Repository: Github
  • CI/CD-System: GitHub Actions
  • Dokumentation: Confluence
  • Kommunikation: Slack
  • Büroanwendung: MS365

Über Sie:

  • Aufenthalts- & Arbeitserlaubnis: in/für eines der folgenden Länder: Österreich, Kroatien, Deutschland, Polen & Slowakei
  • Sprache: Englischkenntnisse auf C2-Niveau
  • Erfahrung: in der KI-Entwicklung oder Datenengineering mit erfolgreich umgesetzten Projekten
  • RAG-Systeme: Erfahrung im Aufbau von KI-spezifischen RAG-Pipelines
  • Daten: Expertise in Datenverarbeitung, Filterung und Anreicherung
  • Datenbanken: Expertise in Vektordatenbanken, Daten-Einbettung, Benchmarking und Management
  • Programmierung: Starke Python-Kenntnisse und Erfahrung mit KI-Pipelines

OPTIONAL:

  • Erfahrung im Einsatz von Graphdatenbanken
  • NLP & Generative KI: Vertrautheit mit der Entwicklung und dem Einsatz von NLP, generativen KI-Modellen
  • Vertrautheit mit Kubernetes-Deployments
  • Rechtliches Hintergrundwissen

Klingt gut? Dann freuen wir uns auf den Erhalt Ihres Lebenslaufs über unser Online-Bewerbungsformular.

Data Engineer Arbeitgeber: Noxtua AG

Noxtua ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, in einem innovativen und dynamischen Umfeld zu arbeiten. Mit flexiblen Arbeitszeiten, der Option auf 100% Remote-Arbeit und einem großzügigen Urlaubspaket von bis zu 30 Tagen fördert das Unternehmen eine ausgewogene Work-Life-Balance. Zudem legt Noxtua großen Wert auf die persönliche und berufliche Weiterentwicklung seiner Mitarbeiter, unterstützt durch ein engagiertes Team und modernste Technologien im Bereich KI und Datenverarbeitung.
N

Kontaktperson:

Noxtua AG HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Data Engineer

Netzwerken, Netzwerken, Netzwerken!

Nutze Plattformen wie LinkedIn, um mit anderen Data Engineers und Fachleuten in der Branche in Kontakt zu treten. Teile deine Projekte und Erfahrungen, um sichtbar zu werden und vielleicht sogar Empfehlungen zu erhalten.

Sei bereit für technische Interviews!

Bereite dich auf technische Fragen und praktische Aufgaben vor, die deine Fähigkeiten in Python und Datenverarbeitung testen. Übe mit Coding-Challenges und sei bereit, deine Lösungsansätze zu erklären.

Zeige deine Leidenschaft für AI!

Sprich über deine Erfahrungen mit generativer KI und wie du diese Technologien in deinen Projekten eingesetzt hast. Arbeitgeber suchen nach Kandidaten, die nicht nur die technischen Fähigkeiten haben, sondern auch eine echte Begeisterung für das Feld zeigen.

Bewirb dich direkt über unsere Website!

Wir freuen uns, wenn du dich über unser Online-Bewerbungsformular bewirbst. So kannst du sicherstellen, dass deine Bewerbung direkt bei uns landet und wir dich schnellstmöglich kontaktieren können.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Data Engineer

ETL-Pipelines
XML-Datenverarbeitung
Datenmodellierung
Metadatenanreicherung
Suchmaschinenoptimierung
Generative KI
Datenbank-Performance-Tuning
Python
ElasticSearch
Neo4j
Apache Airflow
Docker
Datenfilterung und -augmentation
NLP
Kubernetes

Tipps für deine Bewerbung 🫡

Mach es persönlich!: Zeig uns, wer du bist! Verwende in deinem Anschreiben eine persönliche Ansprache und erzähle uns, warum du dich für die Stelle als Data Engineer interessierst. Das macht deine Bewerbung einzigartig und hebt dich von anderen ab.

Betone deine Erfahrungen: Erzähle uns von deinen bisherigen Projekten im Bereich Datenengineering oder KI. Zeige konkret auf, wie du ETL-Pipelines entwickelt oder mit XML-Daten gearbeitet hast. Das hilft uns, deine Fähigkeiten besser einzuschätzen!

Sei klar und strukturiert: Achte darauf, dass dein Lebenslauf und dein Anschreiben gut strukturiert sind. Verwende klare Überschriften und Absätze, damit wir schnell die wichtigsten Informationen finden können. Ein übersichtliches Layout macht einen guten Eindruck!

Bewirb dich über unsere Website: Wir freuen uns, wenn du dich direkt über unser Online-Bewerbungsformular bewirbst. So können wir deine Bewerbung schneller bearbeiten und du bist direkt im richtigen System. Lass uns gemeinsam durchstarten!

Wie du dich auf ein Vorstellungsgespräch bei Noxtua AG vorbereitest

Verstehe die ETL-Prozesse

Mach dich mit den Grundlagen der ETL-Pipelines vertraut, insbesondere im Kontext von XML-Daten. Sei bereit, spezifische Beispiele aus deiner Erfahrung zu teilen, wie du Daten gereinigt und transformiert hast.

Kenntnisse in generativer KI zeigen

Da generative KI ein wichtiger Bestandteil der Rolle ist, solltest du konkrete Anwendungen oder Projekte nennen, bei denen du diese Technologien genutzt hast. Zeige, dass du die Möglichkeiten und Herausforderungen verstehst.

Teamarbeit betonen

Die Zusammenarbeit mit Produktteams und Experten ist entscheidend. Bereite Beispiele vor, die deine Teamfähigkeit und deine Erfahrungen in interdisziplinären Projekten verdeutlichen.

Fragen vorbereiten

Bereite einige durchdachte Fragen vor, die sich auf die Unternehmenskultur, die Teamdynamik und die spezifischen Herausforderungen der Rolle beziehen. Das zeigt dein Interesse und deine Vorbereitung.

Data Engineer
Noxtua AG
Standort: Berlin
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>