Internship : Testing Data Migrations with Synthetic Data: AI-powered approach
Internship : Testing Data Migrations with Synthetic Data: AI-powered approach

Internship : Testing Data Migrations with Synthetic Data: AI-powered approach

Pully Praktikum 500 - 1500 € / Monat (geschätzt) Home Office möglich (teilweise)
Go Premium
ELCA Informatique SA

Auf einen Blick

  • Aufgaben: Entwickle ein System zur Generierung realistischer Testdatensätze für Migrationstests.
  • Arbeitgeber: Innovatives Unternehmen mit einem dynamischen, multikulturellen Team.
  • Mitarbeitervorteile: Kreatives Arbeitsumfeld, internationale Zusammenarbeit und die Möglichkeit, einen Unterschied zu machen.
  • Andere Informationen: Teilnahme an internen Coding-Events und monatlichen After-Works.
  • Warum dieser Job: Arbeite an spannenden Projekten, die echte Auswirkungen auf die Technologie haben.
  • Gewünschte Qualifikationen: Starke Python-Kenntnisse und Verständnis von relationalen Datenbanken erforderlich.

Das voraussichtliche Gehalt liegt zwischen 500 - 1500 € pro Monat.

Data-Plattform-Migrationen sind in Unternehmensumgebungen üblich, da sie von Altsystemen zu moderner Infrastruktur wechseln und dabei die Geschäftslogik bewahren. Die technische Herausforderung besteht nicht nur in der Syntaxübersetzung, sondern auch in der Validierung. Wenn Entwickler SQL-Skripte oder Datenpipelines zwischen Plattformen migrieren, stehen sie vor unterschiedlichen Ausführungsumgebungen, geänderten Datenzugriffsberechtigungen und haben keine sichere Möglichkeit, gegen Produktionsdaten zu testen.

Dieses Praktikum befasst sich mit der Generierung synthetischer Daten für das Testen von Migrationsskripten. Sie werden ein System entwerfen und implementieren, das realistische Testdatensätze generiert, die die Struktur und das Verhalten der Produktion widerspiegeln, ohne sensible Informationen offenzulegen. Es gibt verschiedene Ansätze: Es könnte sich um einen kleinen Datensatz handeln, der in einem Git-Repository lebt, oder um ein vollwertiges synthetisches Datenlager. Dennoch müssen die Daten realistisch genug sein, um echte Fehler zu erkennen.

Die Herausforderung geht über einfaches Daten-Mocking hinaus. Sie müssen entscheiden, ob Sie aus echten Daten (Anonymisierungsrisiken), nur aus der Abfrageanalyse (erfordert gute Dokumentation) oder hybriden Ansätzen generieren. Sollten kategoriale Werte genau mit der Produktion übereinstimmen oder können wir sie ersetzen und die Skripte anpassen? Können wir Unit-Tests auf End-to-End-Tests erweitern, und welche Eigenschaften sollten die erforderlichen Datensätze haben?

Ein Teil der Arbeit besteht darin, eine Evaluierungsmethodik zu etablieren – möglicherweise durch das Sammeln eines Referenzsatzes von Migrationsskripten und deren erwarteten Verhaltensweisen, um zu messen, wie gut verschiedene synthetische Datenansätze echte Probleme erfassen. Es besteht die Möglichkeit, multi-agenten Architekturen zu erkunden, bei denen spezialisierte Agenten verschiedene Aspekte behandeln: Schema-Analyse, Einschränkungsextraktion, Datengenerierung, Anonymisierungsüberprüfung und Testvalidierung. Dies ist angewandte Forschung mit unmittelbarem Einfluss auf die Produktion.

Ziele:

  • Entwicklung einer Strategie für das Testen von Migrationsskripten, die Realismus, Anonymisierung und praktische Einschränkungen ausbalanciert
  • Implementierung eines Proof-of-Concept-Systems, das Testdatensätze aus Schemadokumentationen, bestehenden Abfragen oder (vorsichtig) gesampelten Produktionsdaten generiert
  • Definition von Teststrategien: Unit-Tests vs. End-to-End-Tests, minimale Datenmengen usw.
  • Entwicklung einer Evaluierungsmethodik zur Messung der Effektivität verschiedener Ansätze zur Generierung synthetischer Daten
  • Erforschung von Multi-Agenten-Architekturen zur Zerlegung der Generierungspipeline in spezialisierte Komponenten (Schema-Analyse, Erfüllung von Einschränkungen, Validierung)

Unser Angebot:

  • Ein dynamisches Arbeits- und Kooperationsumfeld mit einem hochmotivierten, multikulturellen und internationalen Team
  • Die Chance, das Leben der Menschen zu verändern, indem innovative Lösungen entwickelt werden
  • Verschiedene interne Codierungsveranstaltungen (Hackathon, Brownbags), siehe unseren technischen Blog
  • Monatliche After-Works, die standortspezifisch organisiert werden

Erforderliche Fähigkeiten:

  • Starke Python-Programmierung: Datenverarbeitung, Testmuster, CI/CD-Integration
  • Verständnis relationaler Datenbanken, SQL und Konzepte des Datenmodells
  • Erfahrung mit LLMs und agentischen Systemen: Aufforderung, Werkzeugnutzung, Multi-Agenten-Orchestrierung
  • Vertrautheit mit Datensicherheit und Konzepten der Datenanonymisierung
  • Problemlösungsmentalität: Komfort mit mehrdeutigen Anforderungen und fundierten technischen Abwägungen
  • Klare technische Schreib- und Dokumentationsfähigkeiten

Internship : Testing Data Migrations with Synthetic Data: AI-powered approach Arbeitgeber: ELCA Informatique SA

Unser Unternehmen bietet ein dynamisches und kollaboratives Arbeitsumfeld, in dem internationale Teams zusammenarbeiten, um innovative Lösungen zu entwickeln, die das Leben der Menschen verbessern. Wir fördern eine Kultur des kontinuierlichen Lernens und bieten zahlreiche Möglichkeiten zur beruflichen Weiterentwicklung, einschließlich interner Coding-Events und Hackathons. Durch die Arbeit an spannenden Projekten im Bereich der synthetischen Datengenerierung haben Sie die Möglichkeit, einen direkten Einfluss auf unsere Produktionsprozesse zu nehmen und Ihre Fähigkeiten in einem unterstützenden Umfeld weiter auszubauen.
ELCA Informatique SA

Kontaktperson:

ELCA Informatique SA HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Internship : Testing Data Migrations with Synthetic Data: AI-powered approach

Tipp Nummer 1

Mach dir eine Liste von Unternehmen, die dich interessieren, und besuche deren Karriereseiten. Oft gibt es dort Stellenangebote, die nicht auf großen Jobportalen zu finden sind. Wir bei StudySmarter empfehlen, direkt über unsere Website zu bewerben!

Tipp Nummer 2

Networking ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach Informationen über offene Stellen oder Tipps für den Bewerbungsprozess. Wir können uns gegenseitig unterstützen!

Tipp Nummer 3

Bereite dich gut auf Vorstellungsgespräche vor. Informiere dich über das Unternehmen und die spezifische Rolle, für die du dich bewirbst. Übe häufige Interviewfragen und überlege dir, wie du deine Fähigkeiten am besten präsentieren kannst. Bei StudySmarter helfen wir dir gerne dabei!

Tipp Nummer 4

Sei proaktiv und folge nach dem Gespräch nach! Ein kurzes Dankeschön per E-Mail kann einen bleibenden Eindruck hinterlassen. Zeig dein Interesse an der Position und an dem Unternehmen. Und vergiss nicht, dich über unsere Website zu bewerben!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Internship : Testing Data Migrations with Synthetic Data: AI-powered approach

Python-Programmierung
Datenverarbeitung
Testmuster
CI/CD-Integration
Verständnis von relationalen Datenbanken
SQL
Datenmodellierungskonzepte
Erfahrung mit LLMs
Agentensystemen
Datenanonymisierungskonzepte
Problemlösungsmentalität
Technische Dokumentationsfähigkeiten

Tipps für deine Bewerbung 🫡

Sei authentisch!: Zeig uns, wer du wirklich bist! Verwende deine eigene Stimme und schreibe so, wie du sprichst. Das macht deine Bewerbung persönlicher und hebt dich von anderen ab.

Pass auf die Details auf!: Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Lass jemanden drüberlesen, bevor du sie abschickst!

Beziehe dich auf die Stellenbeschreibung!: Nutze die Sprache aus der Stellenbeschreibung, um zu zeigen, dass du die Anforderungen verstehst. Erkläre, wie deine Fähigkeiten und Erfahrungen zu den Aufgaben passen, die wir dir anbieten.

Bewirb dich über unsere Website!: Der einfachste Weg, um sicherzustellen, dass wir deine Bewerbung erhalten, ist, sie direkt über unsere Website einzureichen. So kannst du sicher sein, dass alles an der richtigen Stelle landet!

Wie du dich auf ein Vorstellungsgespräch bei ELCA Informatique SA vorbereitest

Verstehe die Anforderungen

Mach dich mit den spezifischen Anforderungen der Stelle vertraut. Lies die Stellenbeschreibung gründlich durch und überlege, wie deine Fähigkeiten und Erfahrungen zu den geforderten Kompetenzen passen. Bereite Beispiele vor, die zeigen, wie du in der Vergangenheit ähnliche Herausforderungen gemeistert hast.

Technisches Wissen auffrischen

Da es um Datenmigration und synthetische Datengenerierung geht, solltest du dein Wissen über Python, SQL und Datenmodellierung auffrischen. Sei bereit, technische Fragen zu beantworten oder sogar kleine Programmieraufgaben während des Interviews zu lösen. Zeige, dass du die Konzepte verstehst und anwenden kannst.

Fragen vorbereiten

Bereite einige Fragen vor, die du dem Interviewer stellen möchtest. Das zeigt dein Interesse an der Position und hilft dir, mehr über das Team und die Projekte zu erfahren. Fragen zur Unternehmenskultur oder zu den nächsten Schritten im Projekt können besonders aufschlussreich sein.

Praktische Beispiele nutzen

Nutze konkrete Beispiele aus deiner bisherigen Erfahrung, um deine Problemlösungsfähigkeiten zu demonstrieren. Erkläre, wie du mit unklaren Anforderungen umgegangen bist oder wie du technische Entscheidungen getroffen hast. Das gibt dem Interviewer einen Einblick in deine Denkweise und Arbeitsweise.

Internship : Testing Data Migrations with Synthetic Data: AI-powered approach
ELCA Informatique SA
Standort: Pully
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>