Research Engineer - Interpretability and Synthetic Data

Research Engineer - Interpretability and Synthetic Data

Saarbrücken Vollzeit 45000 - 65000 € / Jahr (geschätzt) Kein Homeoffice möglich
D

Auf einen Blick

  • Aufgaben: Entwickle innovative Methoden zur Analyse und Steuerung von Reasoningmodellen.
  • Unternehmen: DFKI, führendes Forschungsinstitut für KI in Saarbrücken.
  • Vorteile: Hochwertiges Forschungsumfeld, internationale Sichtbarkeit und enge Betreuung.
  • Weitere Informationen: Engagiertes Team mit offener, kollegialer Atmosphäre und Fokus auf Zusammenarbeit.
  • Warum dieser Job: Sei Teil eines bahnbrechenden Projekts zur Entwicklung eines Open-Source-Sprachmodells.
  • Qualifikationen: Master in Informatik oder verwandten Bereichen, Kenntnisse in mechanistischer Interpretierbarkeit.

Das prognostizierte Gehalt liegt zwischen 45000 - 65000 € pro Jahr.

Wir suchen eine/n Research Engineer (m/w/d/x) mit Interesse an mechanistischer Interpretierbarkeit, der Generierung synthetischer Daten und Methoden zum Reasoning für große Sprachmodelle. Die Stelle ist der Forschungsgruppe „Efficient and Explainable NLP“ in der Forschungsgruppe „Multilinguality and Language Technology“ (MLT) am DFKI in Saarbrücken zugeordnet, die von Dr. Simon Ostermann geleitet wird. Die Gruppe arbeitet an nationalen und internationalen Forschungs- und Entwicklungsprojekten im Bereich der effizienten und erklärbaren Sprachverarbeitung. Das Umfeld zeichnet sich durch eine aktive Publikationskultur, fundierte methodische Kompetenz und enge Anbindung an aktuelle Entwicklungen in der NLP‑ und KI‑Forschung aus.

Die Stelle ist Teil des SOOFI-Projekts (Sovereign Open Source Foundation Models), das ein europäisches Frontier-Sprachmodell und darauf aufbauende agentische Systeme entwickelt. Der thematische Schwerpunkt liegt auf drei eng miteinander verbundenen Bereichen: Interpretierbarkeit von Reasoningmodellen, Generierung synthetischer Reasoning Traces und die Entwicklung von Mechanismen zur Token‑Routing für MoE‑Modellarchitekturen.

Ihre Aufgaben

  • Sie entwickeln und bewerten auf Interpretierbarkeit basierende Methoden zur Analyse und Steuerung von Reasoningmodellen, darunter Steuerungsvektoren, Sparse Autoencoders, andere Laufzeit‑Interventionen, sowie Transcoder.
  • Sie arbeiten an der automatisierten Erstellung, Kuratierung und Überprüfung hochwertiger Reasoning‑Traces als Trainingsdaten für spezialisierte MoE‑Modelle.
  • Sie entwickeln und testen Methoden für das dynamische Token‑Routing, um innerhalb modularer MoE‑Architekturen optimal zwischen Basis‑ und Domänenexperten zu wählen.
  • Sie tragen zur Weiterentwicklung von Werkzeugen zur Interpretierbarkeit sowie zur Integration neuer Ansätze wie Transcoder und SAE‑basierten Methoden in eine im Rahmen des Projekts entwickelte Interpretierbarkeits‑Suite bei.
  • Sie veröffentlichen Ihre Ergebnisse auf internationalen Konferenzen und tragen zur Dokumentation und Open‑Source‑Veröffentlichung der Projektergebnisse bei.
  • Sie arbeiten eng mit den Partnerinstitutionen des Soofi‑Konsortiums zusammen, darunter das Fraunhofer IAIS, die Technische Universität Darmstadt, die Leibniz Universität Hannover, die Hochschule für Technik und Wirtschaft Berlin und andere.

Unsere Anforderungen

  • Abgeschlossenes Masterstudium in Informatik, Künstlicher Intelligenz, Computerlinguistik oder einem verwandten Fachgebiet.
  • Fundierte praktische Kenntnisse in einem oder mehreren der folgenden Bereiche sind unerlässlich: mechanistische Interpretierbarkeit, Anpassung von Sprachmodellen, Generierung synthetischer Daten, Reinforcement Learning für Sprachmodelle (RLVR/RLHF).
  • Praktische Erfahrung mit großen Sprachmodellen und entsprechenden Trainingsbibliotheken (z. B. Hugging Face, PyTorch).
  • Interesse an Grundlagenforschung mit Blick auf industrielle Anwendbarkeit.
  • Vorkenntnisse im Bereich der Veröffentlichung oder nachweisbare Forschungserfahrung (z. B. durch eine Masterarbeit, Workshop‑Beiträge oder Preprints) sind von Vorteil, aber keine Voraussetzung.
  • Ausgezeichnete Englischkenntnisse; Deutschkenntnisse sind von Vorteil, aber nicht erforderlich.

Was Sie erwarten können

  • Mitwirkung an einer der ehrgeizigsten europäischen KI‑Forschungsinitiativen mit direkter Beteiligung am Aufbau eines eigenständigen Open‑Source‑Frontier‑Modells.
  • Ein hervorragendes Forschungsumfeld mit hoher internationaler Sichtbarkeit und einer aktiven Publikationskultur.
  • Enge Betreuung und Einbindung in eine etablierte Forschungsgruppe mit Fachkompetenz in den Bereichen mechanistische Interpretierbarkeit und mehrsprachige NLP.
  • Zusammenarbeit innerhalb eines großen Konsortiums aus führenden deutschen Forschungseinrichtungen und Industriepartnern.
  • Ein Arbeitsumfeld, in dem wir großen Wert auf positive, respektvolle und konstruktive Zusammenarbeit legen.
  • Unser Team ist motiviert und arbeitet in einer offenen, kollegialen Atmosphäre.

Schwerbehinderte Bewerberinnen und Bewerber und Gleichgestellte werden bei gleicher Eignung besonders berücksichtigt. Das DFKI beabsichtigt, den Anteil von Frauen im Wissenschaftsbereich zu erhöhen und fordert deshalb Frauen ausdrücklich auf, sich zu bewerben.

Research Engineer - Interpretability and Synthetic Data Arbeitgeber: Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)

Das DFKI in Saarbrücken bietet eine herausragende Arbeitsumgebung für Research Engineers, die an der Schnittstelle von mechanistischer Interpretierbarkeit und synthetischen Daten arbeiten möchten. Mit einer aktiven Publikationskultur, enger Zusammenarbeit mit führenden Forschungseinrichtungen und einem Fokus auf innovative KI-Entwicklungen, fördert das Unternehmen nicht nur die persönliche und fachliche Weiterentwicklung seiner Mitarbeiter, sondern auch ein respektvolles und kollegiales Arbeitsklima. Hier haben Sie die Möglichkeit, an einem der ambitioniertesten europäischen KI-Forschungsprojekte teilzunehmen und Ihre Ideen in einem dynamischen Team einzubringen.

D

Kontaktdaten:

Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Research Engineer - Interpretability and Synthetic Data erhalten könnten

Netzwerken, Netzwerken, Netzwerken!

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Stell Fragen, teile deine Interessen und zeig, dass du wirklich an dem Thema interessiert bist. Oft sind es persönliche Kontakte, die dir den entscheidenden Vorteil verschaffen können.

Sei proaktiv bei der Kontaktaufnahme

Wenn du eine Stelle im Auge hast, zögere nicht, direkt mit dem Team oder dem Hiring Manager in Kontakt zu treten. Frag nach einem informellen Gespräch, um mehr über die Projekte und die Teamdynamik zu erfahren. Das zeigt dein Interesse und kann dir einen Fuß in die Tür verschaffen.

Bereite dich auf technische Interviews vor

Mach dich mit den gängigen Fragen und Themen vertraut, die in technischen Interviews für Research Engineers gestellt werden. Übe das Lösen von Problemen und erkläre deine Denkweise dabei. Das hilft dir, selbstbewusst aufzutreten und deine Fähigkeiten zu demonstrieren.

Bewirb dich über unsere Website

Vergiss nicht, dich direkt über unsere Website zu bewerben! Dort findest du alle aktuellen Stellenangebote und kannst sicherstellen, dass deine Bewerbung die richtige Aufmerksamkeit erhält. Wir freuen uns darauf, von dir zu hören!

Wir glauben, dass du diese Fähigkeiten brauchst, um Research Engineer - Interpretability and Synthetic Data mit Bravour zu bestehen

mechanistische Interpretierbarkeit
Generierung synthetischer Daten
Reasoning für große Sprachmodelle
Reinforcement Learning für Sprachmodelle (RLVR/RLHF)
praktische Erfahrung mit großen Sprachmodellen
Kenntnisse in Trainingsbibliotheken (z. B. Hugging Face, PyTorch)
Entwicklung von Steuerungsvektoren

Einige Tipps für deine Bewerbung 🫡

Mach deine Bewerbung persönlich:Zeig uns, wer du bist! Verwende eine freundliche und authentische Sprache, um deine Motivation für die Stelle zu verdeutlichen. Erzähl uns, warum du dich für mechanistische Interpretierbarkeit und synthetische Daten interessierst.

Betone deine Erfahrungen:Hebe relevante Projekte oder Erfahrungen hervor, die du in den Bereichen mechanistische Interpretierbarkeit oder große Sprachmodelle gesammelt hast. Zeig uns, wie du dein Wissen in der Praxis angewendet hast!

Sei präzise und strukturiert:Achte darauf, dass deine Bewerbung klar und gut strukturiert ist. Verwende Absätze und Aufzählungen, um wichtige Informationen hervorzuheben. So wird es uns leichter fallen, deine Qualifikationen zu erkennen.

Bewirb dich über unsere Website:Wir freuen uns, wenn du dich direkt über unsere Website bewirbst! Das macht den Prozess für uns einfacher und du kannst sicher sein, dass deine Bewerbung an die richtige Stelle gelangt.

Wie man sich auf ein Vorstellungsgespräch bei Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) vorbereitet

Verstehe die Forschungsgruppe

Informiere dich über die Forschungsgruppe „Efficient and Explainable NLP“ und ihre Projekte. Zeige im Interview, dass du die Ziele und Herausforderungen der Gruppe verstehst und wie deine Fähigkeiten dazu passen.

Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, die deine Kenntnisse in mechanistischer Interpretierbarkeit und synthetischen Daten demonstrieren. Bereite dich darauf vor, diese Beispiele klar und prägnant zu erläutern.

Fragen stellen

Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Erwartungen und die Teamdynamik zu erfahren.

Sprich über deine Publikationserfahrungen

Wenn du bereits Forschungserfahrungen oder Veröffentlichungen hast, sprich darüber! Das zeigt, dass du aktiv in der wissenschaftlichen Gemeinschaft bist und bereit bist, deine Ergebnisse zu teilen.