Research Scientist - Pretraining-Daten für Foundation Models (all genders)

Research Scientist - Pretraining-Daten für Foundation Models (all genders)

Dresden Vollzeit 50000 - 65000 € / Jahr (geschätzt) Kein Homeoffice möglich
Fraunhofer IAIS

Auf einen Blick

  • Aufgaben: Entwickle skalierbare Datenpipelines für KI-Modelle und optimiere Inferenz-Infrastrukturen.
  • Unternehmen: Fraunhofer IAIS, führendes Forschungsinstitut für KI in Europa.
  • Vorteile: Forschung auf Spitzenniveau, individuelle Entwicklung und Zugang zu erstklassiger Infrastruktur.
  • Weitere Informationen: Diversity ist uns wichtig – wir begrüßen alle Bewerbungen!
  • Warum dieser Job: Arbeite an innovativen Projekten und sieh deine Forschungsergebnisse in der Praxis.
  • Qualifikationen: Master in Informatik oder verwandten Bereichen, Programmierkenntnisse in Python und PyTorch.

Das prognostizierte Gehalt liegt zwischen 50000 - 65000 € pro Jahr.

Als Teil der größten Organisation für anwendungsorientierte Forschung in Europa ist das Fraunhofer IAIS mit Sitz in Sankt Augustin bei Bonn eines der führenden Wissenschaftsinstitute auf den Gebieten Künstliche Intelligenz, Maschinelles Lernen und Big Data in Deutschland und Europa. Die Abteilung NetMedia forscht auf dem Gebiet der multimodalen Deep Learning Verfahren zur Künstlichen Intelligenz (KI), dazu zählen die Forschungsthemen Spracherkennung, Bilderkennung, NLP, Foundation Models und Conversational AI. Die in der Forschung entwickelten Methoden werden in skalierbare und cloudfähige Anwendungssysteme überführt, um diese erfolgreich bei unseren Kunden in den produktiven Einsatz zu überführen.

Für unseren Institutsstandort in Dresden suchen wir eine*n Research Scientist mit Fokus auf Pretraining‑Daten für Foundation Models. Du arbeitest an wegweisenden nationalen und internationalen Projekten zur Entwicklung großer europäischer Foundation Models, darunter TrustLLM und Soofi, in denen Models auf Basis von mehreren Millionen GPU‑Stunden und mehreren Tausend GPUs von Grund auf trainiert werden.

Hier sorgst Du für Veränderung:

  • Du konzipierst und realisierst skalierbare Datenpipelines für die Aufbereitung großer Web‑Korpora (z. B. Common Crawl) als Trainingsdaten für Foundation Models, wie etwa Extraktion über Filterung und Deduplizierung bis hin zur Qualitäts‑ und Toxizitätsbewertung.
  • Du entwickelst Methoden zur synthetischen Datengenerierung mit Hilfe großer Sprachmodelle, um gezielt neue Trainings‑ und Evaluierungsdaten für Pre‑Training, Instruction Tuning und Alignment zu erzeugen.
  • Du betreibst und optimierst die zugrunde liegende Inferenz‑Infrastruktur für große Models, u. a. auf Basis von Frameworks wie vLLM, und integrierst sie in unsere Datenpipelines.
  • Du implementierst und integrierst Deine Methoden in unseren Technologie‑Stack und setzt sie auf Hochleistungsrechnern mit mehreren Tausend GPUs ein.
  • Du trainierst Foundation Models auf Basis Deiner entwickelten Methoden auf Hochleistungsrechnern, die mehrere Tausend GPUs umfassen.
  • Du publizierst Deine Forschungsergebnisse auf hochrangigen internationalen Konferenzen und in Journals und vertrittst Dein Forschungsthema in der öffentlichen Wahrnehmung.
  • Du evaluierst zusammen mit unseren Anwendungsteams das Marktpotential Deiner KI‑Forschung.

Hiermit bringst Du Dich ein:

  • Abgeschlossenes wissenschaftliches Hochschulstudium (Master, Diplom) in Informatik, Mathematik, Physik oder einer ähnlichen Fachrichtung mit ausgezeichnetem Abschluss, gerne mit Promotion.
  • Vorkenntnisse in den Bereichen Data Science, Maschinelles Lernen und Künstliche Intelligenz, insbesondere ein tiefes Verständnis im Bereich des Maschinellen Lernens.
  • Sehr gute Programmierkenntnisse, insbesondere in Python und PyTorch.
  • Erfahrung mit der Verarbeitung großer Datenmengen und verteiltem Rechnen (z. B. Spark, Ray, Dask) ist von Vorteil.
  • Erfahrung mit Inferenz‑ und Serving Frameworks für große Sprachmodelle (z. B. vLLM, TGI, SGLang) ist von Vorteil.
  • Erfahrung im Umgang mit Web‑Daten‑Korpora (z. B. Common Crawl) und typischen Aufbereitungsschritten wie Sprachidentifikation, Deduplizierung und Qualitätsfilterung ist wünschenswert.
  • Exzellente analytische Fähigkeiten, Freude an abstraktem Denken und konzeptionellem Arbeiten.
  • Hohe Einsatzfreude sowie die Bereitschaft, zu lernen und sich schnell in neue Sachverhalte einzuarbeiten.
  • Strukturiertes Arbeiten und professionelles Auftreten.
  • Sehr gute Deutschkenntnisse (mind. auf Niveau C1).

Was wir für Dich bereithalten:

  • Forschung auf Spitzenniveau innerhalb eines erstklassigen Forschungsumfelds.
  • Ableitung und Definition der Forschungsfragen aus realen Anwendungsproblemen, so dass unsere Forschungsergebnisse nicht nur auf den renommiertesten Konferenzen und in Journals veröffentlicht, sondern auch von unseren Anwendungsteams in Produkte und Industrieanwendungen integriert werden können – Du siehst Deine Forschungsergebnisse in der Anwendung.
  • Förderung Deiner individuellen Entwicklung.
  • Kollaboratives Teamumfeld.
  • Zugang zu erstklassiger Infrastruktur, um Foundation Models effektiv trainieren zu können.
  • Mitwirkung an wegweisenden nationalen und internationalen Projekten zum Thema Foundation Models, darunter TrustLLM und Soofi.
  • In unserem Institut ist Diversity ein wichtiges, strategisches Ziel: Wir setzen uns aktiv für Chancengleichheit und Vielfalt ein, beginnend mit einem Diversity Training für alle Mitarbeitenden.
  • Vermögenswirksame Leistungen und eine betriebliche Altersvorsorge.
  • Vergünstigungen beim Deutschlandticket.

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung und Qualifikation bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.

Die wöchentliche Arbeitszeit beträgt 39 Stunden. Die Stelle kann auch in Teilzeit besetzt werden. Anstellung, Vergütung und Sozialleistungen basieren auf dem Tarifvertrag für den öffentlichen Dienst (TVöD). Zusätzlich kann Fraunhofer leistungs- und erfolgsabhängige variable Vergütungsbestandteile gewähren. Die Stelle ist zunächst auf 2 Jahre befristet, mit der Option der Verlängerung.

Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online‑Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht.

Fragen zu dieser Position beantwortet Dir gerne: Dr. Michael Fromm.

Wir bitten um Verständnis, dass wir aus Datenschutzgründen Bewerbungen, die uns per E‑Mail erreichen, nicht berücksichtigen können und diese umgehend gelöscht werden.

Fraunhofer‑Institut für Intelligente Analyse‑ und Informationssysteme IAIS

Kennziffer: 84391

Bewerbungsfrist:

Research Scientist - Pretraining-Daten für Foundation Models (all genders) Arbeitgeber: Fraunhofer IAIS

Das Fraunhofer IAIS in Sankt Augustin bietet eine herausragende Arbeitsumgebung für Forschung und Entwicklung im Bereich Künstliche Intelligenz und Maschinelles Lernen. Mit einem starken Fokus auf individuelle Entwicklung, einem kollaborativen Teamumfeld und Zugang zu erstklassiger Infrastruktur ermöglicht das Institut seinen Mitarbeitenden, an wegweisenden nationalen und internationalen Projekten zu arbeiten und ihre Forschungsergebnisse direkt in die Praxis umzusetzen. Zudem wird Vielfalt aktiv gefördert, was ein inklusives Arbeitsklima schafft.

Fraunhofer IAIS

Kontaktdaten:

Fraunhofer IAIS Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Research Scientist - Pretraining-Daten für Foundation Models (all genders) erhalten könnten

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der KI- und Datenwissenschaftsbranche in Kontakt zu treten. Lass uns gemeinsam herausfinden, wer dir helfen kann, die richtigen Türen zu öffnen.

Tipp Nummer 2

Bereite dich auf Vorstellungsgespräche vor, indem du häufige Fragen und technische Herausforderungen übst. Wir können dir helfen, deine Antworten zu verfeinern und sicherzustellen, dass du selbstbewusst auftrittst.

Tipp Nummer 3

Zeige deine Leidenschaft für Forschung und Innovation! Teile deine Projekte und Ideen in sozialen Medien oder auf deinem Portfolio. Lass uns zusammenarbeiten, um deine Erfolge ins Rampenlicht zu rücken.

Tipp Nummer 4

Bewirb dich direkt über unsere Website! So hast du die besten Chancen, gesehen zu werden. Wir freuen uns darauf, deine Bewerbung zu erhalten und gemeinsam an spannenden Projekten zu arbeiten.

Wir glauben, dass du diese Fähigkeiten brauchst, um Research Scientist - Pretraining-Daten für Foundation Models (all genders) mit Bravour zu bestehen

Data Science
Maschinelles Lernen
Künstliche Intelligenz
Python
PyTorch
Verarbeitung großer Datenmengen
Verteiltes Rechnen

Einige Tipps für deine Bewerbung 🫡

Mach es persönlich!:Zeig uns, wer du bist! Verwende in deinem Anschreiben eine persönliche Ansprache und erzähle uns, warum du dich für diese Position interessierst. Das macht deine Bewerbung einzigartig und hebt dich von anderen ab.

Betone deine Fähigkeiten:Stell sicher, dass du deine relevanten Fähigkeiten und Erfahrungen klar hervorhebst. Wenn du Kenntnisse in Python oder Erfahrung mit großen Datenmengen hast, dann lass uns das wissen! Wir suchen nach Talenten, die zu unserem Team passen.

Sei strukturiert:Eine gut strukturierte Bewerbung ist der Schlüssel! Gliedere dein Anschreiben und deinen Lebenslauf übersichtlich, damit wir schnell die wichtigsten Informationen finden können. Das zeigt uns auch, dass du organisiert bist.

Bewirb dich über unsere Website:Vergiss nicht, dich über unsere Website zu bewerben! So stellst du sicher, dass deine Bewerbung direkt bei uns landet und wir sie schnell bearbeiten können. Wir freuen uns auf deine Unterlagen!

Wie man sich auf ein Vorstellungsgespräch bei Fraunhofer IAIS vorbereitet

Verstehe die Forschungsprojekte

Mach dich mit den aktuellen Projekten des Fraunhofer IAIS vertraut, insbesondere mit TrustLLM und Soofi. Zeige im Interview, dass du die Ziele und Herausforderungen dieser Projekte verstehst und wie deine Fähigkeiten zur Lösung beitragen können.

Bereite technische Fragen vor

Erwarte technische Fragen zu Themen wie Data Science, maschinelles Lernen und Programmierung in Python oder PyTorch. Übe, wie du deine Erfahrungen und Kenntnisse in diesen Bereichen klar und präzise präsentieren kannst.

Präsentiere deine Forschungsergebnisse

Wenn du bereits Forschungsergebnisse hast, sei bereit, diese zu diskutieren. Erkläre, wie du deine Methoden entwickelt hast und welche Ergebnisse du erzielt hast. Das zeigt dein Engagement und deine Expertise.

Zeige Teamfähigkeit und Lernbereitschaft

Das Fraunhofer IAIS legt Wert auf Zusammenarbeit und kontinuierliches Lernen. Bereite Beispiele vor, die deine Teamarbeit und deine Fähigkeit, dich schnell in neue Themen einzuarbeiten, verdeutlichen.