AI Research Engineer (all genders)
AI Research Engineer (all genders)

AI Research Engineer (all genders)

Bremen Vollzeit 70000 - 110000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
E

Auf einen Blick

  • Aufgaben: Entwickle innovative KI-Modelle und verbessere deren Evaluierung mit modernster Technologie.
  • Arbeitgeber: Wachsendes KI-Startup mit Fokus auf Forschung und Entwicklung.
  • Mitarbeitervorteile: Attraktives Gehalt, Aktienoptionen, flexible Arbeitszeiten und ein inspirierendes Arbeitsumfeld.
  • Warum dieser Job: Gestalte die Zukunft der KI-Forschung und arbeite an bahnbrechenden Projekten.
  • Gewünschte Qualifikationen: Starke Python-Kenntnisse und Erfahrung in der Arbeit mit LLMs.
  • Andere Informationen: Dynamisches Team mit exzellenten Wachstumschancen und Zugang zu leistungsstarker Hardware.

Das voraussichtliche Gehalt liegt zwischen 70000 - 110000 € pro Jahr.

Bei ellamind bauen wir eine evaluierungsorientierte KI-Infrastruktur. Unsere Plattform elluminate verwandelt die KI-Evaluierung von ad-hoc „Vibe Checks“ in rigorose, wiederholbare Ingenieurmethoden, um Teams zu ermöglichen, LLM-Anwendungen mit Vertrauen zu testen, zu messen und zu verbessern.

Was Sie tun werden:

  • Fortschritt in der LLM-Evaluierungsforschung: Entwerfen, implementieren und validieren Sie neue Benchmarks, Metriken und Workflows, die Korrektheit, Robustheit, Sicherheit und Zuverlässigkeit über Sprachen und Modalitäten hinweg messen.
  • Aufbau von LLM-als-Richter-Setups und Belohnungsmodellen: Entwickeln Sie rubrikbasierte Bewertungsmodelle, Präferenzdatenpipelines, Belohnungsmodelle und führen Sie DPO/RLHF/RLAIF/RLVF-Training durch.
  • Generierung und Kuratierung synthetischer Daten: Erstellen Sie hochwertige synthetische Datensätze für das Pre-Training, Post-Training und die Evaluierung von LLMs mit Filterung, Duplikatsentfernung und Dekontamination zur zuverlässigen Verbesserung der Modellfähigkeiten.
  • Training und Anpassung offener Modelle: Pre-Train und Fine-Tune von Open-Source-LLMs unter Verwendung von LLM-Trainingsframeworks zur Durchführung rigoroser Ablationen.
  • Skalierung von Experimenten auf GPU-Clustern: Orchestrieren Sie großangelegte Trainings-, Inferenz- und Evaluierungsjobs, optimieren Sie die Effizienz und stellen Sie die End-to-End-Reproduzierbarkeit mit Tausenden von GPUs sicher.
  • Multilinguale Daten und Evaluierung: Erweitern Sie Trainingsdatensätze und Evaluierungspipelines auf europäische Sprachen.
  • Offene Wissenschaft & Zusammenarbeit: Veröffentlichen Sie Datensätze/Werkzeuge, technische Berichte, Blogbeiträge und wissenschaftliche Arbeiten und arbeiten Sie mit Partnern wie OpenEuroLLM zusammen, um die Evaluierungsstandards voranzutreiben.
  • Produktisierung von Forschung: Wandeln Sie Prototypen in elluminate-Funktionen um – automatisierte Evaluierungssuiten, Bewertungsmodelle und Datenpipelines. Arbeiten Sie mit Plattformingenieuren und Produktteams zusammen, um zuverlässige Workflows zu liefern.

Sie werden hauptsächlich mit einem Python-basierten LLM-Forschungsstack (HuggingFace-Ökosystem, PyTorch, Megatron-LM/torchtitan, vLLM/SGLang, lm-eval-harness/LightEval, Datenrahmenbibliotheken, SLURM, Ray) arbeiten.

Was wir suchen:

Must-haves:

  • Starke Python-Engineering-Fähigkeiten: Erfahrung im Aufbau von LLM-zentrierten Systemen mit sauberem, wartbarem Code, umfassendem Testen und Leistungsoptimierung in großem Maßstab.
  • Expertise in LLM-Operationen: Vertraut mit Tokenisierern/Vokabularen, Datenspezifikationen (z.B. Parquet), Sampling/Dekodierungs-Konfigurationen und Evaluierung.
  • Literacy in verteiltem Training & Inferenz: Solides Verständnis der Grundlagen von Multi-GPU/Multi-Node (z.B. FSDP/DeepSpeed), Planung und Überwachung sowie praktisches Debugging von Durchsatz-/Speicherproblemen.
  • Experimentdesign & Statistik: Planung von Ablationen, Verfolgung von Experimenten und Anwendung solider statistischer Methoden (Signifikanztests, Unsicherheitsabschätzungen), um zuverlässige Schlussfolgerungen zu ziehen.
  • Datenhygiene-Mindset: Wertschätzung der Datensatzqualität – Duplikatsentfernung, Kontaminationsprüfungen, mehrsprachige Abdeckung und nachvollziehbare Versionierung.
  • Linux-Komfort: Produktiv auf Linux-Servern – Shell-Workflows, virtuelle Umgebungen, Container, GPU-Tools, Protokolle/Metriken und Remote-Entwicklung/Debugging.
  • Vor-Ort-Zusammenarbeit: Mindestens 3 Tage pro Woche in Berlin oder Bremen (Reise zu unserem Bremer Hauptsitz während der Einarbeitung).
  • Fließend in Englisch: Mindestens B2-Niveau für Teamzusammenarbeit und technische Diskussionen.
  • Gültige EU-Arbeitserlaubnis.

Nice-to-haves:

  • Erfahrung mit LLM-Evaluierungsframeworks (lm-eval-harness, LightEval) oder eine Erfolgsbilanz rigoroser benutzerdefinierter Benchmarks und Metriken.
  • Hintergrund in Präferenzlernen und Belohnungsmodellierung (DPO/RLHF/RLAIF), einschließlich Rubrikdesign und hochwertigen Präferenzdatenpipelines.
  • Mehrsprachige Expertise: Aufbau oder Evaluierung von Modellen über europäische Sprachen hinweg; Datensammlung, Ausrichtung und übertragendes Lernen.
  • Komfort mit Hochdurchsatz-Inferenzsystemen (vLLM, SGLang), Latenz-/Speicheroptimierung und Modellquantisierung.
  • Erfahrung mit Systemen und Orchestrierung (SLURM/Ray/Kubernetes) und Containern (Docker/Apptainer) – einschließlich GPU-Beobachtbarkeit, Planung und Leistungstuning.
  • Vertrautheit mit MLOps und Reproduzierbarkeit: Experimentverfolgung (z.B. W&B), Datensatz-/Modell-/Prompt-Versionierung, CI für Forschungs-Workflows und zuverlässiges Artefaktmanagement.
  • Erfahrung im Aufbau von Open-Source-Tools oder Veröffentlichung von Forschungsartefakten (Datensätze, Modelle, Arbeiten) oder starke technische Schreibfähigkeiten.
  • Erfahrung in der direkten Zusammenarbeit mit Partnern oder Kunden zur Validierung von Ergebnissen und zur Übersetzung von Forschung in Produktwirkungen.
  • Fortgeschrittener Abschluss in Informatik, Maschinenlernen, Datenwissenschaft oder einem verwandten Bereich (PhD bevorzugt oder gleichwertige Leistungen).

Was am wichtigsten ist:

Wir priorisieren nachgewiesene Exzellenz in Ihren Projekten und Ihrer Karriere. Wenn Sie motiviert sind, KI-Lösungen zu entwickeln und zu optimieren, möchten wir von Ihnen hören – auch wenn Sie nicht jedes einzelne Kriterium erfüllen.

Diversität & Inklusion:

Unterschiedliche Perspektiven machen uns stärker. Wir begrüßen Bewerber aus allen Hintergründen und ermutigen Sie, sich zu bewerben.

Warum wir?

  • Gestalten Sie die Zukunft der KI-Forschung: Beeinflussen Sie unsere Forschungsagenda und das LLM-Ökosystem in Europa – helfen Sie, Evaluierungsstandards und Trainingspraktiken festzulegen, auf die ernsthafte KI-Teams und Institutionen angewiesen sind.
  • Technische Exzellenz trifft auf modernste Forschung: Drücken Sie die Grenzen des LLM-Trainings und der Evaluierung – entwerfen Sie mehrsprachige Benchmarks, bauen Sie LLM-als-Richter- und Belohnungsmodelle, generieren Sie hochwertige synthetische Daten und führen Sie rigorose Ablationen in großem Maßstab auf großen GPU-Clustern durch.
  • Karriere-definierende Gelegenheit: Systematische Evaluierung wird so grundlegend für KI wie Versionskontrolle für Software. Arbeiten Sie im Zentrum dieses Wandels und tragen Sie Methoden, Datensätze und Werkzeuge bei, die andere übernehmen und weiterentwickeln.
  • Eigenverantwortung und Einfluss: Leiten Sie die Forschung von Anfang bis Ende – formulieren Sie Hypothesen, erstellen Sie Datensätze und Benchmarks, führen Sie großangelegte Experimente durch und veröffentlichen Sie Ergebnisse (Arbeiten, technische Berichte, OSS). Arbeiten Sie mit erstklassigen Partnerlaboren zusammen und sehen Sie, wie Ihre Arbeit das Verhalten von Modellen und die Evaluierungsmethoden in der Branche prägt.
  • Rechenleistung, die Ihrem Ehrgeiz entspricht: Zugang zu ernsthaften GPU-Ressourcen.
  • Offene Wissenschaft standardmäßig: Freiheit, Datensätze, Modelle und Werkzeuge zu veröffentlichen; Unterstützung für Konferenzeinreichungen und Reisen.
  • Wettbewerbsfähiges Paket mit Aufwärtspotenzial: Neben einem wettbewerbsfähigen Gehalt bieten wir ein VSOP (Virtual Stock Option Program), um Ihnen einen echten Anteil am Erfolg des Unternehmens zu geben, während wir wachsen.
  • Best-in-Class-Entwicklungserfahrung: Schneller und reibungsloser Zugang zu allen KI-Technologien, die Ihr Leben (und Ihre Entwicklungsarbeit) erleichtern, sowie die neuesten Werkzeuge und Plattformen, um Ihre Produktivität zu maximieren.
  • Arbeitsumfeld: Unser Büro in Bremen bietet atemberaubende Ausblicke auf das Wasser, kostenlose Getränke, Smoothies und ein Boot. Wir eröffnen unser Büro in Berlin Ende 2025, was Ihnen Flexibilität bei unserer Expansion gibt.
  • Wachsen Sie mit transformierender Technologie: Bauen Sie tiefes Fachwissen in der LLM-Evaluierung und Infrastruktur auf, tragen Sie zu offenen Standards bei und treiben Sie den Stand der Technik voran, zusammen mit einem Team, das Wert auf Rigor und Einfluss legt.

Über uns:

Wir sind ein cash-flow-positives, in Deutschland ansässiges KI-Startup, das elluminate entwickelt – die Unternehmensplattform, die die KI-Evaluierung von ad-hoc-Experimenten in rigorose, wiederholbare Workflows verwandelt, damit Teams zuverlässige KI mit Vertrauen liefern können. Teams nutzen elluminate, um Test-Suiten zu entwerfen, Modelle zu benchmarken, Regressionen zu verfolgen und zuverlässige KI mit klaren, messbaren Qualitätskriterien zu liefern. Wir kombinieren elluminate mit maßgeschneiderten Lösungen für große Sprachmodelle und vollständigen On-Premise-Bereitstellungsoptionen. Unsere Produkte haben bereits das Vertrauen renommierter Kunden wie Deutsche Telekom, der deutschen Bundesregierung und führenden Krankenversicherungen wie hkk gewonnen.

In Bremen verwurzelt und in Zusammenarbeit mit führenden Organisationen hat unser Team eine Erfolgsbilanz in der Entwicklung fortschrittlicher Modelle und Datensätze. Wir übernehmen gerne Probleme von Anfang bis Ende und liefern pragmatisch und tragen zur Open-Source-Community über Initiativen wie OpenEuroLLM bei und veröffentlichen regelmäßig Modelle und Werkzeuge, um das breitere Ökosystem zu beschleunigen.

Vergütungsbereich: €70.000 – €110.000.

Jobdetails:

  • Senioritätsgrad: Mid-Senior Level
  • Beschäftigungsart: Vollzeit
  • Berufsbereich: Ingenieurwesen und Informationstechnologie
  • Branchen: IT-Dienstleistungen und IT-Beratung

Standort: Bremen, Deutschland.

AI Research Engineer (all genders) Arbeitgeber: ellamind

Ellamind ist ein herausragender Arbeitgeber, der Ihnen die Möglichkeit bietet, an der Spitze der KI-Forschung zu arbeiten und die Zukunft der LLM-Bewertung mitzugestalten. Mit einem starken Fokus auf technische Exzellenz, offener Wissenschaft und einem unterstützenden Arbeitsumfeld in Bremen profitieren Sie von umfangreichen Entwicklungsmöglichkeiten, Zugang zu modernster Technologie und einem wettbewerbsfähigen Vergütungspaket, einschließlich eines Virtual Stock Option Programms. Genießen Sie eine inspirierende Büroumgebung mit Blick auf das Wasser und die Flexibilität, in einem dynamischen Team zu wachsen, das Vielfalt und Inklusion schätzt.
E

Kontaktperson:

ellamind HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: AI Research Engineer (all genders)

Netzwerken, Netzwerken, Netzwerken!

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Stell Fragen, teile deine Ideen und zeig dein Interesse an AI-Forschung. Je mehr du dich vernetzt, desto mehr Chancen bekommst du!

Sei bereit für technische Gespräche

Bereite dich auf technische Interviews vor, indem du deine Python-Kenntnisse auffrischst und dich mit den neuesten LLM-Technologien vertraut machst. Zeig, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast!

Präsentiere deine Projekte

Hast du an spannenden Projekten gearbeitet? Erstelle ein Portfolio oder eine Präsentation, um deine Arbeit zu zeigen. Das hilft dir, dich von anderen Bewerbern abzuheben und deine Fähigkeiten zu demonstrieren.

Bewirb dich direkt über unsere Website

Wir bei StudySmarter empfehlen dir, dich direkt über unsere Website zu bewerben. So kannst du sicherstellen, dass deine Bewerbung die richtige Person erreicht und du die besten Chancen auf ein Interview hast!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: AI Research Engineer (all genders)

Python-Entwicklungsfähigkeiten
LLM-Betriebskenntnisse
Verteiltes Training & Inferenz
Experimentdesign & Statistik
Datenhygiene-Mindset
Linux-Kompetenz
Fließend in Englisch
Erfahrung mit LLM-Bewertungsrahmen
Hintergrund in Präferenzlernen und Belohnungsmodellierung
Multilinguale Expertise
Komfort mit Hochdurchsatz-Inferenzsystemen
Erfahrung mit Systemen und Orchestrierung
Vertrautheit mit MLOps und Reproduzierbarkeit
Erfahrung im Aufbau von Open-Source-Tools
Erfahrung in der Zusammenarbeit mit Partnern oder Kunden

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für AI haben und ihre Persönlichkeit in die Bewerbung einbringen.

Mach es klar und präzise: Halte deine Bewerbung übersichtlich und auf den Punkt. Verwende klare Sprache und vermeide unnötigen Jargon. Wir wollen schnell verstehen, was du kannst und wie du zu unserem Team passt.

Betone deine Erfahrungen: Erzähl uns von deinen bisherigen Projekten und Erfahrungen, die relevant für die Rolle sind. Zeig uns, wie du mit Python gearbeitet hast und welche Erfolge du in der LLM-Forschung erzielt hast.

Bewirb dich über unsere Website: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell bei uns ankommt und wir sie zügig bearbeiten können!

Wie du dich auf ein Vorstellungsgespräch bei ellamind vorbereitest

Verstehe die Anforderungen

Mach dich mit den spezifischen Anforderungen der Stelle als AI Research Engineer vertraut. Lies die Jobbeschreibung gründlich durch und notiere dir, welche Fähigkeiten und Erfahrungen besonders betont werden. So kannst du gezielt auf diese Punkte während des Interviews eingehen.

Bereite praktische Beispiele vor

Überlege dir konkrete Beispiele aus deiner bisherigen Arbeit, die deine Fähigkeiten in Python, LLM-Operationen oder experimentellem Design demonstrieren. Wenn du über deine Erfahrungen sprichst, zeige, wie du Herausforderungen gemeistert hast und welche Ergebnisse du erzielt hast.

Fragen vorbereiten

Bereite einige Fragen vor, die du dem Interviewer stellen möchtest. Das zeigt dein Interesse an der Position und dem Unternehmen. Du könntest nach den aktuellen Projekten im Bereich LLM-Evaluation oder den Technologien fragen, die im Team verwendet werden.

Technische Vorbereitung

Da die Rolle technische Fähigkeiten erfordert, solltest du dich auf mögliche technische Fragen oder Aufgaben vorbereiten. Übe das Programmieren in Python und mache dich mit den Tools und Frameworks vertraut, die in der Jobbeschreibung erwähnt werden, wie HuggingFace oder PyTorch.

AI Research Engineer (all genders)
ellamind
Standort: Bremen
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>