Senior AI Researcher - Pre-training Data (m/f/d)

Jobbörse

Unternehmen

Aleph Alpha

Senior AI Researcher - Pre-training Data (m/f/d)

Heidelberg Vollzeit 65000 - 85000 € / Jahr (geschätzt) Kein Homeoffice möglich

Auf einen Blick

Aufgaben: Gestalte und verbessere die wissenschaftliche Methodik hinter unseren Pre-Training-Daten.
Unternehmen: Aleph Alpha, ein führendes Unternehmen in der KI-Forschung in Europa.
Vorteile: 30 Tage Urlaub, Fitnessangebote, mentale Gesundheitsunterstützung und flexible Arbeitszeiten.
Weitere Informationen: Flache Hierarchien und eine Kultur der Eigenverantwortung fördern schnelles Handeln und offene Kommunikation.
Warum dieser Job: Sei Teil einer KI-Revolution und arbeite an innovativen Projekten mit echtem Einfluss.
Qualifikationen: Tiefes Verständnis von maschinellem Lernen und Erfahrung in der Datenkomposition.

Das prognostizierte Gehalt liegt zwischen 65000 - 85000 € pro Jahr.

Unsere Mission

Aleph Alpha ist eines der wenigen Unternehmen in Europa, das ernsthaft an der Vortraining von Fundamentmodellen arbeitet. Unsere Kunden - in den Bereichen Finanzen, Fertigung und öffentliche Verwaltung - benötigen Modelle, die Deutsch verstehen, die europäischen Vorschriften entsprechen und zuverlässig in kritischen Anwendungen funktionieren. Wir bauen das in Heidelberg auf.

Wir erweitern unser Pre-Training-Team und suchen jemanden, der leidenschaftlich an Daten arbeitet: Definieren, was in unsere Modelle eingeht, Systeme zu entwickeln, die diese beschaffen und vorbereiten, und sicherzustellen, dass unser Trainingsteam die qualitativ hochwertigsten Daten hat, um die Modellfähigkeiten voranzutreiben.

Teamkultur

Bei Aleph Alpha fördern wir eine Kultur, die auf Eigenverantwortung, Autonomie und Empowerment basiert. Teams und Einzelpersonen werden ermutigt, Verantwortung für ihre Arbeit zu übernehmen und einen bedeutenden Einfluss auszuüben. Wir pflegen eine flache Organisationsstruktur mit effizientem, unterstützendem Management, das schnelle Entscheidungen, offene Kommunikation und ein starkes Gefühl des gemeinsamen Zwecks ermöglicht.

Über die Rolle

Als Senior AI Researcher für Pre-training Data werden Sie die zugrunde liegende wissenschaftliche Methodik hinter unseren Pre-Training-Korpora gestalten und verbessern, während Sie auch die Software und Systeme mitentwickeln, die dies ermöglichen. Sie arbeiten mit Ingenieuren und anderen Forschern zusammen, um skalierbare Pipelines zu erstellen, und konzentrieren sich auf relevante theoretische und empirische Forschung, um zu verstehen, welche Daten die Modelle am besten auf unsere Zielkapazitäten bringen. Diese Rolle ist für Sie geeignet, wenn Sie über einen starken Hintergrund im Bereich des großangelegten Sprachmodellings verfügen und den wissenschaftlichen Antrieb haben, komplexe Fragen zu Daten-Skalierungsgesetzen, synthetischer Datengenerierung und Curriculum-Lernen zu beantworten.

Ihre Verantwortlichkeiten

Innovation in Data-Centric AI: Bleiben Sie an der Spitze der Forschung zu Fundamentmodellen. Sie identifizieren, implementieren und iterieren neuartige Ansätze zur Schätzung der Datenqualität, zur synthetischen Datengenerierung, zum Curriculum-Lernen und zu fortgeschrittenen Kurationsmethoden.
Data-to-Performance Science: Entwerfen und leiten Sie rigorose Ablationsstudien über verschiedene Skalen. Sie analysieren systematisch, wie Änderungen in der Datenzusammensetzung, Strategien zur Duplikation, heuristische und modellbasierte Kurierung sowie Skalierungsgesetze die Trainingsdynamik und die Zielmodelle und -systemfähigkeiten beeinflussen.
Entwicklung neuartiger Qualitätsindikatoren: Gehen Sie über grundlegende Perplexitätsfilter hinaus. Forschen und entwickeln Sie fortschrittliche Algorithmen zur Bewertung und Auswahl von Daten, wie Einflussfunktionen, gradientenbasierte Übereinstimmung oder die Verwendung kleinerer Modelle zur Kurierung von Daten für größere.
Interdisziplinäre Zusammenarbeit: Arbeiten Sie eng mit einem vielfältigen Team zusammen, um Ihre Forschung von Prototypen zu Pipelines im Billionen-Tokens-Maßstab zu skalieren, und arbeiten Sie mit dem Post-Training-Team zusammen, um sicherzustellen, dass die Pre-Training-Verteilungen die gezielte Feinabstimmung und Kundenanpassung effektiv unterstützen.

Ihr Profil

Grundqualifikationen:

Ein tiefes Verständnis der Theorie des maschinellen Lernens, insbesondere in Bezug auf die Dynamik des Trainings von Fundamentmodellen, Skalierungsgesetze und datenzentriertes KI.
Erfahrung in der Gestaltung und Bewertung komplexer ML-Experimente im Zusammenhang mit Datenzusammensetzung, Curriculum-Lernen oder Datenqualität beim Training von Sprachmodellen.
Vertrautheit mit statistischen Methoden zur Bewertung und Versuchsplanung.
Fähigkeit, über die informationstheoretischen Eigenschaften eines Datensatzes und dessen prädiktive Kraft für bewertete Aufgaben nachzudenken: nicht nur Daten zu verarbeiten, sondern deren Signal zu verstehen.
Starke Python-Kenntnisse und Vertrautheit mit ML-Tools und Deep-Learning-Frameworks (insbesondere PyTorch).
Bereitschaft, nach Heidelberg umzuziehen oder mindestens alle zwei Wochen zu reisen.

Bevorzugte Qualifikationen:

Doktortitel in maschinellem Lernen, NLP oder gleichwertige Forschungserfahrung mit Schwerpunkt auf großangelegtem Sprachmodellieren oder Datenkuratierung.
Eine Geschichte von Beiträgen zu erstklassigen Veranstaltungen (NeurIPS, ICML, ICLR, ACL usw.) speziell in Bezug auf Datenkuratierung, Skalierungsgesetze, synthetische Daten oder LLM-Vortraining.
Erfahrung im Training von Fundamentmodellen von Grund auf und Diagnose von dateninduzierten Trainingspathologien.
Bonus, aber nicht erforderlich: Deutschkenntnisse können hilfreich sein, um deutschsprachige Daten zu kuratieren und zu bewerten.

Vergütung und Leistungen:

Werden Sie Teil einer KI-Revolution!
30 Tage bezahlter Urlaub
Zugang zu einer Vielzahl von Fitness- und Wellnessangeboten über Wellhub
Unterstützung der psychischen Gesundheit durch nilo.health
Substantielle Subventionierung der betrieblichen Altersvorsorge für Ihre zukünftige Sicherheit
Subventioniertes deutschlandweites Verkehrsticket
Budget für zusätzliche technische Ausrüstung
Flexible Arbeitszeiten für eine bessere Work-Life-Balance und hybrides Arbeitsmodell
Virtuelles Aktienoptionsprogramm
JobRad® Fahrrad-Leasing

Senior AI Researcher - Pre-training Data (m/f/d) Arbeitgeber: Aleph Alpha

Aleph Alpha Research ist ein hervorragender Arbeitgeber, der eine Kultur der Eigenverantwortung und Autonomie fördert. Mit einem flachen Hierarchiemodell und einem unterstützenden Management ermöglicht das Unternehmen schnelle Entscheidungen und offene Kommunikation, was zu einem starken Gemeinschaftsgefühl führt. Die Möglichkeit zur persönlichen und beruflichen Weiterentwicklung sowie die Teilnahme an einer revolutionären AI-Innovation machen Aleph Alpha zu einem attraktiven Arbeitsplatz in Deutschland, insbesondere in den dynamischen Städten Heidelberg und Berlin.

Kontaktdaten:

Aleph Alpha Recruiting-Team

Profil von Aleph Alpha anzeigen

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass du so Senior AI Researcher - Pre-training Data (m/f/d) erhalten könntest

✨Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns gemeinsam nach Möglichkeiten suchen, um deine Fähigkeiten und Erfahrungen ins Rampenlicht zu rücken.

✨Tipp Nummer 2

Bereite dich auf Vorstellungsgespräche vor, indem du häufige Fragen und technische Herausforderungen durchgehst. Wir können dir helfen, die besten Antworten zu formulieren und deine Ideen klar zu präsentieren.

✨Tipp Nummer 3

Zeige deine Leidenschaft für das Thema! Sprich über deine bisherigen Projekte und wie sie zur Entwicklung von KI-Modellen beigetragen haben. Lass uns zusammen deine Erfolge hervorheben, um einen bleibenden Eindruck zu hinterlassen.

✨Tipp Nummer 4

Bewirb dich direkt über unsere Website! So hast du die besten Chancen, gesehen zu werden. Wir freuen uns darauf, dich in unserem Team willkommen zu heißen und gemeinsam an innovativen Lösungen zu arbeiten.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior AI Researcher - Pre-training Data (m/f/d) mit Bravour zu bestehen

Maschinenlernen Theorie

Datenzentrierte KI

Großes Sprachmodell Training

Datenkomposition

Curriculum Lernen

Datenqualität

Statistische Methoden

Python

PyTorch

Algorithmusentwicklung

Ablationsstudien

Datenkuratierung

Kollaboration im Team

Technische Berichterstattung

Präsentationsfähigkeiten

Einige Tipps für deine Bewerbung 🫡

Sei authentisch!:Zeig uns, wer du wirklich bist! Deine Persönlichkeit und Leidenschaft für das Thema sind genauso wichtig wie deine Qualifikationen. Lass uns in deinem Anschreiben spüren, warum du dich für die Rolle als Senior AI Researcher interessierst.

Mach es konkret!:Vermeide allgemeine Floskeln und geh ins Detail. Erzähl uns von konkreten Projekten oder Erfahrungen, die deine Fähigkeiten im Bereich Datenqualität und maschinelles Lernen unter Beweis stellen. Das macht deine Bewerbung viel überzeugender!

Struktur ist alles!:Achte darauf, dass deine Bewerbung klar strukturiert ist. Verwende Absätze, um verschiedene Themen zu gliedern, und achte auf eine logische Reihenfolge. So können wir deine Argumente besser nachvollziehen und erkennen, dass du dir Mühe gegeben hast.

Bewirb dich über unsere Website!:Wir freuen uns, wenn du dich direkt über unsere Website bewirbst. Das macht den Prozess für uns einfacher und schneller. Außerdem kannst du sicherstellen, dass alle Informationen korrekt übermittelt werden. Also, leg los und zeig uns, was du drauf hast!

Wie man sich auf ein Vorstellungsgespräch bei Aleph Alpha vorbereitet

✨Verstehe die Grundlagen

Mach dich mit den Grundlagen des maschinellen Lernens und der Datenzentrierung vertraut. Du solltest in der Lage sein, über die Trainingsdynamik von Modellen und die Bedeutung von Datenqualität zu sprechen. Zeige, dass du die theoretischen Konzepte hinter den Methoden verstehst, die du in deiner Arbeit anwenden möchtest.

✨Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Experimente, die du durchgeführt hast, und sei bereit, diese im Detail zu erläutern. Erkläre, wie du Daten kuratiert, ablation studies durchgeführt oder neue Algorithmen entwickelt hast. Konkrete Beispiele helfen, deine Erfahrung greifbar zu machen.

✨Zeige Teamgeist

Da die Rolle viel Zusammenarbeit erfordert, ist es wichtig, dass du deine Fähigkeit zur Teamarbeit unter Beweis stellst. Bereite dich darauf vor, Fragen zu beantworten, die deine Erfahrungen in interdisziplinären Teams betreffen. Betone, wie du mit anderen Forschern und Ingenieuren zusammengearbeitet hast, um gemeinsame Ziele zu erreichen.

✨Frage nach der Unternehmenskultur

Nutze die Gelegenheit, um mehr über die Kultur bei Aleph Alpha zu erfahren. Stelle Fragen zu den Werten des Unternehmens, der Arbeitsweise im Team und wie Innovation gefördert wird. Das zeigt dein Interesse an der Position und hilft dir, herauszufinden, ob das Unternehmen gut zu dir passt.

Senior AI Researcher - Pre-training Data (m/f/d)

Aleph Alpha

Standort: Heidelberg

Senior AI Researcher - Pre-training Data (m/f/d)

Auf einen Blick

Senior AI Researcher - Pre-training Data (m/f/d) Arbeitgeber: Aleph Alpha

StudySmarter Expertenrat🤫

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior AI Researcher - Pre-training Data (m/f/d) mit Bravour zu bestehen

Einige Tipps für deine Bewerbung 🫡

Wie man sich auf ein Vorstellungsgespräch bei Aleph Alpha vorbereitet

Unternehmen

Produkt

Help