Auf einen Blick
- Aufgaben: Gestalte und verbessere die wissenschaftliche Methodik hinter unseren Pre-Training-Daten.
- Unternehmen: Aleph Alpha, ein führendes Unternehmen in der KI-Forschung in Europa.
- Vorteile: 30 Tage Urlaub, Fitnessangebote, mentale Gesundheitsunterstützung und flexible Arbeitszeiten.
- Weitere Informationen: Flache Hierarchien und eine Kultur der Eigenverantwortung fördern schnelles Handeln und offene Kommunikation.
- Warum dieser Job: Sei Teil einer KI-Revolution und arbeite an innovativen Projekten mit echtem Einfluss.
- Qualifikationen: Tiefes Verständnis von maschinellem Lernen und Erfahrung in der Datenkomposition.
Das prognostizierte Gehalt liegt zwischen 65000 - 85000 € pro Jahr.
Unsere Mission
Aleph Alpha ist eines der wenigen Unternehmen in Europa, das ernsthaft an der Vortraining von Fundamentmodellen arbeitet. Unsere Kunden - in den Bereichen Finanzen, Fertigung und öffentliche Verwaltung - benötigen Modelle, die Deutsch verstehen, die europäischen Vorschriften entsprechen und zuverlässig in kritischen Anwendungen funktionieren. Wir bauen das in Heidelberg auf.
Wir erweitern unser Pre-Training-Team und suchen jemanden, der leidenschaftlich an Daten arbeitet: Definieren, was in unsere Modelle eingeht, Systeme zu entwickeln, die diese beschaffen und vorbereiten, und sicherzustellen, dass unser Trainingsteam die qualitativ hochwertigsten Daten hat, um die Modellfähigkeiten voranzutreiben.
Teamkultur
Bei Aleph Alpha fördern wir eine Kultur, die auf Eigenverantwortung, Autonomie und Empowerment basiert. Teams und Einzelpersonen werden ermutigt, Verantwortung für ihre Arbeit zu übernehmen und einen bedeutenden Einfluss auszuüben. Wir pflegen eine flache Organisationsstruktur mit effizientem, unterstützendem Management, das schnelle Entscheidungen, offene Kommunikation und ein starkes Gefühl des gemeinsamen Zwecks ermöglicht.
Über die Rolle
Als Senior AI Researcher für Pre-training Data werden Sie die zugrunde liegende wissenschaftliche Methodik hinter unseren Pre-Training-Korpora gestalten und verbessern, während Sie auch die Software und Systeme mitentwickeln, die dies ermöglichen. Sie arbeiten mit Ingenieuren und anderen Forschern zusammen, um skalierbare Pipelines zu erstellen, und konzentrieren sich auf relevante theoretische und empirische Forschung, um zu verstehen, welche Daten die Modelle am besten auf unsere Zielkapazitäten bringen. Diese Rolle ist für Sie geeignet, wenn Sie über einen starken Hintergrund im Bereich des großangelegten Sprachmodellings verfügen und den wissenschaftlichen Antrieb haben, komplexe Fragen zu Daten-Skalierungsgesetzen, synthetischer Datengenerierung und Curriculum-Lernen zu beantworten.
Ihre Verantwortlichkeiten
- Innovation in Data-Centric AI: Bleiben Sie an der Spitze der Forschung zu Fundamentmodellen. Sie identifizieren, implementieren und iterieren neuartige Ansätze zur Schätzung der Datenqualität, zur synthetischen Datengenerierung, zum Curriculum-Lernen und zu fortgeschrittenen Kurationsmethoden.
- Data-to-Performance Science: Entwerfen und leiten Sie rigorose Ablationsstudien über verschiedene Skalen. Sie analysieren systematisch, wie Änderungen in der Datenzusammensetzung, Strategien zur Duplikation, heuristische und modellbasierte Kurierung sowie Skalierungsgesetze die Trainingsdynamik und die Zielmodelle und -systemfähigkeiten beeinflussen.
- Entwicklung neuartiger Qualitätsindikatoren: Gehen Sie über grundlegende Perplexitätsfilter hinaus. Forschen und entwickeln Sie fortschrittliche Algorithmen zur Bewertung und Auswahl von Daten, wie Einflussfunktionen, gradientenbasierte Übereinstimmung oder die Verwendung kleinerer Modelle zur Kurierung von Daten für größere.
- Interdisziplinäre Zusammenarbeit: Arbeiten Sie eng mit einem vielfältigen Team zusammen, um Ihre Forschung von Prototypen zu Pipelines im Billionen-Tokens-Maßstab zu skalieren, und arbeiten Sie mit dem Post-Training-Team zusammen, um sicherzustellen, dass die Pre-Training-Verteilungen die gezielte Feinabstimmung und Kundenanpassung effektiv unterstützen.
Ihr Profil
Grundqualifikationen:
- Ein tiefes Verständnis der Theorie des maschinellen Lernens, insbesondere in Bezug auf die Dynamik des Trainings von Fundamentmodellen, Skalierungsgesetze und datenzentriertes KI.
- Erfahrung in der Gestaltung und Bewertung komplexer ML-Experimente im Zusammenhang mit Datenzusammensetzung, Curriculum-Lernen oder Datenqualität beim Training von Sprachmodellen.
- Vertrautheit mit statistischen Methoden zur Bewertung und Versuchsplanung.
- Fähigkeit, über die informationstheoretischen Eigenschaften eines Datensatzes und dessen prädiktive Kraft für bewertete Aufgaben nachzudenken: nicht nur Daten zu verarbeiten, sondern deren Signal zu verstehen.
- Starke Python-Kenntnisse und Vertrautheit mit ML-Tools und Deep-Learning-Frameworks (insbesondere PyTorch).
- Bereitschaft, nach Heidelberg umzuziehen oder mindestens alle zwei Wochen zu reisen.
Bevorzugte Qualifikationen:
- Doktortitel in maschinellem Lernen, NLP oder gleichwertige Forschungserfahrung mit Schwerpunkt auf großangelegtem Sprachmodellieren oder Datenkuratierung.
- Eine Geschichte von Beiträgen zu erstklassigen Veranstaltungen (NeurIPS, ICML, ICLR, ACL usw.) speziell in Bezug auf Datenkuratierung, Skalierungsgesetze, synthetische Daten oder LLM-Vortraining.
- Erfahrung im Training von Fundamentmodellen von Grund auf und Diagnose von dateninduzierten Trainingspathologien.
- Bonus, aber nicht erforderlich: Deutschkenntnisse können hilfreich sein, um deutschsprachige Daten zu kuratieren und zu bewerten.
Vergütung und Leistungen:
- Werden Sie Teil einer KI-Revolution!
- 30 Tage bezahlter Urlaub
- Zugang zu einer Vielzahl von Fitness- und Wellnessangeboten über Wellhub
- Unterstützung der psychischen Gesundheit durch nilo.health
- Substantielle Subventionierung der betrieblichen Altersvorsorge für Ihre zukünftige Sicherheit
- Subventioniertes deutschlandweites Verkehrsticket
- Budget für zusätzliche technische Ausrüstung
- Flexible Arbeitszeiten für eine bessere Work-Life-Balance und hybrides Arbeitsmodell
- Virtuelles Aktienoptionsprogramm
- JobRad® Fahrrad-Leasing
Senior AI Researcher - Pre-training Data (m/f/d) Arbeitgeber: Aleph Alpha
Aleph Alpha ist ein herausragender Arbeitgeber, der eine Kultur der Eigenverantwortung und Autonomie fördert. Mit einem flachen Organisationsaufbau und einem unterstützenden Management ermöglicht das Unternehmen schnelle Entscheidungen und offene Kommunikation. Die Mitarbeiter profitieren von umfangreichen Wachstums- und Entwicklungsmöglichkeiten, flexiblen Arbeitszeiten sowie attraktiven Zusatzleistungen wie 30 Tagen Urlaub, einem subventionierten Altersvorsorgeplan und einem virtuellen Aktienoptionsplan, alles in der inspirierenden Umgebung von Heidelberg.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior AI Researcher - Pre-training Data (m/f/d) erhalten könnten
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns gemeinsam nach Möglichkeiten suchen, um deine Fähigkeiten und Erfahrungen ins Rampenlicht zu rücken.
✨Tipp Nummer 2
Bereite dich auf Vorstellungsgespräche vor, indem du häufige Fragen und technische Herausforderungen durchgehst. Wir können dir helfen, die besten Antworten zu formulieren und deine Ideen klar zu präsentieren.
✨Tipp Nummer 3
Zeige deine Leidenschaft für das Thema! Sprich über deine bisherigen Projekte und wie sie zur Entwicklung von KI-Modellen beigetragen haben. Lass uns zusammen deine Erfolge hervorheben, um einen bleibenden Eindruck zu hinterlassen.
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! So hast du die besten Chancen, gesehen zu werden. Wir freuen uns darauf, dich in unserem Team willkommen zu heißen und gemeinsam an innovativen Lösungen zu arbeiten.
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior AI Researcher - Pre-training Data (m/f/d) mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei authentisch!:Zeig uns, wer du wirklich bist! Deine Persönlichkeit und Leidenschaft für das Thema sind genauso wichtig wie deine Qualifikationen. Lass uns in deinem Anschreiben spüren, warum du dich für die Rolle als Senior AI Researcher interessierst.
Mach es konkret!:Vermeide allgemeine Floskeln und geh ins Detail. Erzähl uns von konkreten Projekten oder Erfahrungen, die deine Fähigkeiten im Bereich Datenqualität und maschinelles Lernen unter Beweis stellen. Das macht deine Bewerbung viel überzeugender!
Struktur ist alles!:Achte darauf, dass deine Bewerbung klar strukturiert ist. Verwende Absätze, um verschiedene Themen zu gliedern, und achte auf eine logische Reihenfolge. So können wir deine Argumente besser nachvollziehen und erkennen, dass du dir Mühe gegeben hast.
Bewirb dich über unsere Website!:Wir freuen uns, wenn du dich direkt über unsere Website bewirbst. Das macht den Prozess für uns einfacher und schneller. Außerdem kannst du sicherstellen, dass alle Informationen korrekt übermittelt werden. Also, leg los und zeig uns, was du drauf hast!
Wie man sich auf ein Vorstellungsgespräch bei Aleph Alpha vorbereitet
✨Verstehe die Grundlagen
Mach dich mit den Grundlagen des maschinellen Lernens und der Datenzentrierung vertraut. Du solltest in der Lage sein, über die Trainingsdynamik von Modellen und die Bedeutung von Datenqualität zu sprechen. Zeige, dass du die theoretischen Konzepte hinter den Methoden verstehst, die du in deiner Arbeit anwenden möchtest.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Experimente, die du durchgeführt hast, und sei bereit, diese im Detail zu erläutern. Erkläre, wie du Daten kuratiert, ablation studies durchgeführt oder neue Algorithmen entwickelt hast. Konkrete Beispiele helfen, deine Erfahrung greifbar zu machen.
✨Zeige Teamgeist
Da die Rolle viel Zusammenarbeit erfordert, ist es wichtig, dass du deine Fähigkeit zur Teamarbeit unter Beweis stellst. Bereite dich darauf vor, Fragen zu beantworten, die deine Erfahrungen in interdisziplinären Teams betreffen. Betone, wie du mit anderen Forschern und Ingenieuren zusammengearbeitet hast, um gemeinsame Ziele zu erreichen.
✨Frage nach der Unternehmenskultur
Nutze die Gelegenheit, um mehr über die Kultur bei Aleph Alpha zu erfahren. Stelle Fragen zu den Werten des Unternehmens, der Arbeitsweise im Team und wie Innovation gefördert wird. Das zeigt dein Interesse an der Position und hilft dir, herauszufinden, ob das Unternehmen gut zu dir passt.