Auf einen Blick
- Aufgaben: Führe großangelegte Experimente im Bereich Reinforcement Learning durch und verbessere unsere Modelle.
- Unternehmen: Aleph Alpha, ein innovatives Unternehmen in der KI-Forschung mit flacher Hierarchie.
- Vorteile: 30 Tage Urlaub, Fitnessangebote, mentale Gesundheitsunterstützung und flexible Arbeitszeiten.
- Weitere Informationen: Dynamisches Team mit exzellenten Entwicklungsmöglichkeiten und hybriden Arbeitsmodellen.
- Warum dieser Job: Gestalte die Zukunft der KI und arbeite an bahnbrechenden Projekten mit echtem Einfluss.
- Qualifikationen: Tiefes Verständnis von Reinforcement Learning und Erfahrung mit multi-node LLM-Training.
Das prognostizierte Gehalt liegt zwischen 60000 - 85000 € pro Jahr.
Unsere Mission
Aleph Alpha ist eines der wenigen Unternehmen in Europa mit einer End-to-End-Entwicklung von Modellen im eigenen Haus, einschließlich Vor- und Nachtraining. Wir entwickeln Modelle mit allgemeinen Fähigkeiten, die auch speziell darauf ausgelegt sind, die Bedürfnisse unserer Kunden zu erfüllen. Wir erweitern unser Post-Training-Team in Heidelberg (oder hybrid in Deutschland) und suchen einen AI-Forscher, der ein tiefes theoretisches Verständnis von Methoden des Reinforcement Learning mit dem Wunsch kombiniert, den Stand der Technik zu verbessern und die Modellfähigkeiten im großflächigen Training zu steigern.
Teamkultur
Bei Aleph Alpha fördern wir eine Kultur, die auf Eigenverantwortung, Autonomie und Empowerment basiert. Teams und Einzelpersonen werden ermutigt, Verantwortung für ihre Arbeit zu übernehmen und einen bedeutenden Einfluss auszuüben. Wir pflegen eine flache Organisationsstruktur mit effizientem, unterstützendem Management, das schnelle Entscheidungen, offene Kommunikation und ein starkes Gefühl für gemeinsame Ziele ermöglicht.
Über die Rolle
Als (Senior) AI-Forscher für Reinforcement Learning werden Sie die zugrunde liegende RL-Methodik gestalten und verbessern, eine qualitativ hochwertige Trainingscodebasis pflegen und großflächige Experimente durchführen, um unsere Leistungsbenchmarks zu optimieren. Diese Rolle ist für Sie geeignet, wenn Sie sowohl über einen starken theoretischen Hintergrund im Bereich RL als auch über den ingenieurtechnischen Antrieb verfügen, diese Methoden in die Produktion zu bringen und die Methoden im Rahmen des Reinforcement Learning-Teams zu verbessern.
In Ihrem Alltag werden Sie großflächige Reinforcement Learning-Experimente durchführen, Hypothesen aus den Ergebnissen ableiten und sowohl die Implementierung als auch die Methodik basierend auf den Beobachtungen iterieren. Gemeinsam mit einem kollaborativen Team werden Sie direkten Einfluss auf die Modelle haben, die wir unseren Kunden bereitstellen.
Ihre Verantwortlichkeiten
- Hill-climb im großflächigen Training: Durchführung großflächiger LLM-Trainingsläufe, tiefgehende Analyse der Bewertungsergebnisse, Vorschlag von Hypothesen zur Verbesserung und direkte Implementierung, um die Leistung auf unseren Benchmarks zu maximieren.
- Theoretische Innovation: Am Puls der RL-Forschung bleiben. Sie werden neuartige Ansätze für mehrstufiges Reinforcement Learning identifizieren, implementieren und iterieren.
- Skalierung unserer Trainingsinfrastruktur: Engpässe in unserem Trainingssetup identifizieren und unsere RL-Trainingsschleifen für großflächiges Training optimieren.
- Interdisziplinäre Zusammenarbeit: Zusammenarbeit mit unseren anderen Post-Training-Teams, um Rohfeedback in umsetzbare Trainingssignale umzuwandeln und sicherzustellen, dass unsere RL-Iterationen zu messbaren Verbesserungen in der nachgelagerten Leistung führen.
Ihr Profil
Grundlegende Qualifikationen
- Tiefes Verständnis der Theorie des Reinforcement Learning und wie sie sich auf moderne RL-Methoden bezieht.
- Erfahrung mit Multi-Node-LLM-Training (idealerweise unter Verwendung von RL). Sie verstehen, wie man Multi-Node-RL-Trainings skaliert und können über verteilte Algorithmen nachdenken und diese implementieren.
- Vertrautheit mit statistischen Methoden zur Bewertung und Versuchsplanung.
- Fähigkeit, darüber nachzudenken, was eine Bewertung/Umgebung misst und ob es wichtig ist – nicht nur Benchmarks auszuführen, sondern sie zu verstehen.
- Starke Python-Kenntnisse und Vertrautheit mit ML-Tools (insbesondere torch distributed).
- Bereitschaft, nach Heidelberg umzuziehen oder regelmäßig zu reisen (potenziell wöchentlich).
Bevorzugte Qualifikationen
- Doktortitel im Bereich Reinforcement Learning oder gleichwertige Forschungserfahrung.
- Eine Geschichte von Beiträgen zu erstklassigen Veranstaltungen (NeurIPS, ICML, ICLR usw.), insbesondere im Bereich RL.
- Erfahrung in der Bewertung von LLM-Modellen und der Gestaltung von Umgebungen für das Training.
Vergütung und Leistungen
Werden Sie Teil einer KI-Revolution!
- 30 Tage bezahlter Urlaub
- Zugang zu einer Vielzahl von Fitness- und Wellnessangeboten über Wellhub
- Psychische Gesundheitsunterstützung durch nilo.health
- Substantielle Subventionierung der betrieblichen Altersvorsorge für Ihre zukünftige Sicherheit
- Subventioniertes deutschlandweites Verkehrsticket
- Budget für zusätzliche technische Ausrüstung
- Flexible Arbeitszeiten für eine bessere Work-Life-Balance und hybrides Arbeitsmodell
- Virtuelles Aktienoptionsprogramm
- JobRad Fahrrad-Leasing
Senior AI Researcher- Reinforcement learning (f/m/d) Arbeitgeber: GEA Group Aktiengesellschaft
Aleph Alpha ist ein hervorragender Arbeitgeber, der eine Kultur der Eigenverantwortung und Autonomie fördert. Mit einem flachen Organisationsaufbau und einem unterstützenden Management ermöglicht das Unternehmen schnelle Entscheidungen und offene Kommunikation. Die Mitarbeiter profitieren von umfangreichen Wachstums- und Entwicklungsmöglichkeiten, flexiblen Arbeitszeiten sowie attraktiven Zusatzleistungen wie einem Virtual Stock Option Plan und einem Budget für technische Ausstattungen, während sie an der Spitze der KI-Forschung in Heidelberg arbeiten.
Kontaktdaten:
GEA Group Aktiengesellschaft Recruiting-Team
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior AI Researcher- Reinforcement learning (f/m/d) erhalten könnten
✨Netzwerken, Netzwerken, Netzwerken!
Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht vergessen, dass persönliche Empfehlungen oft der Schlüssel sind, um die Aufmerksamkeit von Recruitern zu gewinnen!
✨Sei proaktiv!
Warte nicht darauf, dass Stellenanzeigen veröffentlicht werden. Kontaktiere Unternehmen direkt und zeige dein Interesse an ihrer Arbeit. Wir bei StudySmarter glauben, dass Initiative oft belohnt wird!
✨Bereite dich auf technische Interviews vor!
Stelle sicher, dass du deine Kenntnisse in Reinforcement Learning und verwandten Themen auffrischst. Übe Coding-Challenges und sei bereit, deine Denkweise während des Problemlösens zu erklären. Das zeigt dein tiefes Verständnis!
✨Bewirb dich über unsere Website!
Wenn du dich für eine Stelle interessierst, bewirb dich direkt über unsere Website. So kannst du sicherstellen, dass deine Bewerbung die richtige Person erreicht und du die besten Chancen hast, gehört zu werden!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior AI Researcher- Reinforcement learning (f/m/d) mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die nicht nur die richtigen Fähigkeiten haben, sondern auch gut ins Team passen.
Mach es konkret!:Verwende konkrete Beispiele aus deiner bisherigen Erfahrung, um deine Fähigkeiten zu untermauern. Zeig uns, wie du in der Vergangenheit Herausforderungen gemeistert hast und welche Erfolge du erzielt hast.
Pass auf die Details auf!:Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreibfehler oder unklare Formulierungen können einen schlechten Eindruck hinterlassen. Lass jemanden drüberlesen, bevor du sie abschickst!
Bewirb dich über unsere Website!:Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und unkompliziert bei uns ankommt. Wir freuen uns auf deine Unterlagen!
Wie man sich auf ein Vorstellungsgespräch bei GEA Group Aktiengesellschaft vorbereitet
✨Verstehe die Grundlagen der Verstärkungslernen
Mach dich mit den theoretischen Grundlagen des Reinforcement Learning vertraut. Sei bereit, deine Kenntnisse über moderne Methoden und deren Anwendung in großen Trainingsumgebungen zu demonstrieren. Zeige, dass du nicht nur die Theorie verstehst, sondern auch, wie sie in der Praxis umgesetzt wird.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Experimente, die du durchgeführt hast, und sei bereit, diese im Detail zu erläutern. Erkläre, wie du Hypothesen aufgestellt, Tests durchgeführt und Ergebnisse analysiert hast. Das zeigt dein praktisches Wissen und deine Fähigkeit zur Problemlösung.
✨Zeige deine Teamfähigkeit
Da die Rolle viel Zusammenarbeit erfordert, sei bereit, über deine Erfahrungen in interdisziplinären Teams zu sprechen. Betone, wie du Feedback in umsetzbare Trainingssignale umgewandelt hast und wie du zur Verbesserung der Teamleistung beigetragen hast.
✨Frage nach der Unternehmenskultur
Nutze die Gelegenheit, um mehr über die Kultur bei Aleph Alpha zu erfahren. Frage nach der Unterstützung für Innovationen im Bereich Reinforcement Learning und wie das Unternehmen sicherstellt, dass Mitarbeiter Verantwortung übernehmen können. Das zeigt dein Interesse an der langfristigen Zusammenarbeit und deinem Engagement für die Unternehmensziele.