Senior Research Scientist - Reinforcement Learning, MoEs

Jobbörse

Unternehmen

black.ai

Senior Research Scientist - Reinforcement Learning, MoEs

Wien Vollzeit 80000 - 110000 € / Jahr (geschätzt) Homeoffice (teilweise)

Auf einen Blick

Aufgaben: Führe bahnbrechende Forschung in Reinforcement Learning und agentischen Systemen durch.
Unternehmen: Innovatives Unternehmen, das Design neu definiert und eine inklusive Kultur pflegt.
Vorteile: Aktienpakete, flexible Urlaubsoptionen und jährliche Wohlfühlzulagen.
Weitere Informationen: Dynamisches Arbeitsumfeld mit vielen Möglichkeiten zur persönlichen und beruflichen Entwicklung.
Warum dieser Job: Gestalte die Zukunft von KI im Design und mache echten Einfluss auf Millionen von Nutzern.
Qualifikationen: Erfahrung in Reinforcement Learning, MoEs und experimentellem Design.

Das prognostizierte Gehalt liegt zwischen 80000 - 110000 € pro Jahr.

Unternehmensbeschreibung

Wir bei Canva haben die Mission, die Welt zum Gestalten zu befähigen. Wir entwickeln KI, die magisch wirkt und echten Einfluss auf Millionen von Menschen hat - und jedem hilft, mit Vertrauen zu gestalten.

Jobbeschreibung

Wir suchen einen Senior Research Scientist, der sich leidenschaftlich mit Reinforcement Learning, agentischen Systemen und Mixture of Expert-Modellen beschäftigt, um die Grenzen des Denkens, der Werkzeugnutzung, der Latenz und der Zuverlässigkeit zu erweitern und dies an die Nutzer zu bringen.

Über das Team

Wir erkunden multimodale agentische Architekturen, bauen skalierbare Trainings- und Evaluationsschleifen und arbeiten eng mit Produkt- und Plattformteams zusammen, um Durchbrüche in erfreuliche Produktmerkmale umzusetzen. Wir sind ein innovatives Post-Training-Team, das neue multimodale agentische Systeme entwickelt.

Über die Rolle

Sie werden Forschungsrichtungen vorantreiben und eine führende Rolle bei praktischen Arbeiten im gesamten Agentenstapel spielen - von der Belohnungsgestaltung und der Politikoptimierung bis hin zu Planung, Gedächtnis und Werkzeugkoordination, Datensatzkonstruktion, Post-Training und der Entwicklung neuartiger Post-Training-Ansätze. Sie werden enge Experimente entwerfen, schnell iterieren und vertrauenswürdige Schlussfolgerungen ziehen. Am wichtigsten ist, dass Sie helfen, Forschung in zuverlässige, sichere und qualitativ hochwertige Produkterlebnisse umzuwandeln.

Was Sie tun werden:

Entwicklung von Agentensystemen (Planung, multimodale Werkzeugnutzung, Abruf, neuartige Trainingsansätze, Modellierungsablationen) für reale Aufgaben in Design, Vision und Sprache.
Skalierung von Post-Training und RL über verteilte Systeme (PyTorch) mit effizienten Datenladeprogrammen, Tracing/Telemetrie, stabilem Training von Mixture-of-Experts (MoE)-Architekturen und reproduzierbaren Pipelines; Profilierung, Debugging und Optimierung.
Beitrag zur Forschungsagenda für RL/agentische Systeme, die mit den Produktzielen von Canva übereinstimmt; Identifizierung von hochwirksamen Wetten und schnelles Beenden von Sackgassen.
Entwicklung von Belohnungsmodellen und Lernschleifen: RLHF/RLAIF, Präferenzmodellierung, DPO/IPO-Stilziele, Offline/Online RL, Curriculum-Lernen und Kreditzuweisung für mehrstufiges Denken.
Entwicklung von Simulations- und Sandbox-Aufgaben, die Fehlermodi aufdecken (Planungsfehler, Zerbrechlichkeit der Werkzeugnutzung, Halluzination, unsichere Aktionen) und diese in messbare Ziele umwandeln.
Hilfe bei der Ausrichtung auf rigorose Bewertungen für Agenten (Aufgabenerfolg, Zuverlässigkeit, Latenz, Sicherheit, Regressionen). Einrichtung von Offline-Suiten und Online-A/B-Tests; Bevorzugung einfacher, kontrollierter Experimente, die verallgemeinern.
Zusammenarbeit und Versand: Schulter an Schulter mit Produkt-, Design-, Sicherheits- und Plattformteams arbeiten, um Forschung als zuverlässige Funktionen zu implementieren - und dann iterieren.
Teilen und Erhöhen: Mentoring von Teamkollegen, Präsentation von Ergebnissen intern und Rückgabe an die Gemeinschaft, wenn es dem Bereich und unseren Nutzern hilft.

Sie passen wahrscheinlich gut, wenn Sie:

Tiefe Erfahrung in der Implementierung und im Post-Training von MoEs/LLMs/VLMs/Diffusionsmodellen haben, mit einer Erfolgsbilanz an veröffentlichten Forschungen oder Veröffentlichungen in MoEs, RL oder Agenten.
Erfahrung in der Modifikation und Anpassung von Open-Source-Modellen haben.
Starke Erfahrung im experimentellen Design: enge Baselines, saubere Ablationen, Reproduzierbarkeit und klare, datengestützte Schlussfolgerungen.
Fließend in Python und PyTorch sind; Sie sind in großen ML-Codebasen vertraut und können Training und Inferenz profilieren, debuggen und optimieren.
Praktische Erfahrung im Aufbau von Agentenschleifen (Planung, Werkzeugaufruf, Abruf, Gedächtnis) und der Bewertung der Qualität des mehrstufigen Denkens haben.
Praktische Erfahrung mit Politikoptimierung, Belohnungsmodellierung und Präferenzlernen (z.B. RLHF/RLAIF, DPO/IPO, Actor-Critic/PPO, Offline RL).
Erfahrung mit großflächigem Training (verteiltes Training, Experimentverfolgung, Evaluierungswerkzeuge) und cloudbasierten multimodalen Werkzeugen haben.
Erfahrung mit RL für MoE-Architekturen haben.

Schön zu haben:

Erfahrung mit Video- und Audio-Modellierung.
Erfahrung mit Multi-Agenten-Einstellungen.
Stärke in der Ausrichtung und Sicherheitsbewertungen, einschließlich Red-Teaming und Risikominderung für werkzeugbenutzende Agenten.
Beiträge zu Open-Source, Benchmarks oder gemeinsamen Evaluierungssuiten für Agenten.

Zusätzliche Informationen

Was ist für Sie drin? Das Erreichen unserer verrückt großen Ziele motiviert uns, hart zu arbeiten - und das tun wir - aber Sie werden auch viele Momente der Magie, Verbundenheit und des Spaßes erleben, die das Leben bei Canva durchziehen. Wir bieten auch eine Reihe von Vorteilen, um Sie für jeden Erfolg im und außerhalb der Arbeit vorzubereiten.

Hier ist ein Vorgeschmack auf das, was angeboten wird:

Aktienpakete - wir möchten, dass unser Erfolg auch Ihrer ist.
Inklusive Elternzeitregelung, die alle Eltern und Betreuer unterstützt.
Ein jährliches Vibe & Thrive-Zuschuss zur Unterstützung Ihres Wohlbefindens, sozialer Verbindung, Home-Office-Setup und mehr.
Flexible Urlaubsoptionen, die es Ihnen ermöglichen, eine Kraft für das Gute zu sein, Zeit zum Auftanken zu nehmen und Sie persönlich zu unterstützen.

Weitere Informationen finden Sie unter lifeatcanva.com.

Sonstige Informationen

Wir treffen Einstellungsentscheidungen basierend auf Ihren Erfahrungen, Fähigkeiten und Ihrer Leidenschaft sowie darauf, wie Sie Canva und unsere Kultur bereichern können. Wenn Sie sich bewerben, teilen Sie uns bitte die Pronomen mit, die Sie verwenden, und alle angemessenen Anpassungen, die Sie während des Interviewprozesses benötigen.

Bitte beachten Sie, dass die Interviews überwiegend virtuell durchgeführt werden.

Senior Research Scientist - Reinforcement Learning, MoEs Arbeitgeber: black.ai

Canva ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Freiheit gibt, ihren Arbeitsort und -stil zu wählen, um eine optimale Balance zwischen beruflichem und persönlichem Leben zu finden. Mit einem starken Fokus auf Innovation im Bereich KI und einem unterstützenden Arbeitsumfeld bietet Canva nicht nur wettbewerbsfähige Vergütungen und Aktienpakete, sondern auch umfassende Möglichkeiten zur persönlichen und beruflichen Weiterentwicklung. Die Unternehmenskultur fördert Kreativität, Zusammenarbeit und Spaß, was das Arbeiten in unserem Wiener Büro zu einer einzigartigen Erfahrung macht.

Kontaktdaten:

black.ai Recruiting-Team

Profil von black.ai anzeigen

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior Research Scientist - Reinforcement Learning, MoEs erhalten könnten

✨Sei aktiv in lokalen Datenbank-Communities

Schau dir lokale Meetup-Gruppen oder Online-Communities an, die sich mit Datenbanken beschäftigen. Dort kannst du nicht nur dein Netzwerk erweitern, sondern auch wertvolle Kontakte knüpfen, die dir bei der Jobsuche helfen können. Viele Unternehmen schätzen Empfehlungen aus diesen Communities.

✨Zeige deine Skills in Open-Source-Projekten

Beteilige dich an Open-Source-Projekten, die mit Datenbanken arbeiten. So kannst du deine Fähigkeiten unter Beweis stellen und gleichzeitig einen beeindruckenden Portfoliobereich aufbauen, den du potenziellen Arbeitgebern präsentieren kannst.

✨Besuche Jobmessen und Recruiting-Events

Jobmessen sind eine großartige Gelegenheit, um direkt mit Unternehmen in Kontakt zu treten. Informiere dich über lokale Jobmessen, die sich auf Tech- und Datenbankrollen konzentrieren, und bereite uns vor, um unseren Lebenslauf und unser Interesse an der Rolle zu präsentieren.

✨Bewirb dich direkt bei black.ai

Wir empfehlen dir, auch direkt über unsere Website bei black.ai für die Stelle als Senior Research Scientist - Reinforcement Learning, MoEs zu bewerben. Zeig uns deine Leidenschaft für Datenbanken und warum du Teil unseres Teams werden möchtest. Jede Bewerbung zählt!

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Research Scientist - Reinforcement Learning, MoEs mit Bravour zu bestehen

Reinforcement Learning (RL)

Mixture of Expert Models (MoEs)

Post-Training

Python

PyTorch

Experimentelles Design

Belohnungsmodellierung

Multi-Agent Systeme

Skalierbare Trainingsansätze

Datenanalyse

Evaluierung von Agenten

Optimierung von Richtlinien

Kollaboration mit Produktteams

Mentoring von Teamkollegen

Entwicklung von Simulationsaufgaben

Einige Tipps für deine Bewerbung 🫡

Datenbank-Skills hervorheben:In deinem Lebenslauf solltest du unbedingt deine Erfahrungen mit verschiedenen Datenbankmanagementsystemen (DBMS) wie MySQL, PostgreSQL oder MongoDB betonen. Wenn du spezielle Projekte oder Aufgaben in deinem letzten Job hast, die deine Fähigkeiten im Umgang mit Datenbanken zeigen, nenn diese unbedingt!

Projekte und Zertifikate erwähnen:Falls du an relevanten Projekten oder Kursen in Bezug auf Datenbanken teilgenommen hast, pack sie in dein Portfolio oder erwähne sie in deinem Anschreiben. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Anwendungskonzepte beherrschst!

Motivation und Teamfähigkeit zeigen:Da du dich auf eine Vollzeitstelle bewirbst, ist es wichtig, dass du in deinem Anschreiben deutlich machst, warum du leidenschaftlich an der Arbeit mit Datenbanken interessiert bist und wie gut du im Team arbeiten kannst. Unternehmen suchen oft nach Mitarbeitern, die auch über die technischen Fähigkeiten hinaus ins Team passen.

Die richtige Struktur im Lebenslauf:Gestalte deinen Lebenslauf klar und strukturiert – in der Datenbankbranche kommt es nicht nur auf die Inhalte an, sondern auch auf die Art und Weise, wie du sie präsentierst. Nutze klare Überschriften und Absätze, um deine Fähigkeiten und Erfahrungen hervorzuheben. Und vergiss nicht, dein Lebenslauf sollte so aufbereitet sein, dass man sofort erkennt, dass du ein wahres Datenbanktalent bist!

Wie man sich auf ein Vorstellungsgespräch bei black.ai vorbereitet

✨Sei bereit für technische Fragen zur Datenbankverwaltung

Egal, ob es um SQL-Abfragen, Datenmodellierung oder Performance-Optimierung geht, du solltest die Grundlagen perfekt beherrschen. Bereite dich darauf vor, praktische Probleme zu lösen und deine Lösungsansätze zu erklären – das zeigt, dass du nicht nur Theorie kennst, sondern auch praktisch umgehen kannst!

✨Portfolio nicht vergessen!

Wenn du bereits an Datenbankprojekten gearbeitet hast, bringe Beispiele mit, die deine Fähigkeiten zeigen. Zeige, wie du Probleme gelöst hast und wie deine Ansätze zur Effizienz der Datenbank beigetragen haben. Ein starkes Portfolio kann dich von anderen Kandidaten abheben!

✨Verstehe die spezifischen Tools der Branche

Je nach black.ai könnte es sein, dass ihr spezifische Datenbankmanagementsysteme nutzt. Mach dich mit diesen vertraut und zeige dein Wissen über die neuesten Tools und Technologien. Das zeigt, dass du aufmerksam bist und dich bereits mit ihrer Arbeitsweise beschäftigt hast.

✨Motivation und Entwicklung in den Vordergrund stellen

Da es sich um eine Vollzeitstelle handelt, wollen sie wissen, dass du langfristig motiviert bist. Erkläre, warum dich die Arbeit in der Datenbankverwaltung begeistert und wie du deine Fähigkeiten weiterentwickeln möchtest, um einen Mehrwert für black.ai zu schaffen.

Senior Research Scientist - Reinforcement Learning, MoEs

black.ai

Standort: Wien

Senior Research Scientist - Reinforcement Learning, MoEs

Auf einen Blick

Senior Research Scientist - Reinforcement Learning, MoEs Arbeitgeber: black.ai

StudySmarter Expertenrat🤫

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Research Scientist - Reinforcement Learning, MoEs mit Bravour zu bestehen

Einige Tipps für deine Bewerbung 🫡

Wie man sich auf ein Vorstellungsgespräch bei black.ai vorbereitet

Unternehmen

Produkt

Help