Senior Research Scientist - Reinforcement Learning, MoEs

Senior Research Scientist - Reinforcement Learning, MoEs

Wien Vollzeit 80000 - 110000 € / Jahr (geschätzt) Homeoffice (teilweise)
Canva

Auf einen Blick

  • Aufgaben: Entwickle KI-Systeme und arbeite an innovativen Projekten im Bereich Reinforcement Learning.
  • Unternehmen: Canva, ein kreatives Unternehmen, das Design neu definiert.
  • Vorteile: Aktienpakete, flexible Arbeitszeiten und umfassende Sozialleistungen.
  • Weitere Informationen: Dynamisches Team mit großartigen Wachstums- und Entwicklungsmöglichkeiten.
  • Warum dieser Job: Gestalte die Zukunft des Designs mit bahnbrechender KI-Technologie.
  • Qualifikationen: Erfahrung in Reinforcement Learning und agentischen Systemen erforderlich.

Das prognostizierte Gehalt liegt zwischen 80000 - 110000 € pro Jahr.

Unternehmensbeschreibung

Schließen Sie sich dem Team an, das neu definiert, wie die Welt Design erlebt. Bei Canva ist es unsere Mission, die Welt zum Gestalten zu befähigen. Wir entwickeln KI, die magisch wirkt und echten Einfluss auf Millionen von Menschen hat - und jedem hilft, mit Vertrauen zu gestalten.

Jobbeschreibung

Wir suchen einen Senior Research Scientist, der sich leidenschaftlich mit Reinforcement Learning, agentischen Systemen und Mixture of Expert-Modellen beschäftigt, um die Grenzen des Denkens, der Werkzeugnutzung, der Latenz und der Zuverlässigkeit zu erweitern und dies den Nutzern zur Verfügung zu stellen.

Über das Team

Wir erkunden multimodale agentische Architekturen, bauen skalierbare Trainings- und Evaluationsschleifen und arbeiten eng mit Produkt- und Plattformteams zusammen, um Durchbrüche in erfreuliche Produktmerkmale umzuwandeln. Wir sind ein hochmodernes Post-Training-Team, das neue multimodale agentische Systeme entwickelt.

Über die Rolle

Sie werden Forschungsrichtungen vorantreiben und eine führende Rolle bei praktischen Arbeiten im gesamten Agentenstapel spielen - von der Belohnungsgestaltung und der Politikoptimierung bis hin zu Planung, Gedächtnis und Werkzeugkoordination, Datensatzkonstruktion bis hin zum Post-Training und der Entwicklung neuartiger Post-Training-Ansätze. Sie werden enge Experimente entwerfen, schnell iterieren und vertrauenswürdige Schlussfolgerungen ziehen.

Was Sie tun werden:

  • Entwickeln von Agentensystemen (Planung, multimodale Werkzeugnutzung, Abruf, neuartige Trainingsansätze, Modellierungsablationen) für reale Aufgaben in Design, Vision und Sprache.
  • Skalierung von Post-Training und RL über verteilte Systeme (PyTorch) mit effizienten Datenladeprogrammen, Tracing/Telemetrie, stabilem Training von Mixture-of-Experts (MoE)-Architekturen und reproduzierbaren Pipelines; Profilierung, Debugging und Optimierung.
  • Beitragen zur Forschungsagenda für RL/agentische Systeme, die mit den Produktzielen von Canva übereinstimmt; Identifizierung von hochwirksamen Wetten und schnelles Beenden von Sackgassen.
  • Entwicklung von Belohnungsmodellen und Lernschleifen: RLHF/RLAIF, Präferenzmodellierung, DPO/IPO-Stilziele, Offline/Online RL, Curriculum-Lernen und Kreditvergabe für mehrstufiges Denken.
  • Entwicklung von Simulationen und Sandbox-Aufgaben, die Fehlermodi aufdecken (Planungsfehler, Werkzeugnutzungsanfälligkeit, Halluzination, unsichere Aktionen) und diese in messbare Ziele umwandeln.
  • Hilfe bei der Ausrichtung auf rigorose Bewertungen für Agenten (Aufgabenerfolg, Zuverlässigkeit, Latenz, Sicherheit, Regressionen). Einrichtung von Offline-Suiten und Online-A/B-Tests; einfache, kontrollierte Experimente, die verallgemeinern.
  • Zusammenarbeiten und Ausliefern: Schulter an Schulter mit Produkt, Design, Sicherheit und Plattform arbeiten, um Forschung als zuverlässige Funktionen zu implementieren - und dann iterieren.
  • Teilen und Erhöhen: Mentoring von Teamkollegen, Präsentation von Ergebnissen intern und Rückgabe an die Gemeinschaft, wenn es dem Bereich und unseren Nutzern hilft.

Sie passen wahrscheinlich gut zu uns, wenn Sie:

  • Tiefe Erfahrung in der Implementierung und im Post-Training von MoEs/LLMs/VLMs/Diffusionsmodellen haben, mit einer Erfolgsbilanz an veröffentlichten Forschungen oder Publikationen in MoEs, RL oder Agenten.
  • Erfahrung in der Modifikation und Anpassung von Open-Source-Modellen haben.
  • Starke Erfahrung im experimentellen Design: enge Baselines, saubere Ablationen, Reproduzierbarkeit und klare, datengestützte Schlussfolgerungen.
  • Fließend in Python und PyTorch sind; Sie sind in großen ML-Codebasen vertraut und können Training und Inferenz profilieren, debuggen und optimieren.
  • Praktische Erfahrung im Aufbau von Agentenschleifen (Planung, Werkzeugaufruf, Abruf, Gedächtnis) und der Bewertung der Qualität des mehrstufigen Denkens haben.
  • Praktische Erfahrung mit Politikoptimierung, Belohnungsmodellierung und Präferenzlernen (z.B. RLHF/RLAIF, DPO/IPO, Actor-Critic/PPO, Offline RL) haben.
  • Erfahrung mit großflächigem Training (verteiltes Training, Experimentverfolgung, Evaluierungswerkzeuge) und cloudbasierten multimodalen Werkzeugen haben.
  • Erfahrung mit RL für MoE-Architekturen haben.

Zusätzliche Informationen

Was ist für Sie drin? Das Erreichen unserer verrückt großen Ziele motiviert uns, hart zu arbeiten - und das tun wir - aber Sie werden auch viele Momente der Magie, Verbundenheit und des Spaßes erleben, die das Leben bei Canva durchziehen. Wir bieten auch eine Reihe von Vorteilen, um Sie für jeden Erfolg im und außerhalb der Arbeit vorzubereiten.

Hier ist ein Vorgeschmack auf das Angebot:

  • Aktienpakete - wir möchten, dass unser Erfolg auch Ihrer ist.
  • Inklusive Elternzeitregelung, die alle Eltern und Betreuer unterstützt.
  • Ein jährliches Vibe & Thrive-Zuschuss zur Unterstützung Ihres Wohlbefindens, sozialer Verbindung, Home-Office-Einrichtung und mehr.
  • Flexible Urlaubsoptionen, die es Ihnen ermöglichen, eine Kraft für das Gute zu sein, Zeit zum Auftanken zu nehmen und Sie persönlich zu unterstützen.

Weitere Informationen finden Sie unter lifeatcanva.com.

Sonstige Informationen

Wir treffen Einstellungsentscheidungen basierend auf Ihren Erfahrungen, Fähigkeiten und Ihrer Leidenschaft sowie darauf, wie Sie Canva und unsere Kultur bereichern können. Wenn Sie sich bewerben, teilen Sie uns bitte die Pronomen mit, die Sie verwenden, und alle angemessenen Anpassungen, die Sie während des Interviewprozesses benötigen. Bitte beachten Sie, dass die Interviews überwiegend virtuell durchgeführt werden.

Senior Research Scientist - Reinforcement Learning, MoEs Arbeitgeber: Canva

Canva ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Freiheit gibt, ihren Arbeitsort und -stil zu wählen, um eine optimale Balance zwischen beruflichem und persönlichem Leben zu finden. Mit einem innovativen Ansatz zur Entwicklung von KI-Produkten in einer dynamischen und unterstützenden Teamkultur bietet Canva nicht nur wettbewerbsfähige Vergütungen und umfassende Sozialleistungen, sondern auch zahlreiche Möglichkeiten zur persönlichen und beruflichen Weiterentwicklung. Die einzigartige Kombination aus kreativer Freiheit und technologischem Fortschritt macht die Arbeit in Wien besonders spannend und lohnend.

Canva

Kontaktdaten:

Canva Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior Research Scientist - Reinforcement Learning, MoEs erhalten könnten

Sei aktiv in lokalen Datenbank-Communities

Schau dir lokale Meetup-Gruppen oder Online-Communities an, die sich mit Datenbanken beschäftigen. Dort kannst du nicht nur dein Netzwerk erweitern, sondern auch wertvolle Kontakte knüpfen, die dir bei der Jobsuche helfen können. Viele Unternehmen schätzen Empfehlungen aus diesen Communities.

Zeige deine Skills in Open-Source-Projekten

Beteilige dich an Open-Source-Projekten, die mit Datenbanken arbeiten. So kannst du deine Fähigkeiten unter Beweis stellen und gleichzeitig einen beeindruckenden Portfoliobereich aufbauen, den du potenziellen Arbeitgebern präsentieren kannst.

Besuche Jobmessen und Recruiting-Events

Jobmessen sind eine großartige Gelegenheit, um direkt mit Unternehmen in Kontakt zu treten. Informiere dich über lokale Jobmessen, die sich auf Tech- und Datenbankrollen konzentrieren, und bereite uns vor, um unseren Lebenslauf und unser Interesse an der Rolle zu präsentieren.

Bewirb dich direkt bei Canva

Wir empfehlen dir, auch direkt über unsere Website bei Canva für die Stelle als Senior Research Scientist - Reinforcement Learning, MoEs zu bewerben. Zeig uns deine Leidenschaft für Datenbanken und warum du Teil unseres Teams werden möchtest. Jede Bewerbung zählt!

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Research Scientist - Reinforcement Learning, MoEs mit Bravour zu bestehen

Reinforcement Learning (RL)
Mixture of Expert Models (MoEs)
Post-Training
Python
PyTorch
Experimentelles Design
Belohnungsmodellierung

Einige Tipps für deine Bewerbung 🫡

Datenbank-Skills hervorheben:In deinem Lebenslauf solltest du unbedingt deine Erfahrungen mit verschiedenen Datenbankmanagementsystemen (DBMS) wie MySQL, PostgreSQL oder MongoDB betonen. Wenn du spezielle Projekte oder Aufgaben in deinem letzten Job hast, die deine Fähigkeiten im Umgang mit Datenbanken zeigen, nenn diese unbedingt!

Projekte und Zertifikate erwähnen:Falls du an relevanten Projekten oder Kursen in Bezug auf Datenbanken teilgenommen hast, pack sie in dein Portfolio oder erwähne sie in deinem Anschreiben. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Anwendungskonzepte beherrschst!

Motivation und Teamfähigkeit zeigen:Da du dich auf eine Vollzeitstelle bewirbst, ist es wichtig, dass du in deinem Anschreiben deutlich machst, warum du leidenschaftlich an der Arbeit mit Datenbanken interessiert bist und wie gut du im Team arbeiten kannst. Unternehmen suchen oft nach Mitarbeitern, die auch über die technischen Fähigkeiten hinaus ins Team passen.

Die richtige Struktur im Lebenslauf:Gestalte deinen Lebenslauf klar und strukturiert – in der Datenbankbranche kommt es nicht nur auf die Inhalte an, sondern auch auf die Art und Weise, wie du sie präsentierst. Nutze klare Überschriften und Absätze, um deine Fähigkeiten und Erfahrungen hervorzuheben. Und vergiss nicht, dein Lebenslauf sollte so aufbereitet sein, dass man sofort erkennt, dass du ein wahres Datenbanktalent bist!

Wie man sich auf ein Vorstellungsgespräch bei Canva vorbereitet

Sei bereit für technische Fragen zur Datenbankverwaltung

Egal, ob es um SQL-Abfragen, Datenmodellierung oder Performance-Optimierung geht, du solltest die Grundlagen perfekt beherrschen. Bereite dich darauf vor, praktische Probleme zu lösen und deine Lösungsansätze zu erklären – das zeigt, dass du nicht nur Theorie kennst, sondern auch praktisch umgehen kannst!

Portfolio nicht vergessen!

Wenn du bereits an Datenbankprojekten gearbeitet hast, bringe Beispiele mit, die deine Fähigkeiten zeigen. Zeige, wie du Probleme gelöst hast und wie deine Ansätze zur Effizienz der Datenbank beigetragen haben. Ein starkes Portfolio kann dich von anderen Kandidaten abheben!

Verstehe die spezifischen Tools der Branche

Je nach Canva könnte es sein, dass ihr spezifische Datenbankmanagementsysteme nutzt. Mach dich mit diesen vertraut und zeige dein Wissen über die neuesten Tools und Technologien. Das zeigt, dass du aufmerksam bist und dich bereits mit ihrer Arbeitsweise beschäftigt hast.

Motivation und Entwicklung in den Vordergrund stellen

Da es sich um eine Vollzeitstelle handelt, wollen sie wissen, dass du langfristig motiviert bist. Erkläre, warum dich die Arbeit in der Datenbankverwaltung begeistert und wie du deine Fähigkeiten weiterentwickeln möchtest, um einen Mehrwert für Canva zu schaffen.