Auf einen Blick
- Aufgaben: Entwickle KI-Systeme und arbeite an innovativen Projekten im Bereich Reinforcement Learning.
- Arbeitgeber: Canva, ein kreatives Unternehmen, das Design neu definiert.
- Mitarbeitervorteile: Aktienpakete, flexible Arbeitszeiten und umfassende Sozialleistungen.
- Andere Informationen: Dynamisches Team mit großartigen Wachstums- und Entwicklungsmöglichkeiten.
- Warum dieser Job: Gestalte die Zukunft des Designs mit bahnbrechender KI-Technologie.
- Gewünschte Qualifikationen: Erfahrung in Reinforcement Learning und agentischen Systemen erforderlich.
Das voraussichtliche Gehalt liegt zwischen 80000 - 110000 € pro Jahr.
Unternehmensbeschreibung
Schließen Sie sich dem Team an, das neu definiert, wie die Welt Design erlebt. Bei Canva ist es unsere Mission, die Welt zum Gestalten zu befähigen. Wir entwickeln KI, die magisch wirkt und echten Einfluss auf Millionen von Menschen hat - und jedem hilft, mit Vertrauen zu gestalten.
Jobbeschreibung
Wir suchen einen Senior Research Scientist, der sich leidenschaftlich mit Reinforcement Learning, agentischen Systemen und Mixture of Expert-Modellen beschäftigt, um die Grenzen des Denkens, der Werkzeugnutzung, der Latenz und der Zuverlässigkeit zu erweitern und dies den Nutzern zur Verfügung zu stellen.
Über das Team
Wir erkunden multimodale agentische Architekturen, bauen skalierbare Trainings- und Evaluationsschleifen und arbeiten eng mit Produkt- und Plattformteams zusammen, um Durchbrüche in erfreuliche Produktmerkmale umzuwandeln. Wir sind ein hochmodernes Post-Training-Team, das neue multimodale agentische Systeme entwickelt.
Über die Rolle
Sie werden Forschungsrichtungen vorantreiben und eine führende Rolle bei praktischen Arbeiten im gesamten Agentenstapel spielen - von der Belohnungsgestaltung und der Politikoptimierung bis hin zu Planung, Gedächtnis und Werkzeugkoordination, Datensatzkonstruktion bis hin zum Post-Training und der Entwicklung neuartiger Post-Training-Ansätze. Sie werden enge Experimente entwerfen, schnell iterieren und vertrauenswürdige Schlussfolgerungen ziehen.
Was Sie tun werden:
- Entwickeln von Agentensystemen (Planung, multimodale Werkzeugnutzung, Abruf, neuartige Trainingsansätze, Modellierungsablationen) für reale Aufgaben in Design, Vision und Sprache.
- Skalierung von Post-Training und RL über verteilte Systeme (PyTorch) mit effizienten Datenladeprogrammen, Tracing/Telemetrie, stabilem Training von Mixture-of-Experts (MoE)-Architekturen und reproduzierbaren Pipelines; Profilierung, Debugging und Optimierung.
- Beitragen zur Forschungsagenda für RL/agentische Systeme, die mit den Produktzielen von Canva übereinstimmt; Identifizierung von hochwirksamen Wetten und schnelles Beenden von Sackgassen.
- Entwicklung von Belohnungsmodellen und Lernschleifen: RLHF/RLAIF, Präferenzmodellierung, DPO/IPO-Stilziele, Offline/Online RL, Curriculum-Lernen und Kreditvergabe für mehrstufiges Denken.
- Entwicklung von Simulationen und Sandbox-Aufgaben, die Fehlermodi aufdecken (Planungsfehler, Werkzeugnutzungsanfälligkeit, Halluzination, unsichere Aktionen) und diese in messbare Ziele umwandeln.
- Hilfe bei der Ausrichtung auf rigorose Bewertungen für Agenten (Aufgabenerfolg, Zuverlässigkeit, Latenz, Sicherheit, Regressionen). Einrichtung von Offline-Suiten und Online-A/B-Tests; einfache, kontrollierte Experimente, die verallgemeinern.
- Zusammenarbeiten und Ausliefern: Schulter an Schulter mit Produkt, Design, Sicherheit und Plattform arbeiten, um Forschung als zuverlässige Funktionen zu implementieren - und dann iterieren.
- Teilen und Erhöhen: Mentoring von Teamkollegen, Präsentation von Ergebnissen intern und Rückgabe an die Gemeinschaft, wenn es dem Bereich und unseren Nutzern hilft.
Sie passen wahrscheinlich gut zu uns, wenn Sie:
- Tiefe Erfahrung in der Implementierung und im Post-Training von MoEs/LLMs/VLMs/Diffusionsmodellen haben, mit einer Erfolgsbilanz an veröffentlichten Forschungen oder Publikationen in MoEs, RL oder Agenten.
- Erfahrung in der Modifikation und Anpassung von Open-Source-Modellen haben.
- Starke Erfahrung im experimentellen Design: enge Baselines, saubere Ablationen, Reproduzierbarkeit und klare, datengestützte Schlussfolgerungen.
- Fließend in Python und PyTorch sind; Sie sind in großen ML-Codebasen vertraut und können Training und Inferenz profilieren, debuggen und optimieren.
- Praktische Erfahrung im Aufbau von Agentenschleifen (Planung, Werkzeugaufruf, Abruf, Gedächtnis) und der Bewertung der Qualität des mehrstufigen Denkens haben.
- Praktische Erfahrung mit Politikoptimierung, Belohnungsmodellierung und Präferenzlernen (z.B. RLHF/RLAIF, DPO/IPO, Actor-Critic/PPO, Offline RL) haben.
- Erfahrung mit großflächigem Training (verteiltes Training, Experimentverfolgung, Evaluierungswerkzeuge) und cloudbasierten multimodalen Werkzeugen haben.
- Erfahrung mit RL für MoE-Architekturen haben.
Zusätzliche Informationen
Was ist für Sie drin? Das Erreichen unserer verrückt großen Ziele motiviert uns, hart zu arbeiten - und das tun wir - aber Sie werden auch viele Momente der Magie, Verbundenheit und des Spaßes erleben, die das Leben bei Canva durchziehen. Wir bieten auch eine Reihe von Vorteilen, um Sie für jeden Erfolg im und außerhalb der Arbeit vorzubereiten.
Hier ist ein Vorgeschmack auf das Angebot:
- Aktienpakete - wir möchten, dass unser Erfolg auch Ihrer ist.
- Inklusive Elternzeitregelung, die alle Eltern und Betreuer unterstützt.
- Ein jährliches Vibe & Thrive-Zuschuss zur Unterstützung Ihres Wohlbefindens, sozialer Verbindung, Home-Office-Einrichtung und mehr.
- Flexible Urlaubsoptionen, die es Ihnen ermöglichen, eine Kraft für das Gute zu sein, Zeit zum Auftanken zu nehmen und Sie persönlich zu unterstützen.
Weitere Informationen finden Sie unter lifeatcanva.com.
Sonstige Informationen
Wir treffen Einstellungsentscheidungen basierend auf Ihren Erfahrungen, Fähigkeiten und Ihrer Leidenschaft sowie darauf, wie Sie Canva und unsere Kultur bereichern können. Wenn Sie sich bewerben, teilen Sie uns bitte die Pronomen mit, die Sie verwenden, und alle angemessenen Anpassungen, die Sie während des Interviewprozesses benötigen. Bitte beachten Sie, dass die Interviews überwiegend virtuell durchgeführt werden.
Senior Research Scientist - Reinforcement Learning, MoEs Arbeitgeber: Canva
Kontaktperson:
Canva HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Senior Research Scientist - Reinforcement Learning, MoEs
✨Tipp Nummer 1
Mach dir eine Liste von Fragen, die du während des Interviews stellen möchtest. Das zeigt dein Interesse und hilft dir, mehr über das Team und die Unternehmenskultur zu erfahren.
✨Tipp Nummer 2
Bereite dich darauf vor, deine bisherigen Projekte und Erfolge klar und prägnant zu präsentieren. Zeige, wie deine Erfahrungen direkt zur Rolle als Senior Research Scientist passen.
✨Tipp Nummer 3
Nutze Networking-Plattformen, um mit aktuellen Mitarbeitern von Canva in Kontakt zu treten. Sie können dir wertvolle Einblicke geben und vielleicht sogar einen guten Eindruck hinterlassen.
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! So stellst du sicher, dass deine Bewerbung die richtige Aufmerksamkeit erhält und du die neuesten Informationen über offene Stellen bekommst.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior Research Scientist - Reinforcement Learning, MoEs
Tipps für deine Bewerbung 🫡
Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für das haben, was sie tun, also lass das in deinen Worten durchscheinen!
Mach es konkret!: Verwende konkrete Beispiele aus deiner bisherigen Erfahrung, um deine Fähigkeiten zu untermauern. Zeig uns, wie du Herausforderungen gemeistert hast und welche Erfolge du erzielt hast – das macht einen großen Unterschied!
Pass auf die Details auf!: Achte darauf, dass deine Bewerbung gut strukturiert und fehlerfrei ist. Ein klarer, professioneller Auftritt zeigt uns, dass du dir Mühe gibst und die Position ernst nimmst.
Bewirb dich über unsere Website!: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass alles reibungslos läuft und wir deine Unterlagen schnellstmöglich bearbeiten können!
Wie du dich auf ein Vorstellungsgespräch bei Canva vorbereitest
✨Verstehe die Rolle und das Team
Mach dich mit der Stellenbeschreibung und den spezifischen Anforderungen des Senior Research Scientist vertraut. Informiere dich über die aktuellen Projekte des Teams und wie deine Erfahrungen in Reinforcement Learning und agentischen Systemen dazu passen können.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast. Sei bereit, diese zu diskutieren und zu erklären, wie du deine Fähigkeiten in der Praxis angewendet hast, insbesondere in Bezug auf MoEs und RL.
✨Fragen stellen
Bereite einige durchdachte Fragen vor, die zeigen, dass du dich für die Unternehmenskultur und die Ziele von Canva interessierst. Fragen zu den aktuellen Herausforderungen im Team oder zur zukünftigen Ausrichtung der AI-Entwicklung sind immer gut.
✨Technische Vorbereitung
Stelle sicher, dass du mit den Tools und Technologien, die in der Stellenbeschreibung erwähnt werden, vertraut bist. Übe das Programmieren in Python und PyTorch, um während des Interviews selbstbewusst über technische Themen sprechen zu können.