Auf einen Blick
- Aufgaben: Entwickle vision-language Modelle für Videoverständnis und baue Produktionspipelines.
- Arbeitgeber: Innovatives Unternehmen an der Spitze der KI-Entwicklung.
- Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, Aktienoptionen und flexible Arbeitszeiten.
- Andere Informationen: Flache Hierarchien und ein unterstützendes, diverses Team.
- Warum dieser Job: Sei Teil eines Teams, das die Zukunft der KI in der Fertigung gestaltet.
- Gewünschte Qualifikationen: PhD oder gleichwertige Erfahrung in Computer Vision oder maschinellem Lernen.
Das voraussichtliche Gehalt liegt zwischen 48000 - 84000 € pro Jahr.
Wir suchen einen Research Engineer, der die Grenzen von Vision-Language-Modellen für das Verständnis von Videos in der realen Welt erweitert. Sie werden an angewandten, hochmodernen multimodalen Modellen arbeiten und diese in Produktionspipelines umwandeln, die von Kunden genutzt werden.
Ihre Rolle:
- Entwerfen und Anpassen von Vision-Language- und Videomodellen für Szenenverständnis, zeitliches Denken und Aktivitäts-/Handlungskennung
- Aufbauen und Pflegen von großangelegten Trainings- und Evaluierungspipelines auf GPU-Clustern
- Kuratieren und Erweitern von Video-Text- und Aktionsdatensätzen, einschließlich synthetischer Labels und abrufbasierter Erweiterung
- Entwickeln robuster Benchmarks für Video-QA, Befolgen von Anweisungen und zeitliches Verständnis und diese zur Förderung iterativer Modellverbesserungen nutzen
- Modellarchitekturen für Effizienz und Bereitstellung optimieren (Kompression, Pruning, Destillation)
- Bereitstellen produktionsbereiter Inferenzpipelines für Produkt- und Kunden-Teams, enge Zusammenarbeit mit CV-, Plattform- und Robotik-Ingenieuren
Sie bringen mit:
- Abgeschlossenes PhD (oder gleichwertige Forschungserfahrung) in Computer Vision, maschinellem Lernen, Robotik oder einem verwandten Bereich
- Starker Hintergrund im videozentrierten Deep Learning: Szenenverständnis, zeitliche/aktivitäts-/handlungsbezogene Erkennung oder Videoerzeugung
- Erfahrung im Training und Anpassen großer Vision- oder VLM-Modelle (z.B. InternVL, Qwen-VL, DeepSeek-VL, ähnliche Stacks)
- Nachgewiesene Arbeit mit Multi-GPU-Training (PyTorch, verteilt, gemischte Präzision) und großangelegten Datensätzen
- Solide Ingenieurgewohnheiten: sauberer Python-Code, reproduzierbare Experimente, zuverlässige Daten- und Trainingspipelines
- Erfahrung darin, Forschung in nutzbare Systeme (Demos, interne Tools oder produktisierte Funktionen) in schnelllebigen Teams zu überführen
Nice to have:
- Veröffentlichungen in erstklassigen Fachzeitschriften (CVPR, ICCV, ECCV, NeurIPS, ICLR usw.) zu Video, multimodalem Lernen oder Szenenverständnis
- Erfahrung mit 3D/4D-Szenenrepräsentationen, Aktionsgenerierung oder Projekten im Stil von embodied/sense-plan-act
- Optimierung der Inferenz: Quantisierung, TensorRT, Modell-Destillation oder Bereitstellung auf eingeschränkter Hardware
- Vorherige Erfahrung in einem Startup oder einer angewandten Forschungsumgebung
Was wir bieten:
- Ein wettbewerbsfähiges Gehalt & Aktienoptionen*
- Seien Sie an vorderster Front dabei, wenn es darum geht, was künstliche Intelligenz in der Fertigung bedeutet
- Praktische Erfahrung in einem AI-first Softwareunternehmen sammeln
- Unterstützende und inklusive Kultur, die Vielfalt schätzt und den Fortschritt unterrepräsentierter Gruppen im Unternehmen fördert
- Zusammenarbeit mit einem vielfältigen (derzeit mehr als 10 Nationalitäten) und talentierten Team, das an bahnbrechenden Projekten mit realen Auswirkungen arbeitet
- Vernetzen mit Fachleuten und Führungskräften auf dem Gebiet, was Türen zu potenziellen zukünftigen Karrieremöglichkeiten öffnet
- Wir haben eine sehr flache Hierarchie, offenes 360°-Feedback und flexible Arbeitszeiten
- Ethik⚖: Wir setzen uns für die Entwicklung ethischer KI-Software ein
Erfüllen Sie nicht alle Anforderungen? Deltia setzt sich dafür ein, einen Arbeitsplatz zu schaffen, der vielfältig, fair und inklusiv ist. Wir ermutigen Kandidaten aus allen Hintergründen, auch wenn sie nicht jede Qualifikation erfüllen, sich zu bewerben. Wir sind fest davon überzeugt, dass ein Team mit unterschiedlichen Perspektiven unser Unternehmen nur stärkt und Innovation vorantreibt. Unser Engagement erstreckt sich auch auf die Schaffung einer zugänglichen Umgebung für alle, einschließlich Menschen mit Behinderungen. Bitte lassen Sie uns wissen, ob Sie während des Bewerbungsprozesses oder während der Zusammenarbeit mit uns Unterstützung benötigen, und wir werden unser Bestes tun, um Sie zu unterstützen.
*Nur Vollzeitstellen mit unbefristetem Vertrag sind für Aktienoptionen berechtigt. Teilzeitstellen, Vertragsstellen, Werkstudenten, Praktika und freiberufliche Stellen sind nicht für Aktienoptionen berechtigt.
VLM Research Engineer (m/f/d) Arbeitgeber: Deltia
Kontaktperson:
Deltia HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: VLM Research Engineer (m/f/d)
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe mit Coding-Challenges und sei bereit, deine Projekte und Erfahrungen zu präsentieren. Wir können dir helfen, die besten Ressourcen zu finden!
✨Tipp Nummer 3
Sei proaktiv und zeige Interesse! Kontaktiere Recruiter direkt über unsere Website und stelle Fragen zu den Projekten, an denen du arbeiten möchtest. Das zeigt dein Engagement!
✨Tipp Nummer 4
Mach dich mit den neuesten Trends in der KI vertraut! Lies aktuelle Forschungspapiere und Blogs, um im Gespräch mit den Interviewern glänzen zu können. Wir haben einige tolle Ressourcen für dich!
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: VLM Research Engineer (m/f/d)
Tipps für deine Bewerbung 🫡
Mach deine Bewerbung persönlich: Zeig uns, wer du bist! Verwende eine freundliche und authentische Sprache in deinem Anschreiben. Erzähl uns, warum du dich für die Stelle als Research Engineer interessierst und was dich an der Arbeit mit vision-language Modellen begeistert.
Betone deine Erfahrungen: Hebe deine relevanten Erfahrungen hervor, besonders im Bereich Video-Deep Learning und multimodale Modelle. Zeig uns konkrete Beispiele, wie du in der Vergangenheit ähnliche Herausforderungen gemeistert hast und welche Ergebnisse du erzielt hast.
Sei strukturiert und klar: Achte darauf, dass deine Bewerbung gut strukturiert ist. Verwende klare Absätze und Überschriften, um deine Qualifikationen und Erfahrungen übersichtlich darzustellen. Das macht es uns leichter, deine Stärken auf einen Blick zu erkennen.
Bewirb dich über unsere Website: Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass wir alle Informationen erhalten und du die besten Chancen hast, Teil unseres Teams zu werden. Wir freuen uns auf deine Bewerbung!
Wie du dich auf ein Vorstellungsgespräch bei Deltia vorbereitest
✨Verstehe die Technologien
Mach dich mit den neuesten Entwicklungen im Bereich der Vision-Language-Modelle vertraut. Lies aktuelle Forschungsarbeiten und Blogs, um ein tiefes Verständnis für die Technologien zu entwickeln, die du in deiner Rolle als Research Engineer anwenden wirst.
✨Bereite konkrete Beispiele vor
Überlege dir spezifische Projekte oder Erfahrungen, die deine Fähigkeiten in der Arbeit mit Video-Daten und multimodalen Modellen demonstrieren. Sei bereit, diese Beispiele während des Interviews zu erläutern und zu zeigen, wie du Herausforderungen gemeistert hast.
✨Fragen stellen
Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Unternehmenskultur und die Teamdynamik zu erfahren.
✨Technische Fähigkeiten demonstrieren
Sei bereit, deine technischen Fähigkeiten unter Beweis zu stellen. Möglicherweise wirst du gebeten, eine praktische Aufgabe zu lösen oder deine Ansätze zur Optimierung von Modellen zu diskutieren. Übe vorher, um sicher und kompetent aufzutreten.