Senior AI Research Engineer Model Inference Remote

Senior AI Research Engineer Model Inference Remote

Zürich Vollzeit 60000 - 80000 € / Jahr (geschätzt) Homeoffice möglich
F

Auf einen Blick

  • Aufgaben: Optimiere KI-Modelle und entwickle innovative Inferenzlösungen für mobile Geräte.
  • Unternehmen: Führendes Unternehmen im Bereich KI mit Fokus auf neueste Technologien.
  • Vorteile: Flexibles Arbeiten, wettbewerbsfähiges Gehalt und Weiterbildungsmöglichkeiten.
  • Weitere Informationen: Dynamisches Team mit großartigen Entwicklungschancen.
  • Warum dieser Job: Gestalte die Zukunft der KI und arbeite an spannenden Projekten mit echtem Einfluss.
  • Qualifikationen: Erfahrung in C++ und GPU-Programmierung sowie Kenntnisse in Vulkan.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wir suchen einen erfahrenen AI Model Engineer mit tiefgreifender Expertise in der Kernel-Entwicklung, Modelloptimierung, Feinabstimmung und GPU-Beschleunigung. Der Ingenieur wird das Inferenz-Framework erweitern, um Inferenz und Feinabstimmung für Sprachmodelle zu unterstützen, mit einem starken Fokus auf mobile und integrierte GPU-Beschleunigung unter Verwendung von Vulkan.

Verantwortlichkeiten

  • Implementierung und Optimierung benutzerdefinierter Inferenz- und Feinabstimmungskernels für kleine und große Sprachmodelle über mehrere Hardware-Backends.
  • Implementierung und Optimierung von vollständiger und LoRA Feinabstimmung für kleine und große Sprachmodelle über mehrere Hardware-Backends.
  • Entwurf und Erweiterung der Unterstützung für Datentypen und Präzision (int, float, gemischte Präzision, ternäre QTypes usw.).
  • Entwurf, Anpassung und Optimierung von Vulkan-Compute-Shadern für quantisierte Operatoren und Feinabstimmungs-Workflows.
  • Untersuchung und Behebung von GPU-Beschleunigungsproblemen auf Vulkan und integrierten/mobilen GPUs.
  • Architektur und Vorbereitung der Unterstützung für fortschrittliche Quantisierungstechniken zur Verbesserung der Effizienz und Speichernutzung.
  • Debugging und Optimierung von GPU-Operatoren (int8, fp16, fp4, ternär).
  • Integration und Validierung von Quantisierungs-Workflows für Training und Inferenz.
  • Durchführung von Evaluierungen und Benchmarking (z. B. Perplexitätstests, Leistung feinabgestimmter Adapter).
  • Durchführung von GPU-Tests auf Desktop- und Mobilgeräten.
  • Zusammenarbeit mit Forschungs- und Engineering-Teams zur Prototypenerstellung, Benchmarking und Skalierung neuer Methoden zur Modelloptimierung.
  • Bereitstellung einer produktionsreifen, effizienten Bereitstellung von Sprachmodellen für mobile und Edge-Anwendungsfälle.
  • Enge Zusammenarbeit mit funktionsübergreifenden Teams zur Integration optimierter Bereitstellungs- und Inferenz-Frameworks in Produktionspipelines, die für Edge- und On-Device-Anwendungen konzipiert sind, wobei klare Erfolgsmetriken wie verbesserte reale Leistung, niedrige Fehlerquoten, robuste Skalierbarkeit, optimale Speichernutzung definiert werden und kontinuierliches Monitoring sowie iterative Verfeinerungen für nachhaltige Verbesserungen sichergestellt werden.

Qualifikationen

  • Beherrschung von C++ und GPU-Kernel-Programmierung.
  • Nachgewiesene Expertise in der GPU-Beschleunigung mit dem Vulkan-Framework.
  • Starker Hintergrund in der Quantisierung und der Optimierung von Modellen mit gemischter Präzision.
  • Erfahrung und Expertise in der Entwicklung und Anpassung von Vulkan-Compute-Shadern.
  • Vertrautheit mit LoRA Feinabstimmung und parameter-effizienten Trainingsmethoden.
  • Fähigkeit, GPU-spezifische Leistungs- und Stabilitätsprobleme auf Desktop- und Mobilgeräten zu debuggen.
  • Praktische Erfahrung mit mobiler GPU-Beschleunigung und Modellinferenz.
  • Vertrautheit mit großen Sprachmodellarchitekturen (z. B. Qwen, Gemma, LLaMA, Falcon usw.).
  • Erfahrung in der Implementierung benutzerdefinierter Rückwärtsoperatoren für die Feinabstimmung.
  • Erfahrung in der Erstellung und Pflege benutzerdefinierter Datensätze.
  • Nachgewiesene Fähigkeit, empirische Forschung anzuwenden, um Herausforderungen in der Modellentwicklung zu überwinden.

Senior AI Research Engineer Model Inference Remote Arbeitgeber: Framework Ventures

Unser Unternehmen bietet eine dynamische und innovative Arbeitsumgebung, die sich auf die Entwicklung fortschrittlicher KI-Technologien konzentriert. Als Senior AI Research Engineer profitieren Sie von flexiblen Arbeitszeiten, einer starken Teamkultur und umfangreichen Möglichkeiten zur beruflichen Weiterentwicklung. Darüber hinaus fördern wir eine kreative Atmosphäre, in der Ihre Ideen geschätzt werden und Sie an spannenden Projekten im Bereich der GPU-Beschleunigung und Modelloptimierung arbeiten können.

F

Kontaktdaten:

Framework Ventures Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior AI Research Engineer Model Inference Remote erhalten könnten

Wende dich an die richtigen Communities

Schau dir Online-Communities und Foren an, die sich um Data Science drehen, wie Kaggle oder GitHub. Engagiere dich dort aktiv, teile deine Projekte und lerne von anderen – das wird dir helfen, nicht nur einen Fuß in die Tür zu bekommen, sondern auch wertvolle Kontakte zu knüpfen.

Präsentiere deine Daten-Projekte

Baue ein Portfolio auf, das deine besten Projekte zeigt. Nutze Plattformen wie GitHub oder eine persönliche Webseite, um deine Arbeiten zu veröffentlichen. Arbeitgeber im Data Science-Bereich schauen oft direkt auf praktische Erfahrungen, also zeig, was du drauf hast!

Nimm an Meetups und Hackathons teil

Besuche lokale Data Science-Meetups oder nehme an Hackathons teil. Diese Veranstaltungen sind nicht nur super, um dein Wissen zu erweitern, sondern auch Gold wert für Networking. Du lernst Fachkollegen kennen und kannst auf Lockere Art und Weise Eventualjobs ergattern.

Direkte Bewerbungen über unsere Seite

Vergiss nicht, direkt auf unserer Website nach Stellenangeboten bei Framework Ventures zu schauen. Hier kannst du dich auf offene Datenwissenschaftsstellen bewerben und zeigst damit direktes Interesse, das viele Arbeitgeber schätzen!

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior AI Research Engineer Model Inference Remote mit Bravour zu bestehen

C++
GPU Kernel Programming
Vulkan Framework
GPU Acceleration
Quantization
Mixed-Precision Model Optimization
Vulkan Compute Shader Development

Einige Tipps für deine Bewerbung 🫡

Lass deine Daten sprechen!:In einem Bereich wie Data Science ist es entscheidend, dass du deine praktischen Fähigkeiten präsentierst. Wenn du an Projekten gearbeitet hast, die deine Analysefähigkeiten oder dein Wissen über Machine Learning demonstrieren, teile sie in deinem Lebenslauf oder füge einen Link zu deinem GitHub-Portfolio bei. Die Daten, die du analysiert hast, und die Tools, die du verwendest, sollten klar hervorgehoben werden.

Ergebnisse quantifizieren!:Unterstütze deine Erfahrung mit quantifizierbaren Ergebnissen. Zeige, wie du durch deine Analysen oder Modelle zur Entscheidungsfindung beigetragen hast oder wie deine Berechnungen den Rohdaten neue Erkenntnisse entlockt haben. Arbeitgeber in der Data Science sind oft an konkreten Verbesserungen und Effizienzsteigerungen interessiert!

Erläutere deine Lernbereitschaft!:Da es sich um eine Vollzeitstelle handelt, zeige in deinem Anschreiben, dass du bereit bist, zu lernen und dich weiterzuentwickeln. Sprich über deine Neugier für neue Technologien oder Methoden im Data Science Bereich. Vielleicht hast du auch Kurse besucht oder Zertifikate erworben, die deine Begeisterung zeigen!

Die richtige technische Sprache!:Achte darauf, dass deine Bewerbung alle relevanten technischen Begriffe enthält, die in der Data Science gebräuchlich sind. Nenne spezifische Programmier- und Analysetools wie Python, R oder SQL, die du beherrschst. Dies macht es für die Rekrutierer einfacher, schnell zu erkennen, dass du für die Rolle als Senior AI Research Engineer Model Inference Remote bei Framework Ventures gut geeignet bist.

Wie man sich auf ein Vorstellungsgespräch bei Framework Ventures vorbereitet

Bereite deine technischen Skills vor

In einem Vorstellungsgespräch für eine Data-Science-Position wird oft dein Wissen über Tools wie Python, R oder SQL getestet. Mach dich mit gängigen Algorithmen und deren Einsatzmöglichkeiten vertraut, denn technische Fragen können schnell kommen. Lass uns sicherstellen, dass du in diesen Bereichen glänzt!

Verschaffe dir einen Überblick über Projekte

Da es sich um eine Vollzeitstelle handelt, ist es wichtig, dass du konkrete Erfahrungen und Projekte vorweisen kannst. Wenn du bereits an Data-Science-Projekten gearbeitet hast, sei bereit, diese in der Tiefe zu erläutern und zu diskutieren, wie du die Probleme gelöst hast. Dein Portfolio kann hier einen echten Unterschied machen!

Vorbereitung auf case studies

In Data-Science-Interviews sind case studies und praktische Probleme häufig Teil des Gesprächs. Übe, wie du strukturiert und logisch an solche Aufgaben herangehst. Arbeitgeber möchten sehen, wie du Daten analysierst und Lösungen entwickelst – bring also deine analytischen Fähigkeiten mit!

Zeige deine Leidenschaft für Daten

Mehr denn je geht es bei einer Vollzeitstelle darum, dass du nicht nur die Skills hast, sondern auch wirklich für das Feld brennst. Teile Anekdoten oder Erfahrungen, die zeigen, wie du zur Datenwissenschaft gekommen bist und was dich fasziniert. Diese Begeisterung kann für Framework Ventures entscheidend sein!