AI Research Engineer (Model Compression & Quantization)

AI Research Engineer (Model Compression & Quantization)

Bern Vollzeit 60000 - 80000 € / Jahr (geschätzt) Kein Homeoffice möglich
T

Auf einen Blick

  • Aufgaben: Entwickle innovative Komprimierungstechniken für multimodale KI-Systeme.
  • Unternehmen: Führendes Unternehmen im Bereich KI-Forschung mit Fokus auf Effizienz.
  • Vorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Team mit exzellenten Wachstumschancen in einem spannenden Forschungsumfeld.
  • Warum dieser Job: Gestalte die Zukunft der KI mit und arbeite an bahnbrechenden Projekten.
  • Qualifikationen: Abschluss in Informatik oder verwandtem Bereich, idealerweise mit Promotion.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Als Mitglied unseres KI-Forschungsteams werden Sie Innovationen in der Modellkompression und effizienten Bereitstellung für fortschrittliche multimodale KI-Systeme vorantreiben, einschließlich großer Sprachmodelle (LLMs) und Bild-Sprach-Modelle (VLMs). Ihre Arbeit wird sich darauf konzentrieren, den Modellfußabdruck und die Rechenkosten zu reduzieren, während die Genauigkeit erhalten bleibt, um leistungsstarke KI effizient auf ressourcenbeschränkten Edge-Geräten auszuführen.

Sie werden Kompressionstechniken wie Quantisierung, Wissensdistillation und Pruning anwenden und weiterentwickeln, um komplexe multimodale Architekturen zu optimieren, die Text, Bilder und Audio integrieren. Wir erwarten von Ihnen tiefgehende Expertise in Methoden zur Modellkompression und einen starken Hintergrund in multimodalen Modellarchitekturen. Sie werden einen praxisorientierten, forschungsgetriebenen Ansatz verfolgen, um neuartige Kompressionsstrategien zu entwickeln, zu testen und umzusetzen, die Modellgröße, Latenz, Durchsatz und Genauigkeit in Einklang bringen.

Ihre Aufgaben umfassen den Aufbau robuster Kompressionspipelines, die Festlegung von Leistungs- und Treue-Metriken sowie die Behebung von Engpässen in der Produktionsinferenz. Das ultimative Ziel ist es, skalierbare, speichereffiziente und latenzarme KI-Systeme auf Edge-Geräten (z. B. Smartphones) bereitzustellen, die hohe Treue und greifbaren realen Wert erhalten.

  • Wenden Sie Low-Bit-Quantisierung an, um die Modellgröße und die Inferenzlatenz für generative KI-Modelle (LLMs, VLMs, multimodal) zu reduzieren, während die Genauigkeit und die Ausgabequalität erhalten bleiben.
  • Nutzen Sie Wissensdistillation, um Fähigkeiten von größeren Lehrermodellen auf kleinere Schülermodelle zu übertragen, um effizientes multimodales Denken über Text-, Bild- und Audioeingaben zu ermöglichen.
  • Implementieren Sie Pruning-Techniken, um redundante Parameter und Aufmerksamkeitsköpfe zu entfernen, wodurch der Rechenaufwand reduziert wird, ohne die Aufgabenleistung zu beeinträchtigen.
  • Analysieren Sie die Trade-offs zwischen Modelleffizienz (Größe, Latenz, Speicher) und Genauigkeit über Quantisierungs-, Distillations- und Pruning-Methoden; schlagen Sie Verbesserungen basierend auf empirischen Ergebnissen vor.
  • Führen Sie Forschung und Anwendung von Mixed-Precision-Quantisierung und anderen fortschrittlichen Kompressionsstrategien durch (z. B. adaptive Pruning-Zeitpläne, Distillation mit Zwischenmerkmalsabgleich), um das Gleichgewicht zwischen Genauigkeit und Leistung zu optimieren.
  • Bleiben Sie über die neuesten Forschungen zur Modellkompression informiert, einschließlich neuer Techniken für multimodale und generative Architekturen.
  • Dokumentieren Sie Methoden, Experimente und Ergebnisse klar, um Reproduzierbarkeit, interne Zusammenarbeit und Kommunikation mit Stakeholdern zu unterstützen.
  • Verfassen Sie technische Arbeiten und veröffentlichen Sie Ergebnisse auf erstklassigen Konferenzen (z. B. NeurIPS, ICML, ICLR, CVPR, ACL, AAAI), um das Feld der Modellkompression für multimodale KI voranzutreiben.

Qualifikationen

  • Ein Abschluss in Informatik oder einem verwandten Bereich. Idealerweise ein Doktortitel in NLP, Maschinellem Lernen oder einem verwandten Bereich, ergänzt durch eine solide Erfolgsbilanz in der KI-Forschung und -Entwicklung mit Veröffentlichungen in A*-Konferenzen.
  • Erfahrung mit PyTorch Deep Learning-Frameworks oder gleichwertigen Frameworks.
  • Praktische Erfahrung mit Modellquantisierung, einschließlich Quantization-Aware Training (QAT) und Post-Training Quantization (PTQ).
  • Forschungs- und praktische Erfahrung mit Wissensdistillation zur Kompression großer Modelle in kleinere, effiziente Modelle.
  • Forschungs- und praktische Erfahrung mit Modellpruning zur Kompression großer Modelle in kleinere, effiziente Modelle.
  • Solides Verständnis von neuronalen Netzwerkarchitekturen und Trainingsprozessen – einschließlich Transformer (z. B. LLMs, VLMs), Rückpropagation, Optimierung und Feinabstimmungstechniken.
  • Kenntnisse in C++ sind von Vorteil (insbesondere für die Implementierung von Low-Level-Quantisierungskernen oder Inferenzoptimierungen).

AI Research Engineer (Model Compression & Quantization) Arbeitgeber: Tether Operations Limited

Als Arbeitgeber in der dynamischen Welt der KI-Forschung bieten wir Ihnen die Möglichkeit, an vorderster Front innovativer Technologien zu arbeiten. Unsere Unternehmenskultur fördert Kreativität und Zusammenarbeit, während wir gleichzeitig individuelle Wachstumschancen durch kontinuierliche Weiterbildung und Publikationsmöglichkeiten in führenden Konferenzen unterstützen. Mit einem Fokus auf effiziente Lösungen für multimodale KI-Systeme in einer inspirierenden Umgebung sind wir bestrebt, ein Arbeitsumfeld zu schaffen, das sowohl herausfordernd als auch erfüllend ist.

T

Kontaktdaten:

Tether Operations Limited Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so AI Research Engineer (Model Compression & Quantization) erhalten könnten

Wende dich an die richtigen Communities

Schau dir Online-Communities und Foren an, die sich um Data Science drehen, wie Kaggle oder GitHub. Engagiere dich dort aktiv, teile deine Projekte und lerne von anderen – das wird dir helfen, nicht nur einen Fuß in die Tür zu bekommen, sondern auch wertvolle Kontakte zu knüpfen.

Präsentiere deine Daten-Projekte

Baue ein Portfolio auf, das deine besten Projekte zeigt. Nutze Plattformen wie GitHub oder eine persönliche Webseite, um deine Arbeiten zu veröffentlichen. Arbeitgeber im Data Science-Bereich schauen oft direkt auf praktische Erfahrungen, also zeig, was du drauf hast!

Nimm an Meetups und Hackathons teil

Besuche lokale Data Science-Meetups oder nehme an Hackathons teil. Diese Veranstaltungen sind nicht nur super, um dein Wissen zu erweitern, sondern auch Gold wert für Networking. Du lernst Fachkollegen kennen und kannst auf Lockere Art und Weise Eventualjobs ergattern.

Direkte Bewerbungen über unsere Seite

Vergiss nicht, direkt auf unserer Website nach Stellenangeboten bei Tether Operations Limited zu schauen. Hier kannst du dich auf offene Datenwissenschaftsstellen bewerben und zeigst damit direktes Interesse, das viele Arbeitgeber schätzen!

Wir glauben, dass du diese Fähigkeiten brauchst, um AI Research Engineer (Model Compression & Quantization) mit Bravour zu bestehen

Modellkompression
Quantisierung
Wissenstransfer
Pruning-Techniken
Multimodale Modellarchitekturen
Neurale Netzwerkarchitekturen
PyTorch

Einige Tipps für deine Bewerbung 🫡

Lass deine Daten sprechen!:In einem Bereich wie Data Science ist es entscheidend, dass du deine praktischen Fähigkeiten präsentierst. Wenn du an Projekten gearbeitet hast, die deine Analysefähigkeiten oder dein Wissen über Machine Learning demonstrieren, teile sie in deinem Lebenslauf oder füge einen Link zu deinem GitHub-Portfolio bei. Die Daten, die du analysiert hast, und die Tools, die du verwendest, sollten klar hervorgehoben werden.

Ergebnisse quantifizieren!:Unterstütze deine Erfahrung mit quantifizierbaren Ergebnissen. Zeige, wie du durch deine Analysen oder Modelle zur Entscheidungsfindung beigetragen hast oder wie deine Berechnungen den Rohdaten neue Erkenntnisse entlockt haben. Arbeitgeber in der Data Science sind oft an konkreten Verbesserungen und Effizienzsteigerungen interessiert!

Erläutere deine Lernbereitschaft!:Da es sich um eine Vollzeitstelle handelt, zeige in deinem Anschreiben, dass du bereit bist, zu lernen und dich weiterzuentwickeln. Sprich über deine Neugier für neue Technologien oder Methoden im Data Science Bereich. Vielleicht hast du auch Kurse besucht oder Zertifikate erworben, die deine Begeisterung zeigen!

Die richtige technische Sprache!:Achte darauf, dass deine Bewerbung alle relevanten technischen Begriffe enthält, die in der Data Science gebräuchlich sind. Nenne spezifische Programmier- und Analysetools wie Python, R oder SQL, die du beherrschst. Dies macht es für die Rekrutierer einfacher, schnell zu erkennen, dass du für die Rolle als AI Research Engineer (Model Compression & Quantization) bei Tether Operations Limited gut geeignet bist.

Wie man sich auf ein Vorstellungsgespräch bei Tether Operations Limited vorbereitet

Bereite deine technischen Skills vor

In einem Vorstellungsgespräch für eine Data-Science-Position wird oft dein Wissen über Tools wie Python, R oder SQL getestet. Mach dich mit gängigen Algorithmen und deren Einsatzmöglichkeiten vertraut, denn technische Fragen können schnell kommen. Lass uns sicherstellen, dass du in diesen Bereichen glänzt!

Verschaffe dir einen Überblick über Projekte

Da es sich um eine Vollzeitstelle handelt, ist es wichtig, dass du konkrete Erfahrungen und Projekte vorweisen kannst. Wenn du bereits an Data-Science-Projekten gearbeitet hast, sei bereit, diese in der Tiefe zu erläutern und zu diskutieren, wie du die Probleme gelöst hast. Dein Portfolio kann hier einen echten Unterschied machen!

Vorbereitung auf case studies

In Data-Science-Interviews sind case studies und praktische Probleme häufig Teil des Gesprächs. Übe, wie du strukturiert und logisch an solche Aufgaben herangehst. Arbeitgeber möchten sehen, wie du Daten analysierst und Lösungen entwickelst – bring also deine analytischen Fähigkeiten mit!

Zeige deine Leidenschaft für Daten

Mehr denn je geht es bei einer Vollzeitstelle darum, dass du nicht nur die Skills hast, sondern auch wirklich für das Feld brennst. Teile Anekdoten oder Erfahrungen, die zeigen, wie du zur Datenwissenschaft gekommen bist und was dich fasziniert. Diese Begeisterung kann für Tether Operations Limited entscheidend sein!