AI Research Engineer (Model Compression & Quantization)

AI Research Engineer (Model Compression & Quantization)

Rüti Vollzeit 60000 - 80000 € / Jahr (geschätzt) Homeoffice (teilweise)
T

Auf einen Blick

  • Aufgaben: Entwickle innovative Kompressionstechniken für multimodale KI-Systeme.
  • Unternehmen: Führendes Unternehmen im Bereich KI-Forschung mit Fokus auf Effizienz.
  • Vorteile: Attraktives Gehalt, flexible Arbeitszeiten und Möglichkeiten zur beruflichen Weiterentwicklung.
  • Weitere Informationen: Dynamisches Team mit exzellenten Wachstumschancen.
  • Warum dieser Job: Gestalte die Zukunft der KI mit und arbeite an bahnbrechenden Projekten.
  • Qualifikationen: Abschluss in Informatik oder verwandtem Bereich, Erfahrung in KI-Forschung.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Als Mitglied unseres KI-Forschungsteams werden Sie Innovationen in der Modellkompression und effizienten Bereitstellung für fortschrittliche multimodale KI-Systeme vorantreiben, einschließlich großer Sprachmodelle (LLMs) und Bild-Sprach-Modelle (VLMs). Ihre Arbeit wird sich darauf konzentrieren, den Modellfußabdruck und die Rechenkosten zu reduzieren, während die Genauigkeit erhalten bleibt, um leistungsstarke KI effizient auf ressourcenbeschränkten Edge-Geräten auszuführen.

Sie werden Kompressionstechniken wie Quantisierung, Wissensdistillation und Pruning anwenden und weiterentwickeln, um komplexe multimodale Architekturen zu optimieren, die Text, Bilder und Audio integrieren. Wir erwarten von Ihnen tiefgehende Expertise in Methoden zur Modellkompression und einen starken Hintergrund in multimodalen Modellarchitekturen. Sie werden einen praxisorientierten, forschungsgetriebenen Ansatz verfolgen, um neuartige Kompressionsstrategien zu entwickeln, zu testen und umzusetzen, die Modellgröße, Latenz, Durchsatz und Genauigkeit in Einklang bringen.

Ihre Aufgaben umfassen:

  • Anwendung von Low-Bit-Quantisierung zur Reduzierung der Modellgröße und Inferenzlatenz für generative KI-Modelle (LLMs, VLMs, multimodal), während die Genauigkeit und Ausgabequalität erhalten bleibt.
  • Nutzung von Wissensdistillation, um Fähigkeiten von größeren Lehrermodellen auf kleinere Schülermodelle zu übertragen und so effizientes multimodales Denken über Text-, Bild- und Audioeingaben zu ermöglichen.
  • Implementierung von Pruning-Techniken zur Entfernung redundanter Parameter und Aufmerksamkeitsköpfe, um den Rechenaufwand zu reduzieren, ohne die Aufgabenleistung zu beeinträchtigen.
  • Analyse von Trade-offs zwischen Modelleffizienz (Größe, Latenz, Speicher) und Genauigkeit über Quantisierungs-, Distillations- und Pruning-Methoden; Vorschlag von Verbesserungen basierend auf empirischen Ergebnissen.
  • Forschung und Anwendung von Mixed-Precision-Quantisierung und anderen fortschrittlichen Kompressionsstrategien (z.B. adaptive Pruning-Zeitpläne, Distillation mit Zwischenmerkmalsabgleich), um das Gleichgewicht zwischen Genauigkeit und Leistung zu optimieren.
  • Aktuell bleiben mit den neuesten Forschungen zur Modellkompression, einschließlich neuer Techniken für multimodale und generative Architekturen.
  • Dokumentation von Methoden, Experimenten und Ergebnissen zur Unterstützung der Reproduzierbarkeit, internen Zusammenarbeit und Kommunikation mit Stakeholdern.
  • Verfassen technischer Arbeiten und Veröffentlichung von Ergebnissen in erstklassigen Konferenzen (z.B. NeurIPS, ICML, ICLR, CVPR, ACL, AAAI), um das Feld der Modellkompression für multimodale KI voranzutreiben.

Qualifikationen:

  • Ein Abschluss in Informatik oder einem verwandten Bereich. Idealerweise ein Doktortitel in NLP, Maschinellem Lernen oder einem verwandten Bereich, ergänzt durch eine solide Erfolgsbilanz in der KI-Forschung und -Entwicklung (mit guten Veröffentlichungen in A*-Konferenzen).
  • Erfahrung mit PyTorch Deep Learning-Frameworks oder gleichwertigen Frameworks.
  • Praktische Erfahrung mit Modellquantisierung, einschließlich Quantization-Aware Training (QAT) und Post-Training Quantization (PTQ).
  • Forschung und praktische Erfahrung mit Wissensdistillation zur Kompression großer Modelle in kleinere, effiziente Modelle.
  • Forschung und praktische Erfahrung mit Modellpruning zur Kompression großer Modelle in kleinere, effiziente Modelle.
  • Solides Verständnis von neuronalen Netzwerkarchitekturen und Trainingsprozessen – einschließlich Transformer (z.B. LLMs, VLMs), Rückpropagation, Optimierung und Feinabstimmungstechniken.
  • Kenntnisse in C++ sind von Vorteil (insbesondere für die Implementierung von Low-Level-Quantisierungskernen oder Inferenzoptimierungen).

AI Research Engineer (Model Compression & Quantization) Arbeitgeber: Tether

Als Arbeitgeber in der dynamischen Welt der KI-Forschung bieten wir Ihnen die Möglichkeit, an vorderster Front innovativer Technologien zu arbeiten. Unsere Unternehmenskultur fördert Kreativität und Zusammenarbeit, während wir gleichzeitig individuelle Wachstumschancen durch kontinuierliche Weiterbildung und Publikationsmöglichkeiten in führenden Konferenzen unterstützen. Mit einem Fokus auf effiziente Lösungen für multimodale KI-Systeme in einer inspirierenden Umgebung sind wir bestrebt, ein Arbeitsumfeld zu schaffen, das sowohl herausfordernd als auch erfüllend ist.

T

Kontaktdaten:

Tether Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so AI Research Engineer (Model Compression & Quantization) erhalten könnten

Sei aktiv in lokalen Datenbank-Communities

Schau dir lokale Meetup-Gruppen oder Online-Communities an, die sich mit Datenbanken beschäftigen. Dort kannst du nicht nur dein Netzwerk erweitern, sondern auch wertvolle Kontakte knüpfen, die dir bei der Jobsuche helfen können. Viele Unternehmen schätzen Empfehlungen aus diesen Communities.

Zeige deine Skills in Open-Source-Projekten

Beteilige dich an Open-Source-Projekten, die mit Datenbanken arbeiten. So kannst du deine Fähigkeiten unter Beweis stellen und gleichzeitig einen beeindruckenden Portfoliobereich aufbauen, den du potenziellen Arbeitgebern präsentieren kannst.

Besuche Jobmessen und Recruiting-Events

Jobmessen sind eine großartige Gelegenheit, um direkt mit Unternehmen in Kontakt zu treten. Informiere dich über lokale Jobmessen, die sich auf Tech- und Datenbankrollen konzentrieren, und bereite uns vor, um unseren Lebenslauf und unser Interesse an der Rolle zu präsentieren.

Bewirb dich direkt bei Tether

Wir empfehlen dir, auch direkt über unsere Website bei Tether für die Stelle als AI Research Engineer (Model Compression & Quantization) zu bewerben. Zeig uns deine Leidenschaft für Datenbanken und warum du Teil unseres Teams werden möchtest. Jede Bewerbung zählt!

Wir glauben, dass du diese Fähigkeiten brauchst, um AI Research Engineer (Model Compression & Quantization) mit Bravour zu bestehen

Modellkompression
Quantisierung
Wissenstransfer
Pruning-Techniken
Multimodale Modelle
Neurale Netzwerkarchitekturen
PyTorch

Einige Tipps für deine Bewerbung 🫡

Datenbank-Skills hervorheben:In deinem Lebenslauf solltest du unbedingt deine Erfahrungen mit verschiedenen Datenbankmanagementsystemen (DBMS) wie MySQL, PostgreSQL oder MongoDB betonen. Wenn du spezielle Projekte oder Aufgaben in deinem letzten Job hast, die deine Fähigkeiten im Umgang mit Datenbanken zeigen, nenn diese unbedingt!

Projekte und Zertifikate erwähnen:Falls du an relevanten Projekten oder Kursen in Bezug auf Datenbanken teilgenommen hast, pack sie in dein Portfolio oder erwähne sie in deinem Anschreiben. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Anwendungskonzepte beherrschst!

Motivation und Teamfähigkeit zeigen:Da du dich auf eine Vollzeitstelle bewirbst, ist es wichtig, dass du in deinem Anschreiben deutlich machst, warum du leidenschaftlich an der Arbeit mit Datenbanken interessiert bist und wie gut du im Team arbeiten kannst. Unternehmen suchen oft nach Mitarbeitern, die auch über die technischen Fähigkeiten hinaus ins Team passen.

Die richtige Struktur im Lebenslauf:Gestalte deinen Lebenslauf klar und strukturiert – in der Datenbankbranche kommt es nicht nur auf die Inhalte an, sondern auch auf die Art und Weise, wie du sie präsentierst. Nutze klare Überschriften und Absätze, um deine Fähigkeiten und Erfahrungen hervorzuheben. Und vergiss nicht, dein Lebenslauf sollte so aufbereitet sein, dass man sofort erkennt, dass du ein wahres Datenbanktalent bist!

Wie man sich auf ein Vorstellungsgespräch bei Tether vorbereitet

Sei bereit für technische Fragen zur Datenbankverwaltung

Egal, ob es um SQL-Abfragen, Datenmodellierung oder Performance-Optimierung geht, du solltest die Grundlagen perfekt beherrschen. Bereite dich darauf vor, praktische Probleme zu lösen und deine Lösungsansätze zu erklären – das zeigt, dass du nicht nur Theorie kennst, sondern auch praktisch umgehen kannst!

Portfolio nicht vergessen!

Wenn du bereits an Datenbankprojekten gearbeitet hast, bringe Beispiele mit, die deine Fähigkeiten zeigen. Zeige, wie du Probleme gelöst hast und wie deine Ansätze zur Effizienz der Datenbank beigetragen haben. Ein starkes Portfolio kann dich von anderen Kandidaten abheben!

Verstehe die spezifischen Tools der Branche

Je nach Tether könnte es sein, dass ihr spezifische Datenbankmanagementsysteme nutzt. Mach dich mit diesen vertraut und zeige dein Wissen über die neuesten Tools und Technologien. Das zeigt, dass du aufmerksam bist und dich bereits mit ihrer Arbeitsweise beschäftigt hast.

Motivation und Entwicklung in den Vordergrund stellen

Da es sich um eine Vollzeitstelle handelt, wollen sie wissen, dass du langfristig motiviert bist. Erkläre, warum dich die Arbeit in der Datenbankverwaltung begeistert und wie du deine Fähigkeiten weiterentwickeln möchtest, um einen Mehrwert für Tether zu schaffen.