Head of AI Engineering (f/m/x)

Head of AI Engineering (f/m/x)

München Vollzeit 90000 - 120000 € / Jahr (geschätzt) Homeoffice (teilweise)
N

Auf einen Blick

  • Aufgaben: Leite und entwickle unser KI-Engineering-Team für innovative Finanzlösungen.
  • Unternehmen: Wachsendes AI-First Fintech-Scale-Up mit Büros in München, Frankfurt und Sofia.
  • Vorteile: 30 Urlaubstage, flexible Arbeitszeiten, hybrides Arbeiten und Gesundheitsförderung.
  • Weitere Informationen: Dynamisches, internationales Team mit hervorragenden Karrierechancen.
  • Warum dieser Job: Gestalte die Zukunft des Bankwesens mit modernster KI-Technologie.
  • Qualifikationen: 5+ Jahre Erfahrung in Backend-Engineering und 4+ Jahre in der Leitung von AI/ML-Teams.

Das prognostizierte Gehalt liegt zwischen 90000 - 120000 € pro Jahr.

Wir sind ein in München ansässiges AI-first Fintech-Scale-up (gegründet 2019) mit Büros in München, Frankfurt und Sofia. Unsere SaaS-Plattform bringt Banken, Investoren und Berater zusammen, um bei komplexen Finanzgeschäften zusammenzuarbeiten – und macht die Due Diligence schneller, intelligenter und transparenter. Unsere KI-Funktionen sind bereits bei führenden Banken im Einsatz. Jetzt skalieren wir.

Die Rolle

Leiten und entwickeln Sie unsere KI-Engineering-Funktion – transformieren Sie ein 15–20-köpfiges ML-Team von forschungsintensiv zu einer leistungsstarken, produktionsreifen Organisation. Sie werden mit dem Director of AI an der Strategie arbeiten, die Plattform aufbauen, die den Zugriff auf LLMs, RAG und Backend-Services vereint, und zuverlässige, skalierbare KI-Funktionen bereitstellen, die die Arbeitsweise der Banken verändern.

Wesentliche Verantwortlichkeiten

  • Teamführung und Organisationsaufbau: Einstellen, Mentoring und Entwicklung eines leistungsstarken Teams; Festlegung des technischen Standards, der Betriebsrhythmen und der Code-/Forschungsüberprüfungspraktiken. Organisieren von Unterteams (z.B. Core Modeling, AI Platform/Infra, Integrationen) mit klarer Verantwortung, SLOs und Bereitschaftsdiensten. Verwalten von Roadmaps, Kapazitätsplanung und Lieferung über parallele Initiativen.
  • Architektur und Plattform: Verantwortung für das LLM-Gateway: einheitliche APIs und Proxy-Schichten für Multi-Provider-Routing (OpenAI, Gemini, Bedrock), mit Ratenlimits, Fallbacks und Kostenverfolgung. Aufbau von Hochleistungs-RAG-Pipelines (Eingabe, Einbettungen, Vektorspeicher, Caching) mit robuster Beobachtbarkeit und Sicherheitsvorkehrungen. Zusammenarbeit mit Java/NestJS-Teams zur Definition sauberer asynchroner Verträge, Schemata und Ereignismuster; Förderung einer latenzarmen, skalierbaren Inferenz.
  • Modelllebenszyklus und Betrieb: Leitung des End-to-End-Modells und des Prompt-Lebenszyklus: Datenkuratierung, Training/Fine-Tuning, Bewertung, Bereitstellung, Rückgängigmachung. Etablierung von LLMOps/MLOps: Modell-/Prompt-Register, CI/CD, Canary/A/B-Tests, Offline/Online-Bewertungen, Drift- und Kostenüberwachung. Optimierung des Inferenzdurchsatzes und der Kosten (Autoskalierung, Batching, Quantisierung/Destillation, Caching).
  • Strategie und Zusammenarbeit: Übersetzung der Unternehmensziele in eine AI/ML-Roadmap mit messbaren Ergebnissen; Balance zwischen Erkundung, Zuverlässigkeit und Kosten. Verantwortung für die Build-vs-Buy/Vendor-Strategie für Modelle, Infrastruktur und Datenservices; Verwaltung von Budgets und SLAs.
  • Governance und Sicherheit: Implementierung von Datenschutz-, Sicherheits- und Compliance-Praktiken (RBAC, Geheimnisse, Nachvollziehbarkeit); Verfolgung der Prompt-/Modellherkunft und Reproduzierbarkeit. Definition von Vorfallreaktionen, Handbüchern und Nachbesprechungen für KI-Funktionen.

Was Sie mitbringen

  • 5+ Jahre Erfahrung als Backend-Entwickler und 4+ Jahre Leitung von AI/ML-Engineering in der Produktion (insgesamt 10+ Jahre).
  • Tiefe Architekturkenntnisse in Java (JVM) und/oder Node.js (NestJS), verteilte Systeme, APIs, Microservices und Messaging/Streaming.
  • Praktische Erfahrung mit LLM-Stacks: Orchestrierung (z.B. LangChain/LlamaIndex oder benutzerdefiniert), Vektor-Datenbanken (Pinecone, Qdrant, FAISS), Cloud-KI (z.B. AWS Bedrock).
  • Nachweisliche Betriebsführung von Systemen in großem Maßstab (Millionen täglicher API-Aufrufe) mit starken SLOs, Beobachtbarkeit und Vorfallmanagement.
  • MLOps-Grundlagen: Modellregister, Experimentverfolgung, CI/CD, Kubernetes, IaC (z.B. Terraform), bewährte Sicherheitspraktiken.
  • Exzellente Kommunikations- und Stakeholder-Managementfähigkeiten; starkes Produktbewusstsein, das sich auf die Bereitstellung benutzerorientierter Funktionen konzentriert.

Nice to have

  • Erfahrung mit GPU/Beschleuniger-Diensten und -Optimierung (vLLM, TGI, Triton, ONNX Runtime).
  • Kostenoptimierung für LLM-Workloads (Tokenbudgets, dynamisches Routing, Caching).
  • Bewertung und Sicherheit/Red-Teaming für generative Systeme; Erfahrung in Startups/hochwachstumsorientierten Unternehmen.

Wirkungsmetriken

  • Plattform: Einführung eines einheitlichen LLM-Gateways; standardisierte Beobachtbarkeit und Kostenberichterstattung.
  • Lieferung: 2–3 benutzerorientierte KI-Funktionen mit klaren SLOs und messbarem Einfluss bereitgestellt.
  • Zuverlässigkeit/Kosten: Reduzierung der durchschnittlichen Latenz und Kosten pro Anfrage; Autoskalierung und Caching implementiert.
  • Organisation: Struktur der Unterteams etabliert; verbesserte Codequalität und pünktliche Lieferung; gezielte Einstellungen abgeschlossen.

Unser Stack (indikativ)

  • Infra/DevOps: AWS (einschließlich Bedrock), Kubernetes, Terraform, CI/CD, Beobachtbarkeit (OpenTelemetry, Prometheus/Grafana).

Warum wir?

  • Internationales & inklusives Team: Zusammenarbeit mit vielfältigen Teams an unseren Standorten in München, Frankfurt, Berlin und Sofia.
  • Moderne & hundefreundliche Büros: Ergonomisch, grün und inspirierend für Zusammenarbeit und Produktivität.
  • Flexibilität: 30 Urlaubstage, flexible Arbeitszeiten und hybrides Arbeiten.
  • Sonderurlaub: Zusätzlicher halber Tag frei an Heiligabend und Silvester.
  • Workation: Arbeiten Sie für einen begrenzten Zeitraum jedes Jahr von ausgewählten Zielen aus remote.
  • Wohlbefinden & Mobilitätsleistungen: Unterstützung für Wohlbefinden und nachhaltigen Lebensstil: Urban Sports/EGYM Club-Zuschuss: Monatliche Unterstützung für Ihre Mitgliedschaft. Jobticket: 50% monatlicher Zuschuss für das Deutschlandticket. JobRad: Leasing von Fahrrädern oder E-Bikes zu attraktiven Konditionen.

Kandidaten müssen das Recht haben, in der EU zu arbeiten; eine Visumsponsoring wird für diese Rolle nicht angeboten.

Head of AI Engineering (f/m/x) Arbeitgeber: neoshare AG

Als ein innovatives Fintech-Scale-up mit Sitz in München bieten wir eine dynamische und inklusive Arbeitsumgebung, die auf Zusammenarbeit und persönlichem Wachstum basiert. Unsere modernen Büros sind hundefreundlich und fördern Kreativität, während flexible Arbeitszeiten und 30 Urlaubstage eine ausgewogene Work-Life-Balance ermöglichen. Zudem unterstützen wir das Wohlbefinden unserer Mitarbeiter durch verschiedene Mobilitäts- und Gesundheitsangebote, was uns zu einem attraktiven Arbeitgeber macht.

N

Kontaktdaten:

neoshare AG Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Head of AI Engineering (f/m/x) erhalten könnten

Netzwerken, Netzwerken, Netzwerken!

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns nicht vergessen, dass viele Jobs über persönliche Empfehlungen vergeben werden. Also, sei aktiv und knüpfe Kontakte!

Sei bereit für das Vorstellungsgespräch!

Mach dich mit den häufigsten Fragen im Bereich AI Engineering vertraut und bereite eigene Fragen vor. Zeig uns, dass du nicht nur die technischen Skills hast, sondern auch ein echtes Interesse an unserer Mission und Vision.

Präsentiere deine Projekte!

Hast du an spannenden AI-Projekten gearbeitet? Bring sie ins Gespräch! Zeig uns, was du kannst und wie du Probleme gelöst hast. Das gibt uns einen Einblick in deine Denkweise und Fähigkeiten.

Bewirb dich direkt über unsere Website!

Wir lieben es, wenn du dich direkt über unsere Karriereseite bewirbst. So bist du sicher, dass deine Bewerbung an die richtige Stelle gelangt. Und hey, wir freuen uns immer über frische Talente, die unser Team verstärken wollen!

Wir glauben, dass du diese Fähigkeiten brauchst, um Head of AI Engineering (f/m/x) mit Bravour zu bestehen

Teamführung
Mentoring
Technische Architektur
Java (JVM)
Node.js (NestJS)
Verteilte Systeme
APIs

Einige Tipps für deine Bewerbung 🫡

Sei authentisch!:Zeig uns, wer du wirklich bist! Verwende deine eigene Stimme und schreibe so, wie du sprichst. Das macht deine Bewerbung persönlicher und hebt dich von anderen ab.

Pass auf die Details auf!:Achte darauf, dass deine Bewerbung fehlerfrei ist. Rechtschreib- und Grammatikfehler können einen schlechten Eindruck hinterlassen. Lass jemanden drüberlesen, bevor du sie abschickst!

Verknüpfe deine Erfahrungen mit der Rolle!:Erkläre, wie deine bisherigen Erfahrungen und Fähigkeiten zu den Anforderungen der Stelle passen. Zeig uns, warum du die perfekte Person für die Position des Head of AI Engineering bist!

Bewirb dich über unsere Website!:Wir empfehlen dir, deine Bewerbung direkt über unsere Website einzureichen. So stellst du sicher, dass sie schnell und effizient bei uns ankommt. Wir freuen uns auf deine Unterlagen!

Wie man sich auf ein Vorstellungsgespräch bei neoshare AG vorbereitet

Verstehe die Rolle und das Unternehmen

Mach dich mit der Unternehmensgeschichte und den Werten vertraut. Informiere dich über die spezifischen Herausforderungen, die das Unternehmen im Bereich AI Engineering hat, und überlege, wie deine Erfahrungen und Fähigkeiten dazu passen.

Bereite konkrete Beispiele vor

Denke an konkrete Projekte oder Erfolge aus deiner Vergangenheit, die deine Fähigkeiten in der Führung von AI/ML-Teams und Backend-Engineering demonstrieren. Sei bereit, diese Beispiele zu erläutern und zu zeigen, wie du Probleme gelöst hast.

Technische Vorbereitung ist entscheidend

Da die Rolle tiefgehende technische Kenntnisse erfordert, solltest du dich auf technische Fragen vorbereiten. Übe Coding-Challenges und sei bereit, über Architekturentscheidungen und deine Erfahrungen mit LLMs und MLOps zu sprechen.

Fragen stellen ist wichtig

Bereite einige durchdachte Fragen vor, die dein Interesse an der Rolle und dem Unternehmen zeigen. Frage nach der Teamstruktur, den aktuellen Projekten oder den Herausforderungen, die das Unternehmen im AI-Bereich sieht.