Auf einen Blick
- Aufgaben: Entwickle und optimiere LLMOps-Pipelines für innovative KI-Lösungen.
- Unternehmen: Frühphasen-Startup, das KI-Lösungen für Governance, Risiko und Compliance anbietet.
- Vorteile: Handfeste Verantwortung, hybrides Arbeitsmodell und steile Lernkurve.
- Weitere Informationen: Wachse mit uns und forme das AI-Team von Anfang an.
- Warum dieser Job: Gestalte die Zukunft der KI in einem dynamischen Umfeld mit echten Kunden.
- Qualifikationen: 3+ Jahre Erfahrung in ML/AI-Systemen und starke Python-Kenntnisse.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
Sie werden Teil eines frühen, KI-nativen Startups mit einem Produkt, das bereits einen nachgewiesenen Marktbedarf hat. Wir entwickeln modernste KI-Lösungen für Governance, Risiko und Compliance (GRC) für Unternehmen weltweit. Unsere Kunden sind Prüfer, Risikomanager und Compliance-Teams, was bedeutet, dass Evaluierungsrigor, Auditierbarkeit und die Bereitschaft für das EU AI-Gesetz keine nachträglichen Überlegungen für uns sind, sondern Produktanforderungen.
Aufgaben
- Besitzen Sie die LLMOps-Pipeline: Bewerten Sie die Infrastruktur, den Prompt-Optimierungsschleifen und die Produktionsintegration, die Experimente in zuverlässige kundenorientierte Funktionen umwandelt.
- Entwickeln Sie eine Evaluierungsstrategie pro Ausgabetyp: Entscheiden Sie, wann deterministische Bewertungen (exakte Übereinstimmung, Schema-Validierung, Einbettungen) vs. LLM-as-Judge verwendet werden sollen, und erstellen Sie die Rubriken, Testdatensätze und menschlichen Überprüfungsprozesse, die das System vertrauenswürdig machen.
- Führen Sie die Prompt-Engineering- und Optimierungsprozesse in allen LLM-Operationen im Produkt durch: Übergang von handoptimierten Prompts zu einem messbaren, iterativen Prozess.
- Wählen Sie das richtige Werkzeug für jedes Problem: Einige Dinge sind LLM-Probleme, einige sind Einbettungs- + klassische NLP-Probleme, einige sind deterministische Logik.
- Leiten Sie die Produktionsseite der KI-Funktionen: Beobachtbarkeit (Langfuse / LangSmith / ähnlich), Kosten- und Latenzengineering, Vorfallreaktion, wenn eine LLM-Funktion abnimmt.
- Erstellen Sie Workflows mit Mensch-in-der-Schleife: Überprüfungswarteschlangen, Feedbackaufnahme, Kennzeichnung; damit das Produktionssignal in die Bewertungen und die Prompt-Iteration zurückfließt.
- Mentorieren Sie unseren AI & Analytics Praktikanten und tragen Sie dazu bei, wie wir das KI-Team im Laufe der Zeit aufbauen.
Anforderungen
- 3+ Jahre praktische Erfahrung im Aufbau und Versand von ML/AI-Systemen in der Produktion (uns interessiert mehr, was Sie geliefert haben, als die Jahre in einem Lebenslauf).
- Haben Sie eine LLM-Evaluierungs- oder Prompt-Optimierungspipeline geliefert, nicht nur LLMs in einem Projekt verwendet, sondern den Prozess besessen.
- Starke praktische Erfahrung mit LLM-as-Judge, einschließlich seiner Variationsprobleme und konkreten Techniken zu deren Kontrolle.
- Solide Grundlagen in klassischem NLP und ML-Operationen: Einbettungen, semantische Ähnlichkeit, Entitätsabgleich, Klassifikation, unscharfe Übereinstimmung.
- Informierte Meinungen zu deterministischen vs. LLM-basierten Bewertungen, basierend auf Erfahrung.
- Produktionsurteil: Sie haben Kosten- und Latenztrade-offs, Beobachtbarkeit und Vorfallreaktion für eine LLM-gesteuerte Funktion besessen. Sie sind mit der Rückschrittprüfung von Prompts vertraut und haben Strategien zu deren Verwaltung.
- Stark in Python.
- Ausgezeichnete Englischkenntnisse in Kommunikation, schriftlich und mündlich: Wir diskutieren täglich nuancierte technische Trade-offs mit dem Gründungsteam und den Kunden.
- Komfort mit Unklarheiten: Sie können Experimente mit echten Daten durchführen, Intuition für dieses Gebiet aufbauen und wissen, wann Sie mit der Iteration aufhören sollten.
Schön zu haben
- Praktische Erfahrung mit LLM-Beobachtungs- und Bewertungswerkzeugen (Langfuse, LangSmith, Phoenix/Arize, Helicone, Braintrust, W&B).
- Erfahrung mit DSPy oder ähnlichen Prompt-Optimierungsrahmen und Meinungen dazu, wo sie funktionieren und wo nicht.
- Erfahrung mit Azure OpenAI in EU-Regionen oder mit EU-souveränen Anbietern (Mistral, Aleph Alpha).
- Einblick in Sicherheitsvorkehrungen, Inhaltsicherheit oder KI-Governance.
- Einblick in Unternehmenssoftware, idealerweise GRC, Compliance, Audit oder regulierte Branchen.
- Vertrautheit mit Java/Spring Boot oder Kubernetes auf Azure; genug, um sauber zu integrieren.
Vorteile
- Praktische Verantwortung für ein echtes KI-Produkt, das von Unternehmenskunden genutzt wird.
- Direkte Zusammenarbeit mit dem Gründungsteam ab dem ersten Tag.
- Hybrides Arbeitsmodell: München Nord, mindestens einen Tag pro Woche im Büro, ansonsten flexibel (offen für starke Kandidaten anderswo in der EU für die richtige Passung); Einarbeitung erfolgt vor Ort.
- Eine steile Lernkurve an der Schnittstelle von LLM-Engineering, Unternehmens-GRC und Startup-Operationen.
- Die Chance, das KI-Team zu gestalten, während wir wachsen.
Auxilius .ai entwickelt KI-gestützte GRC-Lösungen für Unternehmen. Wir sind ein frühes, schnell wachsendes Unternehmen, das von echten Kunden unterstützt wird. Unser Tech-Stack umfasst Java & Spring Boot, Angular, Kubernetes auf Azure sowie OpenAI & Anthropic LLMs.
AI Engineer for LLM Ops & Evaluation (m/f/d) Arbeitgeber: Auxilius.ai
Auxilius .ai ist ein innovatives, AI-natives Start-up mit einem nachweislich marktfähigen Produkt im Bereich Governance, Risk und Compliance (GRC). Wir bieten unseren Mitarbeitern die Möglichkeit, direkt mit dem Gründungsteam zusammenzuarbeiten und an einem echten AI-Produkt zu arbeiten, das von Unternehmenskunden genutzt wird. Unsere hybride Arbeitsweise in München ermöglicht Flexibilität, während wir gleichzeitig eine steile Lernkurve und die Chance bieten, das AI-Team aktiv mitzugestalten.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so AI Engineer for LLM Ops & Evaluation (m/f/d) erhalten könnten
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor, indem du deine Kenntnisse über LLMs und ML-Operationen auffrischst. Wir empfehlen, praktische Beispiele aus deinen bisherigen Projekten parat zu haben, um deine Erfahrungen zu zeigen.
✨Tipp Nummer 3
Sei bereit, deine Ideen und Ansätze zu präsentieren! In einem Startup-Umfeld schätzen wir kreative Lösungen und innovative Denkweisen. Zeig uns, wie du Probleme angehst und löst.
✨Tipp Nummer 4
Bewirb dich direkt über unsere Website! So kannst du sicherstellen, dass deine Bewerbung die richtige Person erreicht. Und hey, wir freuen uns immer über neue Talente, die unser Team verstärken!
Wir glauben, dass du diese Fähigkeiten brauchst, um AI Engineer for LLM Ops & Evaluation (m/f/d) mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Sei du selbst!:Wir wollen dich kennenlernen, also zeig uns deine Persönlichkeit! Verwende eine lockere Sprache und sei authentisch in deinem Anschreiben. Das hilft uns, einen Eindruck von dir zu bekommen.
Betone deine Erfahrungen:Erzähl uns von deinen bisherigen Projekten und wie du LLMs oder ML-Systeme in der Praxis eingesetzt hast. Konkrete Beispiele sind Gold wert und zeigen uns, dass du weißt, wovon du sprichst!
Zeige deine Leidenschaft für AI:Mach deutlich, warum du dich für die Rolle als AI Engineer interessierst. Teile deine Gedanken über aktuelle Trends in der AI und wie du sie in unsere Produkte einbringen könntest. Das zeigt uns dein Engagement!
Bewirb dich über unsere Website:Um sicherzustellen, dass wir deine Bewerbung schnell und effizient bearbeiten können, bewirb dich bitte direkt über unsere Website. So bist du auf der sicheren Seite und wir können dich besser erreichen!
Wie man sich auf ein Vorstellungsgespräch bei Auxilius.ai vorbereitet
✨Verstehe die LLMOps-Pipeline
Mach dich mit der LLMOps-Pipeline vertraut, bevor du zum Interview kommst. Sei bereit, über deine Erfahrungen mit der Evaluierung von Infrastruktur und der Optimierung von Prompts zu sprechen. Zeige, dass du die Verantwortung für den gesamten Prozess übernehmen kannst.
✨Bereite konkrete Beispiele vor
Habe spezifische Beispiele parat, in denen du LLMs evaluiert oder optimiert hast. Erkläre, wie du deterministische und LLM-basierte Evaluierungen eingesetzt hast und welche Ergebnisse du erzielt hast. Das zeigt, dass du nicht nur theoretisches Wissen hast, sondern auch praktische Erfahrung.
✨Sprich über Kosten- und Latenzmanagement
Sei bereit, über deine Erfahrungen im Umgang mit Kosten- und Latenztrade-offs zu diskutieren. Zeige, dass du ein gutes Gespür für Produktionsurteile hast und wie du auf Vorfälle reagiert hast, wenn eine LLM-Funktion nicht mehr optimal lief.
✨Zeige deine Kommunikationsfähigkeiten
Da du täglich mit dem Gründungsteam und Kunden über technische Details sprichst, ist es wichtig, dass du deine Kommunikationsfähigkeiten unter Beweis stellst. Übe, komplexe technische Konzepte klar und verständlich zu erklären, sowohl schriftlich als auch mündlich.