Platform Reliability Lead – AI-native Operations (w/m/d)
Viele Plattformen skalieren schneller als ihre Operations.
Dann entstehen:
• Alert-Stürme
• manuelle Incident-Reaktionen
• steigende Cloud-Kosten
• zunehmende operative Komplexität
Genau dieses Problem lösen wir gerade.
Comparus betreibt eine wachsende SaaS- und AI-Plattform, die je nach Kundenkontext in unserer Cloud, in Public-Cloud-Umgebungen oder On-Premises betrieben wird.
Damit sie zuverlässig skaliert, brauchen wir Operations, die nicht nur reagieren – sondern Systeme bauen.
Ihre Mission
Sie entwickeln ein Betriebsmodell, das Reliability systemisch sicherstellt. Sie verantworten Reliability als System – nicht als Reaktion auf Incidents.
Zum Beispiel durch:
• klare SLOs und Betriebsmetriken
• Automatisierung entlang der Ops-Value-Chain
• AIOps für Monitoring, Incident-Analyse und Prognosen
• Reduktion manueller Eingriffe durch intelligente Systeme
Ihr Verantwortungsbereich
Platform Operations · SRE · DevOps
Cloud · SaaS · AIOps · Automatisierung
Sie arbeiten hands-on an kritischen Betriebsentscheidungen, Incidents, Automatisierungen und Reliability-Strukturen.
Diese Rolle ist keine reine Management-Position.
Ziel
Operations dürfen kein Engpass sein. Sie müssen Skalierung ermöglichen – ohne dass Komplexität und Kosten explodieren.
Wenn Sie Operations als Systemproblem denken und AI sinnvoll im Betrieb einsetzen wollen, sollten wir sprechen.
Die vollständige Beschreibung finden Sie auf unserer Website.
Easy Apply mit CV oder LinkedIn-Profil – dauert weniger als 60 Sekunden.
#PlatformEngineering #PlatformOperations #AIOps #SRE #CloudInfrastructure #SaaS