Auf einen Blick
- Aufgaben: Bau die Bank der Zukunft mit modernster Technologie und innovativen Projekten.
- Unternehmen: Führendes Unternehmen im Online-Banking mit flexibler, multikultureller Arbeitsumgebung.
- Vorteile: Wettbewerbsfähiges Gehalt, Gesundheitsleistungen, Homeoffice und berufliche Weiterbildung.
- Weitere Informationen: Dynamisches Umfeld mit großartigen Karrierechancen und einem inklusiven Team.
- Warum dieser Job: Gestalte die Zukunft des Bankings und arbeite an bahnbrechenden KI-Lösungen.
- Qualifikationen: Erfahrung in Infrastruktur- oder Plattformengineering, insbesondere mit Kubernetes.
Das prognostizierte Gehalt liegt zwischen 75000 - 95000 € pro Jahr.
Building the bank of tomorrow takes more than skills. It means combining our differences to imagine, discuss, code, develop, test, learn… and celebrate every step together. Share our vibes? Join Swissquote to unleash your potential. We are the Swiss Leader in Online Banking and we provide trading, investing and banking services to über 650’000 Kunden, durch unsere leistungsstarken und sicheren digitalen Plattformen. Unsere über 1200 Mitarbeiter arbeiten flexibel, ohne Dresscode und in multikulturellen Teams. Durch den großen Einfluss auf die Branche erweitern sie ihr Fähigkeitenportfolio und fördern ihre Karriere in einem schnelllebigen Umfeld.
Als gleichberechtigter Arbeitgeber begrüßen wir Kandidaten aus allen Hintergründen, Erfahrungen und Perspektiven, um unser Team zu verstärken und zu unserem gemeinsamen Erfolg beizutragen. Sind Sie bereit? Trauen Sie sich, bewerben Sie sich!
Jobbeschreibung: Sie werden dem IT-Team der IT-Plattform-Operations beitreten, dessen Rolle es ist, die Schicht zwischen der Rohinfrastruktur und den unternehmensseitigen Dienstleistungen der Bank zu betreiben: die Middleware-Schicht, die Kubernetes-Steuerungsebene und die benutzerseitige Oberfläche der Sovereign AI-Plattform der Bank. Der ideale Kandidat verfügt über tiefgehende Expertise im Betrieb von Kubernetes-nativen Plattformengineering-Systemen in großem Maßstab und wird die Integration von Open-Source-AI-Tools in einer regulierten Unternehmensumgebung leiten, während er sicherstellt, dass die Inferenz großer Sprachmodelle (LLM) skaliert.
Ihre Expertise wird Ihrem Team helfen, die Plattform bereitzustellen, auf der die Bank regulierten Zugang zu internen und externen KI-Funktionen bietet — verteilte Inferenz, agentische Workflows, Notebooks und Chatbots — die auf der GPU und dem Servingsubstrat basieren, das von den System- und Speicherteams bereitgestellt wird. Gemeinsam mit Ihrem Team werden Sie eng mit IT-Architekten, Observability- und Performance-Analysten, der Cybersecurity-Funktion und den Systemteams zusammenarbeiten, um die langfristigen Ziele der Abteilung für eine souveräne KI-Fähigkeit zu planen und umzusetzen, die unter der eigenen Governance der Bank läuft — Datensouveränität, Inhaltsicherheit, Schutz vor Eingabeverfälschungen, Audit von agentischen Workflows und Kostenkontrolle bei externen API-Ausgaben — und die von Natur aus AI Act- und DORA-ready ist.
Aufgaben:
- Entwerfen, bereitstellen und betreiben von verteilter LLM-Inferenz (LLM-d) auf Kubernetes — Dimensionierung für Durchsatz, Tail-Latenz und GPU-Nutzung.
- Betreiben und Absichern der benutzerseitigen KI-Oberfläche: der Open WebUI-Chatbot, JupyterHub-Notebooks für Datenwissenschaftler und das Agentenkatalog (Agentregistry).
- Erstellen und Betreiben von Agentgateway als die regulierte Routing-Schicht zu externen Anbietern (Anthropic Claude API, OpenAI GPT API), Durchsetzung von Verkehrsrichtlinien, Ratenbegrenzung, Kostenkontrollen und Protokollierung.
- Implementierung von Inhalts-Sicherheits-, Eingabeverfälschungsabwehr- und auditkontrollen für agentische Workflows sowie des Agenten-Identitätsmodells, das für die Einhaltung des EU AI Act und DORA erforderlich ist.
- Betreiben der Kubernetes-Steuerungsebene — etcd, API-Server, Scheduler und Controller-Manager — mit HA-Dimensionierung und Surge-Upgrade-Disziplin; Beitrag zur Multi-Cluster-Verwaltung für das gemischte Cross-Cluster-Muster.
- Definieren von SLOs und Instrumentierung der Plattform für Leistung und Verfügbarkeit; Leitung der Vorfallreaktion über die KI-Plattform und den kritischen Pfad der Steuerungsebene.
- Automatisierung der Plattformbereitstellung und -konfiguration durch Infrastructure as Code und regulierte Automatisierung (AAP), wobei jede Bereitstellung wiederholbar, überprüfbar und prüfbar bleibt.
- Entwicklung und Pflege von Architektur-Dokumentationen und Betriebsanleitungen sowie Teilnahme an der 24x7 Rufbereitschaft.
Qualifikationen:
Mindestens 7 Jahre Erfahrung in Infrastruktur oder Plattformengineering, davon mindestens 3 Jahre im Betrieb von Produktions-Kubernetes und/oder maschinellen Lernlasten in großem Maßstab. Nachgewiesene Erfahrung im Management komplexer, geschäftskritischer IT-Umgebungen und in der Mitwirkung an großangelegten Plattformprojekten. Erfahrung in regulierten oder hochsicheren Branchen wie Banken, Telekommunikation, Luftfahrt, Pharmazie oder Regierung. Starkes Verständnis der Kubernetes-Interna, Container-Runtimes, verteilter Systeme, Netzwerke und cloud-nativer Sicherheit. Ausgezeichnete zwischenmenschliche Fähigkeiten, fähig, mit multifunktionalen technischen und geschäftlichen Teams sowie verschiedenen Managementebenen zusammenzuarbeiten, um Entscheidungsprozesse zu beeinflussen.
Bevorzugte Qualifikationen:
- Praktische Erfahrung mit LLM-d oder vergleichbaren verteilten Inferenz-/Modellservierungs-Frameworks (z.B. vLLM, TGI, NVIDIA Triton, Ray Serve, KServe).
- Erfahrung im Betrieb von JupyterHub, Open WebUI oder ähnlichen Multi-Tenant-Notebook- und Chatbot-Plattformen.
- Vertrautheit mit Kubernetes-nativen agentischen Frameworks (z.B. kagent), KI-Verkehrslenkungs-/Gateway-Schichten (z.B. Agentgateway) und Agenten-Registry-/Katalogmustern.
- Erfahrung in der Integration und Governance externer LLM-Anbieter (Anthropic Claude, OpenAI GPT) — Routing, Ratenbegrenzung, Kostenkontrolle und Audit.
- Kenntnisse in einer oder mehreren der folgenden Sprachen: Python, Go, Rust, Java, C++.
- Vertraut mit Infrastructure as Code und regulierten Automatisierungstools (Ansible / AAP, Terraform usw.); Vertrautheit mit Event-Streaming (Apache Kafka) und Observability-Stacks.
AI Infrastructure Engineer Arbeitgeber: Swissquote
Swissquote ist ein hervorragender Arbeitgeber, der seinen Mitarbeitern die Möglichkeit bietet, in einem dynamischen und multikulturellen Umfeld zu arbeiten. Mit flexiblen Arbeitsbedingungen, einem offenen Dresscode und einer starken Fokussierung auf persönliche und berufliche Weiterentwicklung, fördert das Unternehmen eine Kultur des gemeinsamen Lernens und Feierns. Hier haben Sie die Chance, an innovativen Projekten im Bereich KI-Infrastruktur zu arbeiten und Ihre Fähigkeiten in einer der führenden Online-Banken der Schweiz auszubauen.