Senior Storage & Data Engineer80%-100%, Lugano, fixed-term

Senior Storage & Data Engineer80%-100%, Lugano, fixed-term

Lugano Befristet 60000 - 80000 € / Jahr (geschätzt) Kein Homeoffice möglich
Eidgenössische Technische Hochschule Zürich

Auf einen Blick

  • Aufgaben: Entwickle und optimiere Datenspeicherlösungen für wissenschaftliche Anwendungen.
  • Unternehmen: ETH Zürich, führendes Forschungszentrum mit Fokus auf Hochleistungsrechnen.
  • Vorteile: Wettbewerbsfähiges Gehalt, berufliche Entwicklung und ein dynamisches Arbeitsumfeld.
  • Weitere Informationen: Vielfältiges Team, das Inklusion und Nachhaltigkeit fördert.
  • Warum dieser Job: Gestalte die Zukunft der Datenverarbeitung und unterstütze bahnbrechende wissenschaftliche Projekte.
  • Qualifikationen: Technischer Abschluss oder gleichwertige Erfahrung in Speicher- und Datenengineering.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Das Swiss National Supercomputing Centre (CSCS) entwickelt und betreibt eine Hochleistungsrechen- und Datenforschungsinfrastruktur, die erstklassige Wissenschaft in der Schweiz unterstützt. Das Nutzerlabor steht inländischen und internationalen Forschern aus der Wissenschaft, Industrie und dem Geschäftssektor zur Verfügung. Das Zentrum wird von der ETH Zürich betrieben und hat Büros in seinem Rechenzentrum in Lugano und in Zürich. Der Arbeitsort für diese Position ist entweder Lugano oder Zürich. Der Vertrag ist auf zwei Jahre befristet.

Projekt Hintergrund

Die Speicherung von Petabytes ist der einfache Teil. Der schwierige Teil ist alles zwischen dem Moment, in dem Daten auf der Festplatte landen, und dem Moment, in dem ein Forscher – oder ein Trainingsjob – sie tatsächlich vertrauen, finden und nutzen kann. Unsere parallelen Dateisysteme und Objektspeicher bewegen Daten bereits schnell. Was sie jedoch nicht von selbst tun, ist, einem Wissenschaftler zu sagen, woher ein Datensatz stammt, welche Transformationen ihn erzeugt haben, ob es sich um die Version handelt, die das Ergebnis des letzten Quartals unterstützt hat, oder wie man ihn einem DataLoader zuführt, ohne das I/O-Subsystem zu überlasten. Diese Lücke – zwischen rohen Bytes und nutzbaren, nachvollziehbaren, reproduzierbaren Daten – ist der Bereich, in dem diese Rolle angesiedelt ist.

Aufgaben:

  • Brücke zwischen Ingestion und Nutzung schlagen.
  • Entwerfen Sie die Pipelines und Metadaten, die ingestierte Daten in etwas Findbares und Verbrauchbares verwandeln – Kataloge, Schemata und Zugriffsschichten, die mit der Art und Weise übereinstimmen, wie Trainingsjobs und Simulationen tatsächlich lesen, nicht nur wo Bytes sitzen.
  • Daten nachvollziehbar machen.
  • Erstellen Sie Herkunft und Provenienz, damit jeder Datensatz, Checkpoint oder jedes Ergebnis auf seine Eingaben und Transformationen zurückverfolgt werden kann. Reproduzierbarkeit ist hier ein erstklassiges Erfordernis, kein Nachrüstungsbedarf.
  • Für die Arbeitslast optimieren.
  • Optimieren Sie parallele Dateisysteme (Lustre, GPFS) und Objektspeicher für die Parallelität, kleine Dateien und große Checkpoint-Muster von verteiltem GPU-Training und HPC-Simulation.
  • In großem Maßstab sicher arbeiten.
  • Entwerfen und betreiben Sie mehrpetabyte Speicher mit der Integrität und Verfügbarkeit, auf die wissenschaftliche Arbeiten angewiesen sind – Fehlerkorrektur, Redundanz, Hot-to-Archival-Tiering.
  • Alles automatisieren.
  • Bereitstellen und Skalieren von Speicher- und Datendiensten als Code. Snowflake-Infrastruktur überlebt nicht in diesem Maßstab.
  • Beobachtbar machen.
  • Instrumentieren Sie die Speicherintegrität, Kapazitätstrends und Pipeline-Leistung, damit Probleme auftauchen, bevor die Benutzer sie spüren.
  • Übersetzen.
  • Verwandeln Sie reale Zugriffsmuster von Fachwissenschaftlern und ML-Ingenieuren in technische Anforderungen – und wehren Sie sich, wenn eine Anfrage leise etwas downstream brechen würde.

Profil:

  • Ein technischer Abschluss (Informatik, Ingenieurwesen) oder gleichwertige Erfahrung, die dieselbe Tiefe demonstriert.
  • Solide Kenntnisse im Bereich Speicherung: Dateisysteme (Block und Objekt), Leistungstuning, Redundanz (RAID, Fehlerkorrektur).
  • Python und Komfort bei der Automatisierung von Infrastruktur (Ansible, Terraform oder ähnliches).
  • Ein grundlegendes Verständnis dafür, wie ML- und wissenschaftliche Arbeitslasten Daten konsumieren – Milliarden von kleinen Dateien, große Checkpoints, Sharding – und warum naive Layouts scheitern.
  • Eine Meinung zu Datenherkunft, Provenienz oder Reproduzierbarkeit – und idealerweise Werkzeuge, die Sie verwendet haben, um dies durchzusetzen.

Was Ihnen hilft, herauszustechen:

  • Praktische Erfahrungen mit parallelen Dateisystemen (Lustre, Spectrum Scale/GPFS) oder verteiltem Speicher (Ceph, VAST).
  • Wissenschaftliche Datenformate – HDF5, Zarr, Parquet – und Meinungen dazu, wann jedes seinen Platz verdient.
  • Objektspeicher (S3), der mit ML-Frameworks (PyTorch, TensorFlow) verbunden ist.
  • Orchestrierung (Kubernetes, Argo) und Datenbewegungswerkzeuge.
  • Datenversionierung / Katalogisierung (z.B. DVC, lakeFS, ein Metadatenkatalog) und Vertrautheit mit FAIR-Datenprinzipien.
  • CI/CD und Bereitstellung: GitLab CI, HashiCorp Vault, MAAS.

Wir erwarten nicht, dass jede Box abgehakt wird. Tiefe in der Speicherung oder Datenengineering sowie die Neugier, in das andere hineinwachsen zu können, sind wichtiger als eine vollständige Checkliste.

Was Sie erhalten:

  • Hardware und Maßstab, die Sie in der Unternehmens-IT nicht finden – und Probleme ohne Handbuch des Anbieters.
  • Arbeit, die direkt veröffentlichte Wissenschaft und Modelltraining auf Grenzskala ermöglicht.
  • Spielraum, um zu gestalten, wie Daten verwaltet werden, nicht nur gewartet, in einer Umgebung, die es ernst nimmt.

Wir setzen uns dafür ein, ein diverses und inklusives Ingenieurteam aufzubauen und ermutigen insbesondere Bewerbungen von Gruppen, die in der Technik unterrepräsentiert sind. Wenn Sie technisch versiert, neugierig und bereit sind zu wachsen, möchten wir von Ihnen hören.

Wir bieten:

  • Ihre Arbeit mit Einfluss: Werden Sie Teil der ETH Zürich, die nicht nur Ihre berufliche Entwicklung unterstützt, sondern auch aktiv zu positiven Veränderungen in der Gesellschaft beiträgt.
  • Sie können sich auf ein spannendes Arbeitsumfeld, kulturelle Vielfalt und attraktive Angebote und Vorteile freuen.
  • Wir schätzen die Vielfalt unseres Teams und ermutigen insbesondere Frauen zur Bewerbung, um die Vielfalt unserer Belegschaft weiter zu erhöhen.

Im Einklang mit unseren Werten fördert die ETH Zürich eine inklusive Kultur. Wir setzen uns für Chancengleichheit ein, schätzen Vielfalt und pflegen ein Arbeits- und Lernumfeld, in dem die Rechte und Würde aller Mitarbeiter und Studierenden respektiert werden. Nachhaltigkeit ist ein Kernwert für uns – wir arbeiten konsequent auf eine klimaneutrale Zukunft hin.

Neugierig? Wir auch.

Unsere Kernwerte als Leitprinzipien:

  • Neugier: Sie genießen es, Systeme tief zu lernen und zu verstehen.
  • Offenheit: Sie arbeiten effektiv zusammen und schätzen unterschiedliche Perspektiven.
  • Mut: Sie sind bereit, schwierige oder unbekannte Probleme anzugehen.
  • Unterstützend: Sie helfen Kollegen und Nutzern, erfolgreich zu sein.
  • Integrität: Sie handeln verantwortungsbewusst, zuverlässig und transparent.

Senior Storage & Data Engineer80%-100%, Lugano, fixed-term Arbeitgeber: Eidgenössische Technische Hochschule Zürich

Das Swiss National Supercomputing Centre (CSCS) bietet eine herausragende Arbeitsumgebung, in der innovative Technologien und wissenschaftliche Exzellenz im Mittelpunkt stehen. Mit einem starken Fokus auf Vielfalt und Inklusion fördert das CSCS die berufliche Entwicklung seiner Mitarbeiter und bietet spannende Möglichkeiten zur Mitgestaltung von Datenmanagementlösungen, die direkt zur wissenschaftlichen Forschung beitragen. Die Lage in Lugano ermöglicht zudem ein inspirierendes Arbeitsumfeld in einer kulturell reichen Region, die sowohl nationale als auch internationale Talente anzieht.

Eidgenössische Technische Hochschule Zürich

Kontaktdaten:

Eidgenössische Technische Hochschule Zürich Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so Senior Storage & Data Engineer80%-100%, Lugano, fixed-term erhalten könnten

Zeig dein Können in Data Science Wettbewerben!

Nimm an Wettbewerben wie Kaggle oder DrivenData teil. Dort kannst du deine Fähigkeiten in der Datenanalyse und im maschinellen Lernen unter Beweis stellen, was dir nicht nur praktische Erfahrungen bietet, sondern auch deine Sichtbarkeit in der Branche erhöht.

Nutze lokale Data Science Meetups!

Schau dir lokale Meetups und Networking-Events an, die sich auf Data Science fokussieren. Dort kannst du Gleichgesinnte treffen, dein Netzwerk erweitern und möglicherweise Kontakte knüpfen, die dir zu einem befristeten Job helfen könnten.

Hebe deine Projekte hervor!

Wenn du bereits an Projekten gearbeitet hast, sei es im Studium oder privat, präsentiere sie auf Plattformen wie GitHub. Das zeigt zukünftigen Arbeitgebern nicht nur dein Können, sondern auch deine Leidenschaft für Data Science.

Bewerbungen über unsere Website!

Vergiss nicht, dich direkt über unsere Website bei Eidgenössische Technische Hochschule Zürich zu bewerben! Dort hast du die besten Chancen, gesehen zu werden und wir freuen uns immer über neue Talente in unserem Team.

Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Storage & Data Engineer80%-100%, Lugano, fixed-term mit Bravour zu bestehen

Analytische Fähigkeiten
Detailgenauigkeit
Technisches Verständnis
Erfahrung mit Parallel-Dateisystemen (Lustre, GPFS)
Erfahrung mit verteiltem Speicher (Ceph, VAST)
Python-Programmierung
Automatisierung von Infrastruktur (Ansible, Terraform)

Einige Tipps für deine Bewerbung 🫡

Daten, Daten, Daten!:In der Datenwissenschaft kommt es darauf an, wie gut du mit Daten umgehst. Vergiss nicht, in deinem Lebenslauf Projekte oder Arbeiten zu erwähnen, bei denen du Daten analysiert oder Modelle entwickelt hast. Verwende auch spezifische Tools oder Programmiersprachen, die du bereits benutzt hast, wie Python oder R – das beeindruckt sicher!

Zeig uns deinen Code!:Wenn du ein paar coole Projekte oder Forschungsarbeiten hast, vielleicht sogar auf GitHub, wäre jetzt der perfekte Moment, das zu zeigen! Gerade bei einer befristeten Stelle ist es wichtig, dass du einen Nachweis über deine Fähigkeiten liefern kannst. Ein Portfolio oder Links zu deinen Arbeiten machen einen riesigen Unterschied.

Begeisterung ist der Schlüssel!:In deinem Anschreiben kannst du zeigen, wie sehr du für den Job brennst. Erkläre, warum du dich für die befristete Stelle bei Eidgenössische Technische Hochschule Zürich interessierst, und was du in dieser Zeit lernen und beitragen möchtest. Das zeigt nicht nur deine Motivation, sondern auch, dass du dir Gedanken über das Team und das Unternehmen gemacht hast.

Klar kommunizieren!:Datenwissenschaftler müssen oft ihre Ergebnisse einfach und klar kommunizieren. Achte darauf, dass dein Anschreiben und Lebenslauf strukturiert und übersichtlich sind. Das hilft nicht nur dir, sondern zeigt auch Eidgenössische Technische Hochschule Zürich, dass du in der Lage bist, komplexe Informationen verständlich zu präsentieren.

Wie man sich auf ein Vorstellungsgespräch bei Eidgenössische Technische Hochschule Zürich vorbereitet

Mach dich mit den wichtigsten Tools vertraut

Im Data-Science-Bereich sind Kenntnisse in Tools wie Python, R und SQL absolut entscheidend. Sei bereit, während des Interviews konkrete technische Fragen zu diesen Tools zu beantworten oder sogar kleine Aufgaben zu lösen. Zeig, dass du die Funktionsweise dieser Technologien wirklich verstehst und anwenden kannst.

Präsentation deiner Projekte

Da es sich um eine befristete Stelle handelt, solltest du dein Portfolio oder deine bisherigen Projekte gut im Blick haben. Bereite eine kurze Präsentation deiner Arbeit vor – gehe auf die Problemstellung, deine Herangehensweise und die Ergebnisse ein. Zeig, was du gelernt hast und wie du dieses Wissen in die neue Rolle einbringen kannst.

Verstehe die Daten, die du analysierst

Interviewer im Bereich Data Science wollen oft überprüfen, wie gut du die verschiedenen Datentypen und deren Anwendung verstehst. Sei darauf vorbereitet, Szenarien zu diskutieren, in denen du bestimmte Datenquellen analysiert oder bereinigt hast. Das zeigt nicht nur technisches Know-how, sondern auch analytisches Denken.

Fragen zur Teamarbeit und Projekterfahrung

Befristete Stellen bedeuten oft, dass du in einem dynamischen Team arbeiten wirst. Sei bereit, Fragen zu deiner Teamarbeit und deinen Erfahrungen in Projekten zu beantworten. Erzähl, wie du Herausforderungen in der Zusammenarbeit gemeistert hast und welche Rolle du im Team übernommen hast.