Auf einen Blick
- Aufgaben: Entwickle Pipelines und Metadaten für die Nutzung von Daten in der Forschung.
- Unternehmen: Innovatives Unternehmen im Bereich Wetter- und Klimaforschung.
- Vorteile: Hochmoderne Hardware, Raum für persönliche Entwicklung und direkte Auswirkungen auf die Wissenschaft.
- Weitere Informationen: Vielfältiges und unterstützendes Team, das Frauen und unterrepräsentierte Gruppen ermutigt.
- Warum dieser Job: Gestalte die Datenverwaltung und ermögliche bahnbrechende wissenschaftliche Entdeckungen.
- Qualifikationen: Technischer Abschluss oder gleichwertige Erfahrung in Speicher- und Datenengineering.
Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.
80%-100%, Lugano, befristetes Projekt
Hintergrund des Projekts
Das Speichern von Petabytes ist der einfache Teil. Der schwierige Teil ist alles, was zwischen dem Moment passiert, in dem Daten auf der Festplatte landen, und dem Moment, in dem ein Forscher - oder ein Trainingsjob - sie tatsächlich vertrauen, finden und nutzen kann. Unsere parallelen Dateisysteme und Objektspeicher bewegen Daten bereits schnell. Was sie jedoch nicht von selbst tun, ist, einem Wissenschaftler zu sagen, woher ein Datensatz stammt, welche Transformationen ihn erzeugt haben, ob es sich um die Version handelt, die das Ergebnis des letzten Quartals unterstützt hat, oder wie man ihn an einen DataLoader übergibt, ohne das I/O-Subsystem zu überlasten. Diese Lücke - zwischen rohen Bytes und nutzbaren, nachvollziehbaren, reproduzierbaren Daten - ist der Bereich, in dem diese Rolle angesiedelt ist.
Sie werden an beiden Enden arbeiten: der Speicherebene (Durchsatz, Integrität, Tiering im Multi-Petabyte-Maßstab) und der darüber liegenden Datenebene (Herkunft, Nachvollziehbarkeit, Auffindbarkeit, Zugriffsverhalten). Wenn Sie jemals genervt waren, dass "die Daten sind im Cluster" als das Ende der Arbeit behandelt wird, anstatt als deren Anfang, lesen Sie weiter.
Wir setzen uns dafür ein, ein diverses und inklusives Ingenieurteam aufzubauen und ermutigen insbesondere Bewerbungen von Gruppen, die in der Technik unterrepräsentiert sind. Wir ermutigen insbesondere Frauen zur Bewerbung.
Stellenbeschreibung
- Brückenaufnahme und -nutzung.
- Entwerfen Sie die Pipelines und Metadaten, die aufgenommene Daten in etwas Auffindbares und Verbrauchbares verwandeln - Kataloge, Schemata und Zugriffsebenen, die mit der Art und Weise übereinstimmen, wie Trainingsjobs und Simulationen tatsächlich lesen, nicht nur wo Bytes sitzen.
- Daten nachvollziehbar machen.
- Erstellen Sie Herkunft und Nachvollziehbarkeit, damit jeder Datensatz, jeder Checkpoint oder jedes Ergebnis auf seine Eingaben und Transformationen zurückverfolgt werden kann. Reproduzierbarkeit ist hier eine erstklassige Anforderung, kein Nachrüstungsbedarf.
- Für die Arbeitslast optimieren.
- Optimieren Sie parallele Dateisysteme (Lustre, GPFS) und Objektspeicher für die Parallelität, kleine Dateien und große Checkpoint-Muster von verteiltem GPU-Training und HPC-Simulation.
- Skalierung sicher betreiben.
- Entwerfen und betreiben Sie Multi-Petabyte-Speicher mit der Integrität und Verfügbarkeit, auf die wissenschaftliche Arbeiten angewiesen sind - Fehlerkorrektur, Redundanz, Hot-to-Archival-Tiering.
- Alles automatisieren.
- Bereitstellen und Skalieren von Speicher- und Datendiensten als Code. Snowflake-Infrastruktur überlebt nicht in diesem Maßstab.
- Beobachtbar machen.
- Instrumentieren Sie die Speicherintegrität, Kapazitätstrends und Pipeline-Leistung, damit Probleme sichtbar werden, bevor die Benutzer sie spüren.
- Übersetzen.
- Verwandeln Sie echte Zugriffsverhalten von Fachwissenschaftlern und ML-Ingenieuren in technische Anforderungen - und wehren Sie sich, wenn eine Anfrage leise etwas downstream brechen würde.
Für ein Projekt im Bereich Wetter und Klima, das darauf abzielt, die Auswirkungen des Klimawandels zu verstehen und zu mindern, ist eine Stelle für zwei Jahre verfügbar. Der anfängliche Zweijahresvertrag könnte potenziell verlängert oder sogar dauerhaft werden.
Profil
- Ein technischer Abschluss (Informatik, Ingenieurwesen) oder gleichwertige Erfahrung, die dieselbe Tiefe demonstriert.
- Solide Kenntnisse im Bereich Speicherung: Dateisysteme (Block und Objekt), Leistungstuning, Redundanz (RAID, Fehlerkorrektur).
- Python und Komfort bei der Automatisierung von Infrastruktur (Ansible, Terraform oder ähnliches).
- Ein grundlegendes Verständnis dafür, wie ML- und wissenschaftliche Arbeitslasten Daten konsumieren - Milliarden von kleinen Dateien, große Checkpoints, Sharding - und warum naive Layouts scheitern.
- Eine Meinung zu Datenherkunft, Nachvollziehbarkeit oder Reproduzierbarkeit - und idealerweise Werkzeuge, die Sie verwendet haben, um dies durchzusetzen.
Was Ihnen hilft, herauszustechen
- Praktische Erfahrungen mit parallelen Dateisystemen (Lustre, Spectrum Scale/GPFS) oder verteiltem Speicher (Ceph, VAST).
- Wissenschaftliche Datenformate - HDF5, Zarr, Parquet - und Meinungen dazu, wann jedes seinen Platz verdient.
- Objektspeicher (S3), der mit ML-Frameworks (PyTorch, TensorFlow) verbunden ist.
- Orchestrierung (Kubernetes, Argo) und Werkzeuge zur Datenbewegung.
- Datenversionierung / Katalogisierung (z.B. DVC, lakeFS, ein Metadatenkatalog) und Vertrautheit mit FAIR-Datenprinzipien.
- CI/CD und Bereitstellung: GitLab CI, HashiCorp Vault, MAAS.
Wir erwarten nicht, dass jede Box abgehakt wird. Tiefe in der Speicherung oder Datenengineering sowie die Neugier, in das andere hineinwachsen zu können, sind wichtiger als eine vollständige Checkliste.
Was Sie erhalten
- Hardware und Skalierung, die Sie in der Unternehmens-IT nicht finden - und Probleme ohne Handbuch des Anbieters.
- Arbeit, die direkt veröffentlichte Wissenschaft und Modelltraining auf Grenzskala ermöglicht.
- Spielraum, um zu gestalten, wie Daten verwaltet werden, nicht nur gewartet, in einer Umgebung, die es ernst nimmt.
Unsere Kernwerte als Leitprinzipien
- Neugier: Sie genießen es, Systeme tief zu lernen und zu verstehen.
- Offenheit: Sie arbeiten effektiv zusammen und schätzen unterschiedliche Perspektiven.
- Mut: Sie sind bereit, schwierige oder unbekannte Probleme anzugehen.
- Unterstützend: Sie helfen Kollegen und Benutzern, erfolgreich zu sein.
- Integrität: Sie handeln verantwortungsbewusst, zuverlässig und transparent.
Senior Storage & Data Engineer Arbeitgeber: Immigration Policy Lab
Als Arbeitgeber in Lugano bieten wir Ihnen die Möglichkeit, an innovativen Projekten im Bereich der Datenverarbeitung und -speicherung zu arbeiten, die direkt zur wissenschaftlichen Forschung beitragen. Unsere Unternehmenskultur fördert Vielfalt und Inklusion, während wir Ihnen Raum für persönliches Wachstum und die Entwicklung neuer Fähigkeiten bieten. Genießen Sie eine unterstützende Arbeitsumgebung, in der Ihre Ideen geschätzt werden und Sie die Chance haben, an der Spitze der Technologie zu arbeiten.
StudySmarter Expertenrat🤫
Wir sind der Meinung, dass Sie so Senior Storage & Data Engineer erhalten könnten
✨Tipp 1: Nutze lokale Tech-Meetups
In der Datenbank-Branche gibt's oft lokale Meetups oder Events, bei denen du nicht nur dein Netzwerk erweitern kannst, sondern auch potenzielle Arbeitgeber triffst. Frag die Organisatoren, ob sie bekannt sind mit Firmen wie Immigration Policy Lab – so kann das ein direkter Draht werden!
✨Tipp 2: Zeig dein Können mit Open Source
Mach mit bei Open-Source-Projekten! Das zeigt nicht nur deine Fähigkeiten, sondern du wirst auch Teil der Community. Wenn du eine spannende Datenbank-Lösung oder ein Tool beisteuerst, beeindruckt das Arbeitgeber wie Immigration Policy Lab.
✨Tipp 3: Bleib am Puls der Branche
Folge aktuellen Trends und Entwicklungen im Datenbank-Bereich. Workshops und Webinare sind super Möglichkeiten, um dein Wissen aufzufrischen und gleichzeitig die richtigen Leute kennenzulernen. Das kann dir helfen, gerade bei befristeten Stellen eine gute Position zu ergattern.
✨Tipp 4: Bewirb dich direkt über unsere Seite!
Wenn die passende Ausschreibung für einen befristeten Job bei Immigration Policy Lab auftaucht, solltest du unbedingt über unsere Plattform bewerben. Wir sorgen dafür, dass deine Bewerbung von den richtigen Leuten gesehen wird und du die besten Chancen hast!
Wir glauben, dass du diese Fähigkeiten brauchst, um Senior Storage & Data Engineer mit Bravour zu bestehen
Einige Tipps für deine Bewerbung 🫡
Zeig deine Datenbank-Kenntnisse:Wenn du dich für die befristete Stelle im Bereich Datenbanken bei Immigration Policy Lab bewirbst, ist es wichtig, deine technischen Fähigkeiten klar zu kommunizieren. Nenne spezifische Datenbanktechnologien, mit denen du gearbeitet hast, wie MySQL, MongoDB oder PostgreSQL. Das zeigt, dass du die notwendigen Kenntnisse hast, um das Team zu unterstützen.
Präsentiere deine Projekte:Da es sich um eine befristete Position handelt, kann es hilfreich sein, ein paar deiner bisherigen Projekte oder Praktika in die Bewerbung einzubeziehen. Hast du bei einem Projekt Datenbanken entworfen oder bearbeitet? Zeig konkrete Ergebnisse oder Herausforderungen, die du gemeistert hast, um dein Potenzial zu demonstrieren!
Motivation ist der Schlüssel:In deinem Anschreiben solltest du unbedingt deine Motivation und Lernbereitschaft betonen. Erkläre, warum du dich für die befristete Stelle bei Immigration Policy Lab interessierst und wie du wachsen möchtest. Arbeitgeber lieben es, wenn Kandidaten die Bereitschaft zeigen, sich weiterzuentwickeln.
Achte auf die Details:Ein sorgfältig ausgearbeitetes Bewerbungsschreiben und ein strukturiertes CV sind entscheidend. Achte darauf, dass du alle relevanten Erfahrungen in Bezug auf Datenbanken überzeugend darstellst und deine Dokumente ordentlich und übersichtlich sind. Wir wollen, dass du vor einer Bewerbung auf unserer Website richtig durchstartest!
Wie man sich auf ein Vorstellungsgespräch bei Immigration Policy Lab vorbereitet
✨Zeige dein technisches Know-how
In der Datenbankbranche dreht sich alles um Technik und präzise Kenntnisse. Sei bereit, technische Fragen zu gängigen Datenbankmanagementsystemen wie MySQL, PostgreSQL oder Oracle zu beantworten. Vielleicht gibt's sogar eine praktische Aufgabe, bei der du dein Wissen direkt anwenden kannst!
✨Portfolio, das überzeugt
Auch wenn es sich um eine befristete Stelle handelt, ist es wichtig, ein starkes Portfolio zu präsentieren. Zeige vergangene Projekte oder Datenbanklösungen, an denen du gearbeitet hast – vielleicht sogar vor und nach dem Einsatz von Datenbanken, um deine Fähigkeiten sichtbar zu machen.
✨Vorbereitung auf Teamarbeit
Datenbankprojekte sind oft Teamarbeit! Bereite dich auf Fragen zu deiner Zusammenarbeit mit anderen oder zum Umgang mit Konflikten im Team vor. Zeige uns, dass du nicht nur technisch fit bist, sondern auch gut im Austausch mit anderen.
✨Schau dir die Rolle im Kontext an
Finde heraus, wie die Datenbankrolle bei Immigration Policy Lab in die Gesamtstrategie passt. Informiere dich über spezifische Projekte oder Herausforderungen, die das Unternehmen hat, und denke darüber nach, wie du mit deinen Fähigkeiten einen echten Mehrwert schaffen kannst. Das zeigt deine Motivation und dein Interesse.