Senior Research Data Engineer: MSR AI for Science
Senior Research Data Engineer: MSR AI for Science

Senior Research Data Engineer: MSR AI for Science

Vollzeit 72000 - 84000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
Microsoft

Auf einen Blick

  • Aufgaben: Entwickle innovative Datenpipelines fĂĽr maschinelles Lernen in der biomedizinischen Forschung.
  • Arbeitgeber: Microsoft Research AI for Science, ein fĂĽhrendes Unternehmen in der KI-Forschung.
  • Mitarbeitervorteile: Attraktives Gehalt, Gesundheitsleistungen und flexible Arbeitsmöglichkeiten.
  • Warum dieser Job: Gestalte die Zukunft der Wissenschaft mit KI und mache einen echten Unterschied.
  • GewĂĽnschte Qualifikationen: PhD oder gleichwertige Erfahrung in Informatik oder verwandten Bereichen.
  • Andere Informationen: Dynamisches Team mit groĂźartigen Wachstums- und Entwicklungsmöglichkeiten.

Das voraussichtliche Gehalt liegt zwischen 72000 - 84000 € pro Jahr.

Senior Research Data Engineer: MSR AI for Science

Join to apply for the Senior Research Data Engineer: MSR AI for Science role at Microsoft

At Microsoft Research AI for Science, we believe machine learning and artificial intelligence has the potential to transform scientific modelling and discovery crucial for solving the most pressing problems facing society including sustainable materials and discovery of new drugs.

We seek a highly motivated Senior RSDE to join our Biomolecular Emulator (BioEmu) team. The BioEmu project aims to model the dynamics and function of proteins – how they change shape, bind to each other, and bind small molecules. This approach will help us to understand biological function and dysfunction on a structural level and lead to more effective and targeted drug discovery.

Responsibilities

  • Data integration for structure & dynamics: Build ingestion/curation pipelines for structural/biophysical data (mmCIF/PDB, EM maps/particles, binding/biophysics, spectroscopy); implement map/volume preprocessing (e.g., resolution filtering, normalization) and alignment to model inputs/outputs.
  • Cryo‑EM expertise: Operationalize end‑to‑end flows from raw image stacks/particles to 3D maps and model‑ready tensors; interoperate with community formats (e.g., EMDB/EMPIAR, mmCIF) and link to sequences/annotations.
  • Signal & information content: Design dataset diagnostics (e.g., mutual‑information‑like measures, effective sample size, SNR proxies) to quantify what data teach the model; build active‑learning loops that maximize learning per euro of data collection time.
  • Model‑aware data services: Implement scalable, versioned data services and feature stores that feed training/evaluation; design loaders/augmentations optimized for throughput and correctness (GPU‑aware).
  • Training‑at‑scale engineering: Own distributed data pipelines and orchestration for large runs on Azure; profile and tune I/O, storage tiers, data locality, and caching; monitor cost, utilization, and failure modes.
  • Quality, governance, and reproducibility: Codify schemas/ontologies, metadata contracts, unit/integration tests, and lineage; automate validation and data drift detection; maintain documentation and examples.
  • Partner across disciplines: Work closely with ML researchers, structural biologists, and drug designers; translate experimental constraints into robust computational workflows; communicate clearly and proactively.

Qualifications

Required:

  • PhD or equivalent experience in Computer Science, Machine Learning, Applied Mathematics, Computational Biology, or related field.
  • Strong software engineering in Python (packaging, testing, CI), with systems thinking for data‑intensive ML.
  • Deep learning experience (PyTorch/JAX/TensorFlow) and solid foundations in linear algebra, probability, and statistics.
  • Proven experience designing robust data pipelines for large‑scale ML (HPC or cloud).
  • Ability to reason about learning signal and to assess information content of real‑world scientific datasets.
  • Excellent collaboration and communication in interdisciplinary teams.

Preferred:

  • Hands‑on cryo‑EM experience (e.g., map reconstruction, refinement, or pipeline tooling).
  • CUDA or C++ for performance‑critical components; experience with mixed precision and memory‑efficient training.
  • Experience integrating experimental data into ML models (e.g., constraints/priors from cryo‑EM, binding assays, spectroscopy).
  • Familiarity with MD data, structure prediction systems, or protein design work-flows.
  • Experience with cost‑optimization for data collection and cloud utilization; clear track record of building reliable, maintainable research software at scale.
  • Experience with structural biology or molecular biology data/techniques (e.g., cryo‑EM, binding assays, spectroscopy, expression, sequencing)

Microsoft is an equal opportunity employer. Consistent with applicable law, all qualified applicants will receive consideration for employment without regard to age, ancestry, citizenship, color, family or medical care leave, gender identity or expression, genetic information, immigration status, marital status, medical condition, national origin, physical or mental disability, political affiliation, protected veteran or military status, race, ethnicity, religion, sex (including pregnancy), sexual orientation, or any other characteristic protected by applicable local laws, regulations and ordinances. If you need assistance and/or a reasonable accommodation due to a disability during the application process, read more about requesting accommodations.

#J-18808-Ljbffr

Senior Research Data Engineer: MSR AI for Science Arbeitgeber: Microsoft

Microsoft Research AI for Science bietet eine inspirierende Arbeitsumgebung, in der innovative Technologien zur Lösung drängender gesellschaftlicher Herausforderungen eingesetzt werden. Als Senior Research Data Engineer im BioEmu-Team profitieren Sie von einer kollaborativen Kultur, die interdisziplinäre Partnerschaften fördert und Ihnen die Möglichkeit gibt, an bahnbrechenden Projekten zu arbeiten. Zudem unterstützt Microsoft aktiv die berufliche Weiterentwicklung seiner Mitarbeiter und bietet flexible Arbeitsbedingungen sowie umfassende Benefits, die das Wohlbefinden und die Zufriedenheit am Arbeitsplatz fördern.
Microsoft

Kontaktperson:

Microsoft HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior Research Data Engineer: MSR AI for Science

✨Netzwerken, Netzwerken, Netzwerken!

Nutze LinkedIn und andere Plattformen, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach informellen Gesprächen oder Mentoring – oft sind es persönliche Verbindungen, die dir den Zugang zu spannenden Stellen ermöglichen.

✨Sei proaktiv!

Warte nicht darauf, dass Stellenanzeigen veröffentlicht werden. Recherchiere Unternehmen, die dich interessieren, und kontaktiere sie direkt. Zeig dein Interesse und teile, wie du zum Team beitragen kannst – das kann einen großen Unterschied machen!

✨Bereite dich auf technische Interviews vor!

Stelle sicher, dass du deine technischen Fähigkeiten auffrischst. Übe Coding-Challenges und sei bereit, über deine bisherigen Projekte zu sprechen. Zeige, wie du komplexe Probleme gelöst hast und welche Tools du verwendet hast – das wird dir helfen, im Interview zu glänzen.

✨Bewirb dich über unsere Website!

Wenn du eine Stelle bei Microsoft Research AI for Science ins Auge gefasst hast, bewirb dich direkt ĂĽber unsere Website. Das zeigt dein Engagement und gibt dir die beste Chance, von den richtigen Leuten gesehen zu werden!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior Research Data Engineer: MSR AI for Science

Datenintegration
Cryo-EM-Expertise
Aktives Lernen
Modellbewusste Datenservices
Training-at-Scale Engineering
Qualitätssicherung und Reproduzierbarkeit
Interdisziplinäre Zusammenarbeit
Software Engineering in Python
Deep Learning (PyTorch/JAX/TensorFlow)
Robuste Datenpipelines fĂĽr groĂźangelegte ML
CUDA oder C++ fĂĽr leistungsoptimierte Komponenten
Integration experimenteller Daten in ML-Modelle
Erfahrung mit struktureller Biologie oder molekularer Biologie

Tipps für deine Bewerbung 🫡

Mach deine Bewerbung persönlich: Zeig uns, wer du bist! Verwende eine freundliche und authentische Sprache in deinem Anschreiben. Erkläre, warum du dich für die Position als Senior Research Data Engineer interessierst und was dich an unserem BioEmu-Projekt fasziniert.

Betone deine relevanten Erfahrungen: Stell sicher, dass du deine Erfahrungen im Bereich Machine Learning und Software Engineering klar hervorhebst. Zeig uns, wie deine Fähigkeiten in Python und deine Kenntnisse in Deep Learning dir helfen werden, unsere Herausforderungen zu meistern.

Sei konkret bei deinen Projekten: Erzähle uns von konkreten Projekten, an denen du gearbeitet hast, insbesondere wenn sie mit großen Datenpipelines oder cryo-EM zu tun hatten. Wir lieben es, wenn du uns zeigst, wie du Probleme gelöst und innovative Lösungen entwickelt hast.

Bewirb dich über unsere Website: Vergiss nicht, dich direkt über unsere Website zu bewerben! So stellst du sicher, dass deine Bewerbung schnell und effizient bei uns ankommt. Wir freuen uns darauf, von dir zu hören!

Wie du dich auf ein Vorstellungsgespräch bei Microsoft vorbereitest

✨Verstehe die Technologie

Mach dich mit den neuesten Entwicklungen in der KI und maschinellem Lernen vertraut, insbesondere im Kontext von biologischen Anwendungen. Zeige während des Interviews, dass du die Technologien, die Microsoft Research verwendet, verstehst und wie sie zur Lösung komplexer Probleme beitragen können.

✨Bereite konkrete Beispiele vor

Denke an spezifische Projekte oder Erfahrungen, die deine Fähigkeiten in der Datenintegration und im Umgang mit großen Datensätzen demonstrieren. Sei bereit, über Herausforderungen zu sprechen, die du gemeistert hast, und wie du innovative Lösungen gefunden hast.

✨Interdisziplinäre Zusammenarbeit betonen

Da die Rolle enge Zusammenarbeit mit verschiedenen Disziplinen erfordert, solltest du Beispiele für erfolgreiche Teamarbeit und Kommunikation in interdisziplinären Projekten parat haben. Zeige, wie du technische Konzepte klar und verständlich an Nicht-Techniker vermitteln kannst.

✨Fragen stellen

Bereite einige durchdachte Fragen vor, die dein Interesse an der Position und dem Unternehmen zeigen. Frage nach den aktuellen Herausforderungen im BioEmu-Projekt oder wie das Team die Integration von experimentellen Daten in ML-Modelle angeht. Das zeigt, dass du proaktiv und engagiert bist.

Senior Research Data Engineer: MSR AI for Science
Microsoft
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschlieĂźlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 UnterstĂĽtzung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurĂĽck-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>