ML Engineer, Open Source

ML Engineer, Open Source

Freiburg im Breisgau Vollzeit 60000 - 80000 € / Jahr (geschätzt) Home Office möglich (teilweise)
Go Premium
P

Auf einen Blick

  • Aufgaben: Entwickle innovative APIs für tabellarische KI-Modelle und löse komplexe technische Herausforderungen.
  • Arbeitgeber: Führendes Unternehmen im Bereich strukturierte Daten-Maschinenlernen mit offener Kultur.
  • Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten, Remote-Arbeit und Weiterbildungsmöglichkeiten.
  • Warum dieser Job: Sei Teil eines revolutionären Teams, das die Zukunft der KI mitgestaltet.
  • Gewünschte Qualifikationen: Erfahrung in Python-Paketen und tiefes Verständnis von ML-Bibliotheken erforderlich.
  • Andere Informationen: Dynamisches Umfeld mit großartigen Karrierechancen und einem inklusiven Team.

Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wer wir sind: Foundation-Modelle haben Text und Bilder transformiert, aber strukturierte Daten - die größte und bedeutendste Datenmodalität der Welt - sind unberührt geblieben. Tabellen steuern jede klinische Studie, jedes Finanzmodell, jedes wissenschaftliche Experiment und jede Geschäftsentscheidung. Niemand hat ein Foundation-Modell entwickelt, das sie wirklich versteht. Bis jetzt. Was LLMs für Sprache getan haben, tun wir für Tabellen.

Momentum: Wir haben tabellarische Foundation-Modelle pioniert und sind nun die weltweit führende Organisation im Bereich strukturierte Daten-ML. Unser TabPFN v2-Modell wurde in Nature veröffentlicht und hat einen neuen Stand der Technik für tabellarisches maschinelles Lernen gesetzt. Seit seiner Veröffentlichung haben wir die Modellfähigkeiten um mehr als das 20-fache skaliert, über 3 Millionen Downloads erreicht, 6.000+ GitHub-Sterne erhalten und sehen eine beschleunigte Akzeptanz in Forschung und Industrie - von der Erkennung von Lungenerkrankungen mit Oxford Cancer Analytics bis zur Verhinderung von Zugausfällen mit Hitachi und der Verbesserung von Entscheidungen in klinischen Studien mit BostonGene.

Die schwierigste Arbeit liegt vor uns. Wir skalieren tabellarische Foundation-Modelle, um Millionen von Zeilen, Tausende von Merkmalen, Echtzeitinferenz und völlig neue Datenmodalitäten zu bewältigen - während wir die Infrastruktur aufbauen, um sie in Produktion in einigen der anspruchsvollsten Branchen der Welt einzusetzen. Dies sind offene Probleme, an denen sonst niemand auf diesem Niveau arbeitet.

Unser Team: Wir sind ein kleines, hochselektives Team von über 20 Ingenieuren und Forschern, ausgewählt aus über 5.000 Bewerbungen, mit Hintergründen von Google, Apple, Amazon, Microsoft, G-Research, Jane Street, Goldman Sachs und CERN, geleitet von Frank Hutter, Noah Hollmann und Sauraj Gambhir und beraten von weltweit führenden KI-Forschern wie Bernhard Schölkopf und Turing-Preisträger Yann LeCun. Wir liefern schnell, schaffen erstklassige Forschung und halten uns gegenseitig an einen extrem hohen Standard.

Was kommt als Nächstes: Im Jahr 2025 haben wir 9 Millionen Euro Pre-Seed von Balderton Capital gesammelt, unterstützt von Führungspersönlichkeiten von Hugging Face, DeepMind und Black Forest Labs. Der nächste Modalitätswechsel in der KI findet statt - und wir stellen das Team ein, das es möglich macht.

Über die Rolle: Die meisten Unternehmen betrachten Open Source als Nebenjob für Forscher, die lieber etwas anderes tun würden. Wir denken, dass das falsch ist. Prior Labs ist in Open Source verwurzelt - TabPFN begann als Forschungsprojekt, das von der Community übernommen wurde, und so wurden wir ein Unternehmen.

Sprachmodelle und Bildmodelle hatten Jahre Zeit, um ihre Ökosystem-Schnittstellen und Integrationen auszubauen. Für tabellarische Foundation-Modelle existiert das noch nicht. Sie stecken nicht in bestehenden Mustern fest - Sie schaffen sie. Die Technik ist wirklich schwierig: TabPFN macht In-Context-Learning, nicht traditionelles Fit/Predict, sodass es bedeutet, Probleme zu lösen, die keine andere Bibliothek gelöst hat. Sie entwerfen APIs für ein Modell, dessen Architektur sich schneller weiterentwickelt, als Benutzer aktualisieren können, und machen die Inferenz robust gegenüber dem vollen Chaos realer tabellarischer Daten. Sie verstehen das Modell tief genug, um zurückzuschieben, wenn etwas downstream kaputtgehen wird, und Sie kümmern sich genug um die Details, um großartige Dokumentationen und Fehlermeldungen über großartigem Code zu schreiben.

Woran Sie arbeiten werden:

  • Entwurf von sklearn-kompatiblen APIs rund um ein Foundation-Modell, das sich nicht wie ein traditioneller Schätzer verhält - lösen Sie die schwierigen Abstraktionsprobleme, damit die Schnittstelle einfach erscheint
  • Aufbau und Wartung der PyTorch-Serialisierung, HuggingFace Hub-Modellverteilung und Checkpoint-Management über ein Multi-Modell-, Multi-Version-Ökosystem
  • Erstellung von MCP- und Tool-Wrappern für agentische KI-Pipelines
  • Modellnahe ML-Engineering: Vorverarbeitungspipelines, Inferenz-Wrapper, dtype-Verwaltung, Edge-Case-Härtung gegen reale Daten
  • Verantwortung für Releases, CI, Tests und Dokumentation im gesamten TabPFN-Ökosystem - TabPFN (Kern), tabpfn-client, tabpfn-extensions, tabpfn-time-series
  • Allgemeines ML-Engineering: Benchmarking, Evaluierungspipelines, Datenladen, Werkzeuge, die das Team schneller machen

Sie könnten gut passen, wenn Sie:

  • Über 3 Jahre Erfahrung im Aufbau und in der Wartung von Python-Paketen oder ML-Bibliotheken haben, die von anderen verwendet werden (starker Open-Source-Hintergrund bevorzugt)
  • Tiefe Kenntnisse in PyTorch, scikit-learn, pandas, NumPy - deren Interna, Erweiterungspunkte und Fehlerquellen, nicht nur deren APIs
  • Starke Softwaretechnik: Tests, CI/CD, Packaging (pyproject.toml, uv), semantische Versionierung, Unterstützung mehrerer Python-Versionen
  • Komfortabel im Lesen und Arbeiten mit Modellcode - Vorwärtsdurchläufe, Checkpoint-Laden, Inferenzoptimierung - und Meinungen dazu bilden
  • Solide ML-Grundlagen: genug, um korrekte Vorverarbeitung zu schreiben, Datenleckagen zu erkennen und bei Designentscheidungen, die downstream brechen, zurückzuschieben
  • Echtes Interesse an der Entwicklererfahrung: Sie schreiben großartige Dokumentationen und Fehlermeldungen, weil Sie denken, dass sie Ingenieurarbeit sind, keine Aufgaben

Bonus:

  • Betreuer oder bedeutender Mitwirkender an einer beliebten Open-Source-ML/Datenbibliothek
  • Starke KI-Tooling-Fähigkeiten - Sie verwenden Claude Code, Cursor oder ähnliche Werkzeuge fließend, um schnell zu arbeiten
  • MCP-Server- oder Tool-Integrations-Erfahrung
  • Erfahrung in der HuggingFace Hub-Modellverteilung
  • Hintergrund in tabellarischen Daten, AutoML oder Zeitreihen
  • Erfahrung im Debuggen plattformübergreifender Pakete oder im Beitrag zum Kern von PyTorch/sklearn

Unsere Verpflichtungen: Wir glauben, dass die besten Produkte und Teams aus einer Vielzahl von Perspektiven, Erfahrungen und Hintergründen entstehen. Deshalb begrüßen wir Bewerbungen von Menschen aller Identitäten und Lebenswege, insbesondere von allen, die sich jemals durch "nicht alle Kästchen abhaken" entmutigt gefühlt haben. Wir verpflichten uns, ein sicheres, integratives Umfeld zu schaffen und Chancengleichheit unabhängig von Geschlecht, sexueller Orientierung, Herkunft, Behinderungen oder anderen Eigenschaften, die Sie ausmachen, zu bieten.

ML Engineer, Open Source Arbeitgeber: Prior Labs

Als Arbeitgeber bietet Prior Labs eine dynamische und innovative Arbeitsumgebung, in der offene Quellen im Mittelpunkt stehen. Mit einem hochqualifizierten Team von über 20 Ingenieuren und Forschern, das aus den besten Köpfen der Branche besteht, fördern wir eine Kultur des schnellen Schaffens und der hohen Standards. Unsere Mitarbeiter profitieren von umfangreichen Wachstums- und Entwicklungsmöglichkeiten sowie der Chance, an bahnbrechenden Projekten zu arbeiten, die die Zukunft der KI gestalten.
P

Kontaktperson:

Prior Labs HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: ML Engineer, Open Source

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe Coding-Challenges und sei bereit, deine Denkweise zu erklären. Wir haben Ressourcen, die dir dabei helfen können, also schau mal vorbei!

Tipp Nummer 3

Sei proaktiv und zeige dein Interesse! Wenn du eine Stelle siehst, die dir gefällt, zögere nicht, dich direkt über unsere Website zu bewerben. Wir lieben es, von motivierten Talenten zu hören!

Tipp Nummer 4

Mach dich mit unseren Projekten vertraut! Wenn du über unsere Technologien und Modelle Bescheid weißt, kannst du im Gespräch glänzen. Zeig uns, dass du wirklich an unserer Mission interessiert bist!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: ML Engineer, Open Source

Python-Paketentwicklung
PyTorch
scikit-learn
pandas
NumPy
Software Engineering
CI/CD
Testing
Dokumentation
Datenvorverarbeitung
Modelloptimierung
Entwicklung von APIs
Benchmarking
Entwicklererfahrung

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für das haben, was sie tun, also lass das in deinen Worten durchscheinen!

Mach es klar und präzise: Halte deine Bewerbung übersichtlich und auf den Punkt. Verwende klare Sprache und vermeide unnötigen Jargon. Wir wollen schnell verstehen, was du kannst und wie du zu unserem Team passt.

Zeig deine Erfahrungen: Erzähle uns von deinen bisherigen Projekten und Erfahrungen, besonders wenn sie mit Open Source oder ML zu tun haben. Wir lieben es, wenn du konkrete Beispiele bringst, die deine Fähigkeiten unter Beweis stellen!

Bewirb dich über unsere Website: Vergiss nicht, dich direkt über unsere Website zu bewerben! So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnellstmöglich prüfen können.

Wie du dich auf ein Vorstellungsgespräch bei Prior Labs vorbereitest

Verstehe die Grundlagen

Mach dich mit den Grundlagen von tabularen Modellen und den spezifischen Technologien, die in der Stellenbeschreibung erwähnt werden, vertraut. Zeige im Interview, dass du nicht nur die Theorie verstehst, sondern auch praktische Erfahrungen mit PyTorch, scikit-learn und anderen relevanten Tools hast.

Bereite konkrete Beispiele vor

Denke an konkrete Projekte oder Herausforderungen, die du in der Vergangenheit gemeistert hast. Sei bereit, diese zu erläutern und zu zeigen, wie deine Erfahrungen dich auf die Herausforderungen vorbereiten, die in dieser Rolle auf dich zukommen könnten.

Fragen stellen

Bereite einige durchdachte Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Position und hilft dir, mehr über die Unternehmenskultur und die Erwartungen an die Rolle zu erfahren. Fragen zur Teamdynamik oder zu aktuellen Projekten sind immer gut!

Zeige deine Leidenschaft für Open Source

Da das Unternehmen stark in der Open-Source-Community verwurzelt ist, solltest du deine eigene Leidenschaft und Erfahrungen in diesem Bereich betonen. Sprich über Beiträge, die du geleistet hast, oder über Projekte, die dir am Herzen liegen, um zu zeigen, dass du die Philosophie des Unternehmens teilst.

ML Engineer, Open Source
Prior Labs
Standort: Freiburg im Breisgau
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>