ML Engineer, Open Source

ML Engineer, Open Source

Freiburg im Breisgau Vollzeit 60000 - 80000 € / Jahr (geschätzt) Homeoffice (teilweise)
P

Auf einen Blick

  • Aufgaben: Entwickeln Sie sklearn-kompatible APIs und verwalten Sie PyTorch-Serialisierung für TabPFN.
  • Unternehmen: Prior Labs ist führend in der Entwicklung von tabularen Foundation-Modellen mit über 3 Millionen Downloads.
  • Vorteile: Arbeiten Sie in einem kleinen, hochqualifizierten Team mit Zugang zu Weltklasse-Forschern und einer inklusiven Kultur.
  • Weitere Informationen: Das Unternehmen hat kürzlich 9 Millionen Euro in einer Pre-Seed-Runde gesammelt.
  • Warum dieser Job: Seien Sie Teil eines Teams, das an der Spitze der KI-Entwicklung für strukturierte Daten steht.
  • Qualifikationen: Mindestens 3 Jahre Erfahrung in der Entwicklung von Python-Paketen oder ML-Bibliotheken, vorzugsweise Open Source.

Das prognostizierte Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wer wir sind

Foundation-Modelle haben Text und Bilder transformiert, aber strukturierte Daten - die größte und bedeutendste Datenmodality der Welt - sind unberührt geblieben. Tabellen steuern jede klinische Studie, jedes Finanzmodell, jedes wissenschaftliche Experiment und jede Geschäftsentscheidung. Niemand hat ein Foundation-Modell entwickelt, das sie wirklich versteht. Bis jetzt. Was LLMs für Sprache getan haben, tun wir für Tabellen. Der nächste Modality-Shift in der KI findet statt - und wir stellen das Team ein, das es möglich macht.

Momentum

Wir haben tabellarische Foundation-Modelle pioniert und sind nun die weltweit führende Organisation im Bereich strukturierte Daten-ML. Unser TabPFN v2-Modell wurde in Nature veröffentlicht und hat einen neuen Stand der Technik für tabellarisches maschinelles Lernen gesetzt. Seit seiner Veröffentlichung haben wir die Modellfähigkeiten um mehr als 20x skaliert, über 3 Millionen Downloads erreicht, 6.000+ GitHub-Sterne erhalten und sehen eine beschleunigte Akzeptanz in Forschung und Industrie - von der Erkennung von Lungenerkrankungen mit Oxford Cancer Analytics bis zur Verhinderung von Zugausfällen mit Hitachi und der Verbesserung von Entscheidungen in klinischen Studien mit BostonGene. Die schwierigste Arbeit liegt vor uns. Wir skalieren tabellarische Foundation-Modelle, um Millionen von Zeilen, Tausende von Merkmalen, Echtzeitinferenz und völlig neue Datenmodalitäten zu bewältigen - während wir die Infrastruktur aufbauen, um sie in Produktion in einigen der anspruchsvollsten Branchen der Erde einzusetzen. Dies sind offene Probleme, an denen sonst niemand auf diesem Niveau arbeitet.

Unser Team

Wir sind ein kleines, hochselektives Team von über 20 Ingenieuren, Forschern und GTM-Spezialisten, ausgewählt aus über 5.000 Bewerbungen, mit Hintergründen von Google, Apple, Amazon, Microsoft, G-Research, Jane Street, Goldman Sachs und CERN, geleitet von Frank Hutter, Noah Hollmann und Sauraj Gambhir und beraten von weltweit führenden KI-Forschern wie Bernhard Schölkopf und Turing-Preisträger Yann LeCun. Wir liefern schnell, erstellen erstklassige Forschung und halten uns gegenseitig an einen extrem hohen Standard.

Was kommt als Nächstes

Im Jahr 2025 haben wir 9 Millionen Euro Pre-Seed von Balderton Capital gesammelt, unterstützt von Führungspersönlichkeiten von Hugging Face, DeepMind und Black Forest Labs. Die nächste Wachstumsphase ist hier, was dies zu einem optimalen Zeitpunkt macht, um beizutreten.

Über die Rolle

Die meisten Unternehmen betrachten Open Source als Nebenjob für Forscher, die lieber etwas anderes tun würden. Wir denken, dass das falsch ist. Prior Labs ist in Open Source verwurzelt - TabPFN begann als Forschungsprojekt, das von der Community übernommen wurde, und so wurden wir zu einem Unternehmen. Sprachmodelle und Bildmodelle hatten Jahre Zeit, um ihre Ökosystem-Schnittstellen und Integrationen auszubauen. Für tabellarische Foundation-Modelle existiert das noch nicht. Sie stecken nicht in bestehenden Mustern fest - Sie schaffen sie. Die Technik ist wirklich schwierig: TabPFN führt In-Context-Lernen durch, nicht traditionelles Fit/Predict, sodass es bedeutet, Probleme zu lösen, die keine andere Bibliothek gelöst hat. Sie entwerfen APIs für ein Modell, dessen Architektur sich schneller weiterentwickelt, als Benutzer aktualisieren können, und machen die Inferenz robust gegenüber dem vollen Chaos realer tabellarischer Daten. Sie verstehen das Modell tief genug, um zurückzuschieben, wenn etwas downstream kaputt gehen wird, und Sie kümmern sich genug um die Details, um großartige Dokumentationen und Fehlermeldungen über großartigen Code zu schreiben.

Woran Sie arbeiten werden

  • Entwerfen von sklearn-kompatiblen APIs rund um ein Foundation-Modell, das sich nicht wie ein traditioneller Schätzer verhält - lösen Sie die schwierigen Abstraktionsprobleme, damit die Schnittstelle einfach erscheint
  • Aufbau und Wartung der PyTorch-Serialisierung, HuggingFace Hub-Modellverteilung und Checkpoint-Management über ein Multi-Modell-, Multi-Version-Ökosystem
  • Erstellen von MCP- und Tool-Wrappern für agentische KI-Pipelines
  • Modellnahe ML-Engineering: Vorverarbeitungs-Pipelines, Inferenz-Wrapper, dtype-Verwaltung, Edge-Case-Härtung gegen reale Daten
  • Verantwortung für Releases, CI, Tests und Dokumentation im gesamten TabPFN-Ökosystem - TabPFN (Kern), tabpfn-client, tabpfn-extensions, tabpfn-time-series
  • Allgemeines ML-Engineering: Benchmarking, Evaluierungspipelines, Datenladen, Werkzeuge, die das Team schneller machen

Sie könnten gut passen, wenn Sie

  • 3+ Jahre Erfahrung im Aufbau und in der Wartung von Python-Paketen oder ML-Bibliotheken haben, die von anderen verwendet werden (stark bevorzugte Open-Source-Erfahrung)
  • Tiefe Kenntnisse in PyTorch, scikit-learn, pandas, NumPy - deren Interna, Erweiterungspunkte und Fehlerarten, nicht nur deren APIs
  • Starke Softwaretechnik: Tests, CI/CD, Packaging (pyproject.toml, uv), semantische Versionierung, Unterstützung mehrerer Python-Versionen
  • Komfortabel im Lesen und Arbeiten mit Modellcode - Vorwärtsdurchläufe, Checkpoint-Laden, Inferenzoptimierung - und Meinungen dazu bilden
  • Solide ML-Grundlagen: genug, um korrekte Vorverarbeitung zu schreiben, Datenleckagen zu erkennen und bei Designentscheidungen, die downstream brechen, zurückzuschieben
  • Echtes Interesse an der Entwicklererfahrung: Sie schreiben großartige Dokumentationen und Fehlermeldungen, weil Sie denken, dass sie Ingenieurarbeit sind, keine Aufgaben

Bonus

  • Betreuer oder bedeutender Mitwirkender an einer beliebten Open-Source-ML/Datenbibliothek
  • Starke KI-Tooling-Fähigkeiten - Sie verwenden Claude Code, Cursor oder ähnliche Werkzeuge fließend, um schnell zu arbeiten
  • Erfahrung mit MCP-Server- oder Tool-Integrationen
  • Erfahrung mit HuggingFace Hub-Modellverteilung
  • Hintergrund in tabellarischen Daten, AutoML oder Zeitreihen
  • Erfahrung beim Debuggen plattformübergreifender Pakete oder beim Mitwirken am Kern von PyTorch/scikit-learn

Das Leben bei Prior Labs

Wir sind ein kleines, ehrgeiziges Team, das eines der schwierigsten Probleme in der KI löst, und wir fangen gerade erst an. Sie werden eng mit weltklasse Forschern und Entwicklern zusammenarbeiten, die sich leidenschaftlich für die Qualität ihres Handwerks, die Auswirkungen ihrer Arbeit und die Menschen, mit denen sie arbeiten, einsetzen. Wir bewegen uns schnell, denken rigoros und nehmen uns die Zeit, die Dinge richtig zu machen. Wenn Sie von schwierigen Problemen begeistert sind, von realen Auswirkungen motiviert werden und Teil des Aufbaus von etwas sein möchten, das wichtig ist, würden wir uns freuen, von Ihnen zu hören.

Unsere Verpflichtungen

Wir glauben, dass die besten Produkte und Teams aus einer Vielzahl von Perspektiven, Erfahrungen und Hintergründen entstehen. Deshalb begrüßen wir Bewerbungen von Menschen aller Identitäten und Lebenswege, insbesondere von Personen, die sich jemals durch "nicht alle Kästchen abhaken" entmutigt gefühlt haben. Wir setzen uns dafür ein, ein sicheres, integratives Umfeld zu schaffen und gleiche Chancen unabhängig von Geschlecht, sexueller Orientierung, Herkunft, Behinderung oder einem anderen Merkmal, das Sie ausmacht, zu bieten. Wir kümmern uns darum, wie Ihre Daten behandelt werden. Lesen Sie unsere Datenschutzrichtlinie für die Rekrutierung, um genau zu erfahren, was wir sammeln, warum und wie lange wir es aufbewahren.

ML Engineer, Open Source Arbeitgeber: PriorLabs

Prior Labs hat sich auf die Entwicklung von tabularen Foundation-Modellen spezialisiert und hat kürzlich 9 Millionen Euro in einer Pre-Seed-Runde gesammelt. Das Team besteht aus über 20 hochqualifizierten Ingenieuren und Forschern, die aus renommierten Unternehmen wie Google und Amazon stammen. Der Standort ist flexibel, was eine gute Work-Life-Balance ermöglicht.

P

Kontaktdaten:

PriorLabs Recruiting-Team

StudySmarter Expertenrat🤫

Wir sind der Meinung, dass Sie so ML Engineer, Open Source erhalten könnten

Engagier dich in Entwickler-Communities!

Lass uns mal ehrlich sein: In der Software-Entwicklung sind Netzwerke Gold wert! Tummel dich in GitHub-Projekten, nehme an lokalen Meetups oder Hackathons teil und vernetze dich mit anderen Entwicklern. So steigerst du nicht nur deine Sichtbarkeit, sondern lernst auch die neuesten Trends und Technologien kennen.

Zeig deine Fähigkeiten!

Erstelle ein Portfolio, das deine besten Projekte und Code-Examples zeigt. Nichts überzeugt mehr als ein praktischer Beweis deiner Skills. Das kann auch helfen, bei PriorLabs anzuklopfen, wenn du dich auf die Stelle als ML Engineer, Open Source bewirbst – so wissen sie gleich, was sie von dir erwarten können!

Nutze Jobplattformen speziell für Tech-Jobs!

Plattformen wie Stack Overflow Jobs oder AngelsList sind perfekte Orte, um Vollzeitstellen in der Software-Entwicklung zu finden. Hier sind viele tolle Unternehmen auf der Suche nach Talenten wie uns, also schau regelmäßig vorbei und bewirb dich direkt über die Website.

Such dir Mentoren und Feedback!

Hol dir Feedback von erfahrenen Entwicklern, die dir Tipps geben können, was Recruiter wirklich suchen. Ob über LinkedIn oder persönliche Kontakte: Menschen, die sich in der Branche auskennen, können enorm wertvoll sein, um dir zu helfen, dich optimal auf deine Bewerbung bei PriorLabs vorzubereiten!

Wir glauben, dass du diese Fähigkeiten brauchst, um ML Engineer, Open Source mit Bravour zu bestehen

Python-Paketentwicklung
PyTorch
scikit-learn
pandas
NumPy
Software Engineering
Testing

Einige Tipps für deine Bewerbung 🫡

Highlights deiner Coding-Skills:In der Software-Entwicklung kommt es auf konkrete Fähigkeiten an. Vergiss nicht, relevante Programmiersprachen und Frameworks in deinen Lebenslauf aufzunehmen. Zeig uns, was du kannst – vielleicht mit einem Link zu deinem GitHub-Profil oder einer Übersicht deiner Side Projects, die deine Programmierkenntnisse illustrieren.

Dokumentation deiner Erfolge:Gerade bei einer Vollzeitstelle in der Software-Entwicklung sind konkrete Ergebnisse Gold wert. Nenn uns Zahlen und Ergebnisse aus deinen vorherigen Projekten. Hast du den Code optimiert oder Systemfehler behoben? Solche Erfolge zeigen, dass du die Sprache der Entwickler sprichst und einen echten Mehrwert bringst.

Attraktive Projektbeschreibungen:Wenn du an Projekten gearbeitet hast, die hervorstechen, beschreibe sie ausführlich in deinem Lebenslauf. Was war das Problem, das du gelöst hast? Welche Technologien hast du eingesetzt? Das gibt uns einen klaren Einblick in deine Herangehensweise und Problemlösungsfähigkeiten.

Motivation zeigen:In deinem Anschreiben solltest du deine Motivation für die Stelle im Bereich Software-Entwicklung bei PriorLabs klar herausstellen. Warum sprichst gerade du die Anforderungen für diese Vollzeitrolle an? Mach deutlich, was dich an der Arbeit bei uns reizt und wie du über das rein Technische hinaus wachsen möchtest.

Wie man sich auf ein Vorstellungsgespräch bei PriorLabs vorbereitet

Technische Vorbereitung auf die Coding-Challenges

In der Software-Entwicklung sind technische Fragen oft ein zentraler Teil des Interviews. Macht euch mit Plattformen wie LeetCode oder HackerRank vertraut, um eure Problemlösungsfähigkeiten zu trainieren. Zeigt im Interview viel Selbstbewusstsein beim Erklären eurer Ansätze!

Das eigene Portfolio im besten Licht präsentieren

Stellt sicher, dass ihr ein aussagekräftiges Portfolio habt, das einige eurer besten Projekte zeigt. Seid bereit, darüber zu sprechen, was eure Rolle war, welche Technologien ihr verwendet habt und welche Herausforderungen es gab. Das gibt den Interviewern einen Einblick in eure praktische Erfahrung.

Teamfähigkeit und Kommunikation betonen

In einer Vollzeit-Position wird Kommunikation im Team sehr wichtig sein. Seid bereit, Beispiele aus der Vergangenheit zu teilen, in denen ihr effektiv im Team gearbeitet habt. Dies zeigt, dass ihr nicht nur technische Fähigkeiten habt, sondern auch gut ins Team passt.

Vorbereitung auf Fragen zur Software-Architektur

Bereitet euch darauf vor, Fragen zur Software-Architektur zu beantworten. Themen wie RESTful APIs, Microservices und Cloud-Architekturen können Teil eures Interviews sein. Zeigt euer Verständnis durch Diskussionen und Beispiele aus eurer bisherigen Arbeit oder Projekte.