ML Engineer, Open Source

ML Engineer, Open Source

Berlin Vollzeit 60000 - 80000 € / Jahr (geschätzt) Home Office möglich (teilweise)
Go Premium
P

Auf einen Blick

  • Aufgaben: Entwickle innovative APIs für tabellarische KI-Modelle und löse komplexe technische Herausforderungen.
  • Arbeitgeber: Führendes Unternehmen im Bereich strukturierte Daten-Maschinenlernen mit offener Kultur.
  • Mitarbeitervorteile: Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten, Remote-Arbeit und Weiterbildungsmöglichkeiten.
  • Warum dieser Job: Sei Teil eines revolutionären Teams, das die Zukunft der KI mitgestaltet.
  • Gewünschte Qualifikationen: Erfahrung in Python-Paketen und tiefes Verständnis von ML-Bibliotheken erforderlich.
  • Andere Informationen: Dynamisches Umfeld mit großartigen Karrierechancen und einem inklusiven Team.

Das voraussichtliche Gehalt liegt zwischen 60000 - 80000 € pro Jahr.

Wer wir sind: Foundation-Modelle haben Text und Bilder transformiert, aber strukturierte Daten - die größte und bedeutendste Datenmodalität der Welt - sind unberührt geblieben. Tabellen steuern jede klinische Studie, jedes Finanzmodell, jedes wissenschaftliche Experiment und jede Geschäftsentscheidung. Niemand hat ein Foundation-Modell entwickelt, das sie wirklich versteht. Bis jetzt. Was LLMs für Sprache getan haben, tun wir für Tabellen.

Momentum: Wir haben tabellarische Foundation-Modelle pioniert und sind nun die weltweit führende Organisation im Bereich strukturierte Daten-ML. Unser TabPFN v2-Modell wurde in Nature veröffentlicht und hat einen neuen Stand der Technik für tabellarisches maschinelles Lernen gesetzt. Seit seiner Veröffentlichung haben wir die Modellfähigkeiten um mehr als das 20-fache skaliert, über 3 Millionen Downloads erreicht, 6.000+ GitHub-Sterne erhalten und sehen eine beschleunigte Akzeptanz in Forschung und Industrie - von der Erkennung von Lungenerkrankungen mit Oxford Cancer Analytics bis zur Verhinderung von Zugausfällen mit Hitachi und der Verbesserung von Entscheidungen in klinischen Studien mit BostonGene.

Die schwierigste Arbeit liegt vor uns. Wir skalieren tabellarische Foundation-Modelle, um Millionen von Zeilen, Tausende von Merkmalen, Echtzeitinferenz und völlig neue Datenmodalitäten zu bewältigen - während wir die Infrastruktur aufbauen, um sie in Produktion in einigen der anspruchsvollsten Branchen der Welt einzusetzen. Dies sind offene Probleme, an denen sonst niemand auf diesem Niveau arbeitet.

Unser Team: Wir sind ein kleines, hochselektives Team von über 20 Ingenieuren und Forschern, ausgewählt aus über 5.000 Bewerbungen, mit Hintergründen von Google, Apple, Amazon, Microsoft, G-Research, Jane Street, Goldman Sachs und CERN, geleitet von Frank Hutter, Noah Hollmann und Sauraj Gambhir und beraten von weltweit führenden KI-Forschern wie Bernhard Schölkopf und Turing-Preisträger Yann LeCun. Wir liefern schnell, schaffen erstklassige Forschung und halten uns gegenseitig an einen extrem hohen Standard.

Was kommt als Nächstes: Im Jahr 2025 haben wir 9 Millionen Euro Pre-Seed von Balderton Capital gesammelt, unterstützt von Führungspersönlichkeiten von Hugging Face, DeepMind und Black Forest Labs. Der nächste Modalitätswechsel in der KI findet statt - und wir stellen das Team ein, das es möglich macht.

Über die Rolle: Die meisten Unternehmen betrachten Open Source als Nebenjob für Forscher, die lieber etwas anderes tun würden. Wir denken, dass das falsch ist. Prior Labs ist in Open Source verwurzelt - TabPFN begann als Forschungsprojekt, das von der Community übernommen wurde, und so wurden wir zu einem Unternehmen.

Sprachmodelle und Bildmodelle hatten Jahre Zeit, um ihre Ökosystem-Schnittstellen und Integrationen auszubauen. Für tabellarische Foundation-Modelle existiert das noch nicht. Sie stecken nicht in bestehenden Mustern fest - Sie schaffen sie. Das Engineering ist wirklich schwierig: TabPFN macht In-Context-Learning, nicht traditionelles Fit/Predict, sodass es bedeutet, Probleme zu lösen, die keine andere Bibliothek gelöst hat. Sie entwerfen APIs für ein Modell, dessen Architektur sich schneller weiterentwickelt, als Benutzer aktualisieren können, und machen die Inferenz robust gegenüber dem vollen Chaos realer tabellarischer Daten. Sie verstehen das Modell tief genug, um zurückzudrängen, wenn etwas downstream kaputtgehen wird, und Sie kümmern sich genug um die Details, um großartige Dokumentationen und Fehlermeldungen über großartigem Code zu schreiben.

Woran Sie arbeiten werden:

  • Entwurf von sklearn-kompatiblen APIs rund um ein Foundation-Modell, das sich nicht wie ein traditioneller Schätzer verhält - lösen Sie die schwierigen Abstraktionsprobleme, damit die Schnittstelle einfach erscheint
  • Aufbau und Wartung der PyTorch-Serialisierung, HuggingFace Hub-Modellverteilung und Checkpoint-Management über ein Multi-Modell-, Multi-Version-Ökosystem
  • Erstellung von MCP- und Tool-Wrappern für agentische KI-Pipelines
  • Modellnahe ML-Engineering: Vorverarbeitungspipelines, Inferenz-Wrapper, dtype-Verwaltung, Edge-Case-Härtung gegen reale Daten
  • Verantwortung für Releases, CI, Tests und Dokumentation im gesamten TabPFN-Ökosystem - TabPFN (Kern), tabpfn-client, tabpfn-extensions, tabpfn-time-series
  • Allgemeines ML-Engineering: Benchmarking, Evaluierungspipelines, Datenladen, Werkzeuge, die das Team schneller machen

Sie könnten gut passen, wenn Sie:

  • Über 3 Jahre Erfahrung im Aufbau und in der Wartung von Python-Paketen oder ML-Bibliotheken haben, die von anderen verwendet werden (starker Open-Source-Hintergrund bevorzugt)
  • Tiefe Kenntnisse in PyTorch, scikit-learn, pandas, NumPy - deren Interna, Erweiterungspunkte und Fehlerquellen, nicht nur deren APIs
  • Starke Softwaretechnik: Testing, CI/CD, Packaging (pyproject.toml, uv), semantische Versionierung, Unterstützung mehrerer Python-Versionen
  • Komfortabel im Lesen und Arbeiten mit Modellcode - Vorwärtsdurchläufe, Checkpoint-Laden, Inferenzoptimierung - und Meinungen dazu bilden
  • Solide ML-Grundlagen: genug, um korrekte Vorverarbeitung zu schreiben, Datenleckagen zu erkennen und bei Designentscheidungen, die downstream brechen, zurückzudrängen
  • Echtes Interesse an der Entwicklererfahrung: Sie schreiben großartige Dokumentationen und Fehlermeldungen, weil Sie denken, dass sie Ingenieurarbeit sind, keine Aufgaben

Bonus:

  • Betreuer oder bedeutender Mitwirkender an einer beliebten Open-Source-ML/Datenbibliothek
  • Starke KI-Tool-Fähigkeiten - Sie verwenden Claude Code, Cursor oder ähnliche Werkzeuge fließend, um schnell zu arbeiten
  • MCP-Server- oder Tool-Integrations-Erfahrung
  • Erfahrung in der HuggingFace Hub-Modellverteilung
  • Hintergrund in tabellarischen Daten, AutoML oder Zeitreihen
  • Erfahrung im Debuggen plattformübergreifender Pakete oder im Beitrag zum Kern von PyTorch/sklearn

Unsere Verpflichtungen: Wir glauben, dass die besten Produkte und Teams aus einer Vielzahl von Perspektiven, Erfahrungen und Hintergründen entstehen. Deshalb begrüßen wir Bewerbungen von Menschen aller Identitäten und Lebenswege, insbesondere von allen, die sich jemals durch "nicht alle Kästchen abhaken" entmutigt gefühlt haben. Wir verpflichten uns, ein sicheres, integratives Umfeld zu schaffen und Chancengleichheit unabhängig von Geschlecht, sexueller Orientierung, Herkunft, Behinderungen oder anderen Eigenschaften, die Sie ausmachen, zu bieten.

ML Engineer, Open Source Arbeitgeber: Prior Labs

Prior Labs ist ein herausragender Arbeitgeber, der eine dynamische und inklusive Arbeitsumgebung bietet, in der Innovation und Teamarbeit im Mittelpunkt stehen. Mit einem starken Fokus auf Open Source und einer hochqualifizierten, selektiven Gruppe von Fachleuten aus führenden Unternehmen der Branche, fördern wir kontinuierliches Lernen und persönliche Entwicklung. Unsere Mitarbeiter profitieren von flexiblen Arbeitsbedingungen, der Möglichkeit, an bahnbrechenden Projekten zu arbeiten, und einer Kultur, die Vielfalt und Kreativität schätzt.
P

Kontaktperson:

Prior Labs HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: ML Engineer, Open Source

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Fragen hast oder Unterstützung brauchst!

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe Coding-Challenges und sei bereit, deine Denkweise zu erklären. Wir haben Ressourcen, die dir dabei helfen können, also schau mal vorbei!

Tipp Nummer 3

Sei proaktiv und zeige dein Interesse! Wenn du eine Stelle siehst, die dir gefällt, zögere nicht, dich direkt über unsere Website zu bewerben. Wir lieben es, von motivierten Talenten zu hören!

Tipp Nummer 4

Mach dich mit unseren Projekten vertraut! Wenn du über unsere Technologien und Modelle Bescheid weißt, kannst du im Gespräch glänzen. Zeig uns, dass du wirklich an unserer Mission interessiert bist!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: ML Engineer, Open Source

Python-Paketentwicklung
PyTorch
scikit-learn
pandas
NumPy
Software Engineering
CI/CD
Testing
Dokumentation
Datenvorverarbeitung
Modelloptimierung
Entwicklung von APIs
Benchmarking
Entwicklung von Evaluierungspipelines
Entwicklung von Werkzeugen zur Effizienzsteigerung

Tipps für deine Bewerbung 🫡

Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für das haben, was sie tun, also lass das in deinen Worten durchscheinen!

Mach es klar und präzise: Halte deine Bewerbung übersichtlich und auf den Punkt. Verwende klare Sprache und vermeide unnötigen Jargon. Wir wollen schnell verstehen, was du kannst und wie du zu unserem Team passt.

Zeig deine Erfahrungen: Erzähle uns von deinen bisherigen Projekten und Erfahrungen, besonders wenn sie mit Open Source oder ML zu tun haben. Wir lieben es, von deinen Erfolgen zu hören und wie du Herausforderungen gemeistert hast!

Bewirb dich über unsere Website: Der einfachste Weg, um Teil unseres Teams zu werden, ist, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung an die richtige Stelle gelangt und wir sie schnell sehen können!

Wie du dich auf ein Vorstellungsgespräch bei Prior Labs vorbereitest

Verstehe die Grundlagen

Mach dich mit den Grundlagen von tabularen Daten und den spezifischen Herausforderungen, die sie mit sich bringen, vertraut. Zeige im Interview, dass du die Unterschiede zwischen traditionellen ML-Modellen und den Anforderungen an tabulare Foundation-Modelle verstehst.

Praktische Beispiele vorbereiten

Bereite konkrete Beispiele aus deiner bisherigen Arbeit vor, die deine Erfahrung mit Python-Paketen und ML-Bibliotheken zeigen. Sei bereit, über spezifische Probleme zu sprechen, die du gelöst hast, und wie du dabei vorgegangen bist.

Fragen zur Entwicklererfahrung stellen

Zeige dein Interesse an der Entwicklererfahrung, indem du Fragen stellst, die auf die Dokumentation, Fehlerbehandlung und die Benutzerfreundlichkeit der APIs abzielen. Das zeigt, dass du nicht nur an der Technik interessiert bist, sondern auch daran, wie andere Entwickler damit arbeiten.

Bleib auf dem Laufenden

Informiere dich über aktuelle Trends und Entwicklungen im Bereich der tabularen ML-Modelle und Open Source. Erwähne im Interview, welche neuen Technologien oder Ansätze du spannend findest und wie du sie in deine Arbeit integrieren würdest.

ML Engineer, Open Source
Prior Labs
Standort: Berlin
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>