Auf einen Blick
- Aufgaben: Entwickle ML-Pipelines für die Verarbeitung von Millionen von PDFs und verbessere die Suchergebnisse.
- Arbeitgeber: Innovatives Unternehmen, das an der Spitze der B2B-Inhaltskatalogisierung steht.
- Mitarbeitervorteile: Flexibles Remote-Arbeiten, wettbewerbsfähige Vergütung und spannende Projekte.
- Warum dieser Job: Gestalte die Zukunft der semantischen Suche und mache echten Einfluss auf Inhalte.
- Gewünschte Qualifikationen: Erfahrung in ML-Pipelines und Leidenschaft für unstrukturierte Daten.
- Andere Informationen: Dynamisches Team mit großartigen Wachstums- und Lernmöglichkeiten.
Das voraussichtliche Gehalt liegt zwischen 36000 - 60000 € pro Jahr.
INFUSE verpflichtet sich zur Einhaltung der geltenden Datenschutz- und Sicherheitsgesetze und -vorschriften. INKHUB verarbeitet 10 Millionen Roh-PDFs, um das reichhaltigste Katalog von Marketing-B2B-Inhalten im Internet aufzubauen – getaggt, zusammengefasst und nach Thema, Unternehmen oder Absicht durchsuchbar. Wir suchen einen angewandten ML-Ingenieur, der die semantische Ingestionspipeline von Roh-PDFs zu getaggten, zusammengefassten und eingebetteten Assets verantwortet.
Was Sie tun werden:
- Besitzen Sie die ETL-Pipeline von Roh-PDFs (S3-ingestiert) zu strukturierten Ressourcen
- Finalisieren Sie unseren Zusammenfassungs- und Klassifizierungsfluss mit Open-Source-Modellen mit GPT-4o-Fallback
- Wenden Sie Filterlogik an (≤3 Jahre alt, ≤100 Seiten usw.), um die Ressourcenqualität sicherzustellen
- Ordnen Sie jedes Asset der spezifischen Themen-Taxonomie zu (10+ pro Thema über ~9.000 Themen)
- Generieren Sie dichte Einbettungen mit Satz-Transformatoren
- Laden und Abfragen von Einbettungen mit Milvus oder pgvector
- Implementieren Sie „Frische“-Logik, um nur neue oder aktualisierte Inhalte basierend auf Dateidifferenzierung, Crawl-Zeitstempel oder Dokumenten-Hash zu identifizieren und zu indizieren
- Bauen Sie ein QA/Evaluierungs-Harness: Formatkonformität, Driftüberwachung
- Exponieren Sie /v1/semantic-search über FastAPI mit Filterung und Rangfusion
- Arbeiten Sie eng mit unserem technischen Leiter an der UX-Integration und der Snippet-Generierung zusammen
Ihr Werkzeugkasten:
- Python, PyTorch, Satz-Transformatoren, OpenAI APIs oder ähnliche vortrainierte LLMs
- FastAPI, Milvus oder pgvector, PyPDF/Tika, Airflow oder Lambda für Orchestrierung
- Docker, GPU-Planung, Athena/Redshift SQL
Sie könnten passen, wenn…
- Sie ML-Pipelines erstellt haben, die echte Benutzer berührt haben, nicht nur Notizbücher
- Sie an semantischer Suche, Einbettungen oder großangelegtem Tagging gearbeitet haben
- Sie mit unstrukturierten Daten gekämpft haben und es lieben, Chaos in Klarheit zu verwandeln
- Sie gerne schnell arbeiten, mit Feedback iterieren und wichtige Metriken verfolgen
Warum diese Rolle wichtig ist:
Ihre Modelle entscheiden, was gefunden wird, wie es getaggt wird und welche Inhalte und Unternehmen herausstechen. Sie helfen dabei, zu definieren, was „Relevanz“ und „Frische“ für über eine Million Ressourcen und 50.000+ Unternehmensseiten bedeutet – und stellen sicher, dass INKHUB der Kurve voraus bleibt.
Senioritätsgrad: Einstiegslevel
Beschäftigungsart: Vertrag
Berufsbereich: Bau, Softwareentwicklung und IT-Dienstleistungen sowie IT-Beratung
Empfehlungen erhöhen Ihre Chancen auf ein Vorstellungsgespräch bei INFUSE um das Doppelte.
Semantic Backend Engineer (Contract, Remote) Arbeitgeber: INFUSE
Kontaktperson:
INFUSE HR Team
StudySmarter Bewerbungstipps 🤫
So bekommst du den Job: Semantic Backend Engineer (Contract, Remote)
✨Tipp Nummer 1
Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Leuten aus der Branche in Kontakt zu treten. Frag nach informellen Gesprächen oder Mentoring – oft sind die besten Jobs nicht ausgeschrieben!
✨Tipp Nummer 2
Bereite dich auf technische Interviews vor! Übe Coding-Challenges und sei bereit, deine Projekte zu präsentieren. Zeig, dass du nicht nur die Theorie kennst, sondern auch praktische Erfahrungen hast.
✨Tipp Nummer 3
Sei proaktiv und bewirb dich direkt über unsere Website! Das zeigt dein Interesse und Engagement. Außerdem kannst du sicherstellen, dass deine Bewerbung die richtige Aufmerksamkeit bekommt.
✨Tipp Nummer 4
Mach dir Gedanken über deine persönliche Marke! Teile relevante Inhalte auf sozialen Medien oder schreibe Blogbeiträge über deine Erfahrungen im Bereich ML und semantische Suche. So hebst du dich von anderen Bewerbern ab.
Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Semantic Backend Engineer (Contract, Remote)
Tipps für deine Bewerbung 🫡
Sei du selbst!: Wenn du deine Bewerbung schreibst, sei authentisch und zeig uns, wer du wirklich bist. Wir suchen nach Menschen, die Leidenschaft für ihre Arbeit haben und das auch in ihren Unterlagen zeigen.
Pass auf die Details auf!: Achte darauf, dass deine Bewerbung gut strukturiert und fehlerfrei ist. Ein klarer und präziser Text macht einen besseren Eindruck und zeigt, dass du dir Mühe gibst. Lass uns nicht im Dunkeln tappen!
Zeig deine Erfahrungen!: Erzähle uns von deinen bisherigen Projekten und wie sie zu der Rolle passen, für die du dich bewirbst. Wir wollen sehen, dass du praktische Erfahrungen hast, die du in unsere Arbeit einbringen kannst.
Bewirb dich über unsere Website!: Um sicherzustellen, dass wir deine Bewerbung schnell und effizient bearbeiten können, bewirb dich bitte direkt über unsere Website. So bist du auf der sicheren Seite und wir können dich besser kennenlernen!
Wie du dich auf ein Vorstellungsgespräch bei INFUSE vorbereitest
✨Verstehe die Technologie
Mach dich mit den Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie Python, PyTorch und FastAPI. Zeige im Interview, dass du nicht nur die Grundlagen kennst, sondern auch praktische Erfahrungen mit diesen Tools hast.
✨Bereite konkrete Beispiele vor
Denke an spezifische Projekte oder Erfahrungen, bei denen du ML-Pipelines oder semantische Suchtechnologien implementiert hast. Sei bereit, diese Beispiele zu erläutern und zu zeigen, wie du Herausforderungen gemeistert hast.
✨Fragen stellen
Bereite einige Fragen vor, die du dem Interviewer stellen kannst. Das zeigt dein Interesse an der Rolle und hilft dir, mehr über die Unternehmenskultur und die Erwartungen zu erfahren. Frage zum Beispiel nach den aktuellen Herausforderungen im Team oder wie Erfolg in dieser Position gemessen wird.
✨Zeige deine Leidenschaft für Daten
Betone deine Begeisterung für die Arbeit mit unstrukturierten Daten und wie du Chaos in Klarheit verwandeln kannst. Teile deine Gedanken darüber, was 'Relevanz' und 'Frische' für dich bedeuten und wie du diese Konzepte in deiner Arbeit umsetzen würdest.