Freelance Agent Evaluation Engineer
Freelance Agent Evaluation Engineer

Freelance Agent Evaluation Engineer

Frankfurt am Main Freiberuflich 40 - 50 € / Stunde (geschätzt) Home Office möglich
Go Premium
Mindrift

Auf einen Blick

  • Aufgaben: Entwickle herausfordernde Aufgaben zur Bewertung von KI-Coding-Agenten in realistischen Umgebungen.
  • Arbeitgeber: Mindrift verbindet Spezialisten mit spannenden AI-Projekten führender Tech-Unternehmen.
  • Mitarbeitervorteile: Verdiene bis zu 50 $ pro Stunde, flexible Arbeitszeiten und projektbasierte Zusammenarbeit.
  • Andere Informationen: Teilzeit, nicht festangestellt, mit großartigen Möglichkeiten zur beruflichen Weiterentwicklung.
  • Warum dieser Job: Arbeite an innovativen Projekten und forme die Zukunft der KI-Entwicklung.
  • Gewünschte Qualifikationen: Erfahrung in Softwareentwicklung, insbesondere Python, und Kenntnisse in Testautomatisierung.

Das voraussichtliche Gehalt liegt zwischen 40 - 50 € pro Stunde.

Bitte reichen Sie Ihren Lebenslauf in Englisch ein und geben Sie Ihr Englischniveau an. Mindrift verbindet Spezialisten mit projektbasierten KI-Möglichkeiten für führende Technologieunternehmen, die sich auf das Testen, Bewerten und Verbessern von KI-Systemen konzentrieren. Die Teilnahme ist projektbasiert, keine Festanstellung.

Was diese Gelegenheit beinhaltet

  • Wir bauen einen Datensatz auf, um KI-Coding-Agenten zu bewerten - wie gut ein Modell reale Entwickleraufgaben bewältigt.
  • Sie erstellen herausfordernde Aufgaben und Bewertungskriterien innerhalb realistischer simulierter Umgebungen:
  • Erstellen Sie virtuelle Unternehmen gemäß einem übergeordneten Plan - Codebasis, Infrastruktur und Kontext (Gespräche, Dokumentation, Tickets), die eine realistische Umgebung mit Entwicklungsgeschichte bilden.
  • Stellen Sie Aufgaben aus Zwischenzuständen des virtuellen Unternehmens zusammen und kalibrieren Sie diese: Entwerfen Sie den Prompt, definieren Sie die Bewertungskriterien und stellen Sie sicher, dass die Aufgabe lösbar ist und die Bewertung fair ist.
  • Gestalten Sie Aufgaben in isolierten Umgebungen - Emulationen eines Entwicklerarbeitsplatzes: eine Linux-Maschine mit Entwicklungstools (Terminal, CLI), MCP-Servern (Repository, Aufgabenverfolger, Messenger, Dokumentation usw.) und einer echten Webanwendung-Codebasis.
  • Schreiben Sie Tests, die alle richtigen Lösungen akzeptieren und falsche ablehnen - weder zu streng (brechen bei gültigen Ansätzen) noch zu nachsichtig (bestehen bei schlechten).
  • Iterieren Sie mit einem KI-Agenten bei Tests - überprüfen Sie, ob sie echte Probleme erfassen, keine schlechten Lösungen übersehen und bei guten nicht brechen.
  • Überprüfen Sie den von Agenten geschriebenen Code, analysieren Sie, warum ein Agent gescheitert oder erfolgreich war, und entwerfen Sie Grenzfälle und gegnerische Szenarien.
  • Iterieren Sie basierend auf dem Feedback von Experten-QA-Überprüfern, die Ihre Arbeit anhand von Qualitätskriterien bewerten.

Was dies NICHT ist

  • Keine Datenkennzeichnung
  • Kein Prompt Engineering
  • Kein Schreiben von Code von Grund auf - der Agent schreibt den Großteil des Codes; Sie leiten und bewerten.

Ein wesentlicher Teil der Arbeit wird zusammen mit KI erledigt - es ist sehr schwierig, Aufgaben zu erstellen, die Grenzmodelle herausfordern, ohne Grenzmodelle zu verwenden.

Was wir suchen

Diese Gelegenheit eignet sich gut für erfahrene Entwickler, Software-Ingenieure und/oder Spezialisten für Testautomatisierung, die offen für Teilzeitprojekte sind. Idealerweise haben die Mitwirkenden:

  • Abschluss in Informatik, Softwaretechnik oder verwandten Bereichen
  • 5+ Jahre Erfahrung in der Softwareentwicklung, hauptsächlich in Python (FastAPI, pytest, async/await, Subprozess, Dateioperationen)
  • Hintergrund in der Full-Stack-Entwicklung, mit Erfahrung im Aufbau von React-basierten Schnittstellen (JavaScript/TypeScript) und robusten Backend-Systemen
  • Erfahrung im Schreiben von Tests (funktional, Integration - nicht nur deren Ausführung)
  • Docker-Container und Vertrautheit mit Infrastrukturtools (Postgres, Kafka, Redis)
  • CI/CD-Verständnis (GitHub Actions als Benutzer: Trigger, Labels, Ergebnisse lesen)
  • Englischkenntnisse - B2

Sie müssen kein Experte in jedem Punkt sein, aber Sie sollten sich wohlfühlen, Code über den gesamten Stack hinweg zu lesen und zu verstehen.

Warum das schwierig ist

  • Grenzmodelle sind bereits gut im Codieren. Eine Aufgabe zu erstellen, die die besten Modelle wirklich herausfordert, ist nicht trivial.
  • Sie müssen tief verstehen, wo Modelle scheitern und welche Szenarien den Unterschied zwischen einer guten und einer schlechten Lösung aufzeigen.
  • Aufgaben haben viele gültige Lösungen. Tests zu schreiben, die alle richtigen Lösungen akzeptieren und falsche ablehnen, ist schwieriger als es klingt.

Wie es funktioniert

  • Bewerben - Qualifikation(en) bestehen - Ein Projekt beitreten - Aufgaben abschließen - Bezahlt werden

Aufwandschätzung

Aufgaben für dieses Projekt werden auf 20 Stunden geschätzt, abhängig von der Komplexität. Dies ist eine Schätzung und keine Zeitvorgabe; Sie wählen, wann und wie Sie arbeiten. Aufgaben müssen bis zur Frist eingereicht werden und die aufgeführten Akzeptanzkriterien erfüllen, um akzeptiert zu werden.

Vergütung

In diesem Projekt können Mitwirkende bis zu 50 USD pro Stunde verdienen, abhängig von ihrem Niveau und Tempo der Beiträge. Die Vergütung variiert je nach Projekt, abhängig von Umfang, Komplexität und erforderlicher Expertise. Bitte beachten Sie, dass andere Projekte auf der Plattform unterschiedliche Verdienstniveaus basierend auf ihren Anforderungen anbieten können.

Freelance Agent Evaluation Engineer Arbeitgeber: Mindrift

Mindrift ist ein hervorragender Arbeitgeber, der Fachleuten die Möglichkeit bietet, an spannenden, projektbasierten KI-Möglichkeiten für führende Technologieunternehmen zu arbeiten. Mit einem flexiblen Arbeitsumfeld und der Chance, innovative Lösungen zu entwickeln, fördert Mindrift eine Kultur des kontinuierlichen Lernens und der Zusammenarbeit, während Mitarbeiter ihre Fähigkeiten in einem dynamischen und unterstützenden Team weiterentwickeln können.
Mindrift

Kontaktperson:

Mindrift HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Freelance Agent Evaluation Engineer

Tipp Nummer 1

Sei proaktiv! Warte nicht darauf, dass die Jobs zu dir kommen. Nutze Plattformen wie unsere, um direkt auf interessante Projekte zuzugreifen und dich zu bewerben. Je mehr du dich zeigst, desto höher sind deine Chancen!

Tipp Nummer 2

Netzwerken ist der Schlüssel! Verbinde dich mit anderen Fachleuten in deinem Bereich, sei es über LinkedIn oder lokale Meetups. Oft erfährt man von neuen Möglichkeiten durch persönliche Kontakte.

Tipp Nummer 3

Bereite dich auf Interviews vor! Informiere dich über die Projekte, an denen du interessiert bist, und über die Technologien, die sie verwenden. Zeige dein Wissen und deine Begeisterung für die Arbeit, die du machen möchtest.

Tipp Nummer 4

Nutze unser Bewerbungsportal! Wenn du dich über unsere Website bewirbst, hast du die besten Chancen, gesehen zu werden. Wir haben viele spannende Projekte, die auf talentierte Leute wie dich warten!

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Freelance Agent Evaluation Engineer

Analytische Fähigkeiten
Aufmerksamkeit für Details
Technisches Verständnis
Python (FastAPI, pytest, async/await, subprocess, Dateioperationen)
Full-Stack-Entwicklung
Erfahrung mit React-basierten Schnittstellen (JavaScript/TypeScript)
Testautomatisierung (funktionale und Integrationstests)
Docker-Container
Infrastrukturtools (Postgres, Kafka, Redis)
CI/CD-Verständnis (GitHub Actions)
Englischkenntnisse - B2
Problemlösungsfähigkeiten
Feedback-Iterationen
Erstellung von Bewertungskriterien

Tipps für deine Bewerbung 🫡

Mach deinen Lebenslauf klar und prägnant: Dein Lebenslauf sollte übersichtlich sein und alle relevanten Erfahrungen und Fähigkeiten hervorheben. Achte darauf, dass du deine Kenntnisse in Python und anderen Technologien klar darstellst, damit wir sofort sehen, was du drauf hast!

Englischkenntnisse angeben: Vergiss nicht, dein Englischniveau anzugeben! Da die Kommunikation auf Englisch stattfindet, ist es wichtig, dass wir wissen, wie gut du dich ausdrücken kannst. Ein B2-Niveau wäre ideal, also sei ehrlich!

Zeige deine Projekt-Erfahrungen: Wenn du an ähnlichen Projekten gearbeitet hast, erzähl uns davon! Wir lieben es, von deinen Erfahrungen zu hören, besonders wenn es um die Entwicklung und Evaluierung von AI-Systemen geht. Das gibt uns einen besseren Eindruck von deinem Können.

Bewirb dich über unsere Website: Der einfachste Weg, um Teil unseres Teams zu werden, ist, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell bei uns landet und wir sie zügig bearbeiten können!

Wie du dich auf ein Vorstellungsgespräch bei Mindrift vorbereitest

Verstehe die Anforderungen

Mach dich mit den spezifischen Anforderungen der Stelle vertraut. Lies die Jobbeschreibung gründlich durch und überlege dir, wie deine Erfahrungen und Fähigkeiten zu den geforderten Qualifikationen passen. So kannst du gezielt auf Fragen eingehen und deine Eignung unter Beweis stellen.

Bereite praktische Beispiele vor

Überlege dir konkrete Beispiele aus deiner bisherigen Arbeit, die zeigen, wie du Herausforderungen gemeistert hast. Besonders wichtig sind Erfahrungen im Bereich Softwareentwicklung und Testautomatisierung, da diese direkt relevant für die Position sind. Zeige, wie du Probleme gelöst und Tests geschrieben hast.

Sprich über deine Tools und Technologien

Sei bereit, über die Technologien zu sprechen, die du beherrschst, insbesondere Python, Docker und CI/CD-Tools. Erkläre, wie du diese in deinen Projekten eingesetzt hast und welche Ergebnisse du damit erzielt hast. Das zeigt dein technisches Verständnis und deine praktische Erfahrung.

Englischkenntnisse betonen

Da die Kommunikation in Englisch erfolgt, solltest du deine Sprachkenntnisse selbstbewusst präsentieren. Bereite dich darauf vor, technische Begriffe und Konzepte auf Englisch zu erklären. Das wird dir helfen, einen positiven Eindruck zu hinterlassen und deine Eignung für die internationale Zusammenarbeit zu unterstreichen.

Freelance Agent Evaluation Engineer
Mindrift
Standort: Frankfurt am Main
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>