Freelance AI Evaluation Engineer (Python/Full-Stack)
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.
What this opportunity involves
You’ll create challenging coding test cases that push AI coding systems to their limits:
- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
- Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
- Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
- Analyze AI failures to understand what the model struggles with vs. what it masters
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria
What we look for
This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:
- Degree in Computer Science, Software Engineering or related fields
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
- Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
- Experience writing tests (functional, integration – not just running them)
- Docker containers (running evaluations locally in containers)
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
- English proficiency - B2
How it works
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid
Effort estimate
Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Compensation
On this project, contributors can earn up to $50 per hour equivalent , depending on their level and pace of contribution.
Compensation varies across projects depending on scope, complexity, and required expertise. Please note that other projects on the platform may offer different earning levels based on their requirements.
Empfohlene Jobs
Steuerspezialist (m/w/d) Stuttgart HPJB1_DE
Wir bei HWS glauben daran, dass sich unser Erfolg, auch, wenn er durch Zahlen belegbar ist, letzten Endes an den Menschen misst, mit denen wir zusammenarbeiten! Unser HWS Prinzip aus Verstehen, Kümmer…
Controller (m/w/d)
Sie sind analytisch stark und bereit für den nächsten Karriereschritt? Dann haben wir genau die richtige Position im Bereich Controlling für Sie! Für unseren Kunden im Raum Stuttgart suchen wir, die…
Koch (m/w/d)
WAS WIR DIR BIETEN Unbefristeter Arbeitsvertrag : Einmal dabei, immer dabei! Kein Stress mit befristeten Verträgen Planbare Arbeitszeiten von Montag bis Sonntag Arbeitskleidung inklusive …
IT-Transition Manager (m/w/d) - Ingenieur, Projektmanagement
Deine Aufgaben: Du unterstützt unsere Kunden beratend und operativ bei IT-Großprojekten. Darunter können folgende Aufgaben sein: Du unterstützt unsere Kunden beratend und operativ bei IT-Großpr…
Facharzt Kinder- und Jugendmedizin (m/w/d)
Facharzt Kinder- und Jugendmedizin (m/w/d) Im Auftrag unseres Kunden, ein akademisches Lehrkrankenhaus, suchen wir einen im Großraum Stuttgart. Das Angebot: Spannende Tätigkeit als Facharzt …
Sachbearbeiter - Einkauf (m/w/d)
Wir suchen zum nächstmöglichen Zeitpunkt Sie als Sachbearbeiter - Einkauf (m/w/d) in Stuttgart zur Unterstützung unseres Teams. Diese Vorteile erwarten Sie bei Tempton unbefristetes Arbeitsverhältni…
IT Experte / Netzwerk / Cisco (m/w/d)
Unser Mandant ist einer der führenden IT-Dienstleister in Deutschland für Informationstechnologie und DataCenter Infrastruktur. Flexibel und herstellerübergreifend berät unser Mandant seit mehreren…
IT-Senior Systemadministrator (m/w/d)
Flexible Arbeitszeiten und mobiles Arbeiten Zahlreiche Benefits FIRMENPROFIL: Unser Business Partner bietet Ihnen eine spannende und herausfordernde Tätigkeit in einem dynamischen Unterneh…
Erzieher/-in städtische Schülerhäuser und Grundschulen (m/w/d)
Erzieher/-in städtische Schülerhäuser und Grundschulen (m/w/d) Wir suchen Sie für das Jugendamt der Landeshauptstadt Stuttgart. Die Stellen sind unbefristet zu besetzen. Das Jugendamt der Landes…
(Senior) Consultant / Projektmanager Variantenkonfiguration / SAP AVC / IPC / LO-VC (m/w/d)
Stellenbeschreibung Um den wachsenden und vielfältigen Kundenanforderungen Rechnung tragen zu können, suchen wir für unseren Mandanten einen erfahrenen SAP AVC/IPC/LO-VC Consultant. Die Proj…