Process

Processen bakom
verifierad träningsdata

De flesta labeling-tjänster levererar volym. Vi levererar säkerhet. Här är exakt hur det går till — från rådata till ett dataset du faktiskt kan träna på.

Leverans inom 72h 92%+ agreement rate EU AI Act-redo
Steg1

Steg ett

Taxonomi & setup

Innan en enda datapunkt annoteras sätter vi upp grunden. Vi börjar med att förstå er domän, era modellmål och vad en korrekt label faktiskt innebär i er kontext.

Resultatet är ett annotationsprotokoll och en taxonomi — som ni äger. Det är navet som all verifiering sedan utgår ifrån.

Workshop med er domain lead och vårt team
Definition av labelklasser och edge cases
Gold standard-samples ni godkänner innan start
Annotationsguide på er domäns terminologi
Testomgång mot era samples — godkänd eller byts annotatör

Ni äger i slutet av steg 1

Annotationsprotokoll

Fullständig guide för hur varje labelklass definieras

Taxonomi

Strukturerat labelschema anpassat till er domän

Gold standard-set

Godkända exempelannoteringar som mätstocken

Steg2

Steg två

Valideringssnurran

Varje datapunkt processas av minst tre certifierade annotatörer oberoende av varandra. En konsensusalgoritm med kvalitetsvikter avgör preliminärt label.

Datapunkter med låg konsensus flaggas automatiskt och skickas till en domänexpert. Tröskeln sätter ni.

Rådata
A1
A2
A3
Konsensus
✓ Hög confidence → Leverans
⚡ Låg confidence → Expert

Annotatörsprofil

ML

Maria L.

Legal AI · Certifierad annotatör

97.3%

97.3%

Accuracy

14 820

Annoterade

Legal, NLP

Domäner

Kvalitetsvikt i konsensusalgoritmenHög

Annotatörer med högre historisk precision väger tyngre i konsensusberäkningen.

Steg3

Steg tre

Verifierad leverans

Ni får ett rent, annoterat dataset med confidence score per item, fullständig audit log och en kvalitetsrapport. Redo att träna på — och redo för audit.

Formaten anpassas till er MLOps-pipeline. Ni kan filtrera på confidence-nivå och prioritera manuell review på lågkonfidenta items.

JSONCSVJSONLHugging Face-formatCustom schema
dataset_delivery.json

{

"id": "item_00421",

"label": "limitation_of_liability",

"confidence": 0.94,

"annotators": ["A1","A2","A3"],

"consensus": "weighted_majority",

"expert_review": false,

"audit_ref": "log_2026_04_07_421"

}

Under utveckling

The Data Labelers Platform

Vi bygger ett verktyg som gör hela processen transparent i realtid — för annotatörer, domain experts och er som kund.

För annotatörer

Annotatörsdashboard

Certifierade annotatörer arbetar i ett strukturerat gränssnitt med realtidsfeedback på accuracy och kvalitetsvikt. Gamifierat för konsistens.

För er som kund

Kundportal

Följ progress i realtid, se confidence-fördelning per batch, granska eskalerade items och exportera audit trail — direkt i gränssnittet.

För domain experts

Expert-queue

Domänexperter hanterar eskalerade datapunkter i en dedikerad kö med full kontext — annotationshistorik, konfliktanalys och protokoll.

Tidig access

Pilotkunderna är de första som får tillgång till plattformen när den lanseras.

Boka pilotsamtal →

Redo att se processen i praktiken?

Piloten är designad för att vara låg risk: fast pris, avgränsat scope, tydliga leverabler. Vi sätter upp taxonomi, kör en batch och levererar med confidence score och audit trail.