Automatisera skalbar data-validering genom LLMs och kausalanalys
Diarienummer | |
Koordinator | Validio AB |
Bidrag från Vinnova | 1 950 000 kronor |
Projektets löptid | maj 2024 - mars 2025 |
Status | Avslutat |
Utlysning | Banbrytande tekniklösningar |
Ansökningsomgång | Banbrytande och skalbara tekniklösningar 2024 |
Viktiga resultat som projektet gav
Projektet uppnådde i stor utsträckning sina mål genom betydande framsteg inom automatiserad datakvalitetsövervakning. Bland resultaten finns förbättrade ML-modeller för träffsäker avvikelsedetektering och förenklade arbetsflöden genom “one-click” setup som effektiviserar implementationen av datakvalitetskontroller och stärker datans tillförlitlighet. Vidare utvecklades optimerad kod för djupare rotorsaksanalys och nya LLM-baserade metoder för avvikelsedetektering och prognoser.
Långsiktiga effekter som förväntas
Projektet bidrar långsiktigt till att demokratisera hanteringen av datakvalitet och göra den tillgänglig för en mer diversifierad användargrupp. Det främjar hållbarhet genom att identifiera och avlägsna felaktig och oanvänd data, vilket minskar behovet av lagring och beräkningsresurser samt reducerar koldioxidutsläpp. Projektet stärker datans tillförlitlighet, minskar fördomar och bidrar till mer rättvisa datadrivna beslut (FN:s SDG 5, 10, 12, 13) samtidigt som Validios position inom AI stärks.
Upplägg och genomförande
Projektet bedrevs under tio månader och organiserades i fem arbetspaket: AI/LLM-forskning, integration, UX, testning och projektledning. Initialt fokuserade projektet på anpassade LLM:er för automatisk uppsättning och rotorsaksanalys, men justerades efter återkoppling från pilotfasen. Arbetet omfattade optimering av befintliga ML-modeller för avvikelsedetektering, förbättrade användarflöden samt vidareutveckling av LLM:er. Resursinsatsen ökade i slutfasen.