Intelligent dokumentklassificering (ID)
Diarienummer | |
Koordinator | Qoorp AB |
Bidrag från Vinnova | 500 000 kronor |
Projektets löptid | maj 2016 - januari 2017 |
Status | Avslutat |
Viktiga resultat som projektet gav
Syftet med projektet var att bygga en prototyp av ett system för att utvinna affärsnyttig information ur dokument genom att applicera mer avancerad kunskap om en problemdomän. Vi utvecklade en fungerande prototyp som med minimal mänsklig hjälp kan återskapa en aktiebok genom att använda offentliga handlingar från Bolagsverket.
Långsiktiga effekter som förväntas
Som en bieffekt har vi utvecklat algoritmer för att raffinera data från Bolagsverket vilket dels gör att vi i högre grad än vad som är möjligt i konkurrerande system kan verifiera korrektheten i aktieböcker. Vi kan även detektera inmatningsfel gjorda av Bolagsverket eller vissa typer av felifyllningar av anmälningsblanketter. I vissa fall har det lett till att befintliga data hos Bolagsverket har korrigerats.
Upplägg och genomförande
Vi började med en analys av vilka typer av data som finns tillgängliga via API från Bolagsverket samt vilka data man kan beställa från Bolagsverket i form av skannade dokument. Vi analyserade dessa och utvecklade en metod för att sammanställa data och räkna ut värdet på vissa datapunkter som inte fanns tillgängliga direkt.