GPT-SW3: en svensk basmodell för texthantering
Diarienummer | |
Koordinator | Lindholmen Science Park AB - AI Sweden |
Bidrag från Vinnova | 6 147 484 kronor |
Projektets löptid | september 2022 - september 2024 |
Status | Pågående |
Utlysning | AI - Spets och innovation |
Ansökningsomgång | Avancerad och innovativ AI |
Viktiga resultat som projektet gav
Syftet med projektet var att utvärdera GPT-SW3, en familj av svenska storskaliga språkmodeller, för att se hur den kan användas inom olika texthanteringsuppgifter i offentlig sektor och näringsliv. Målet att testa och validera modellerna i praktiska användningsfall har uppnåtts genom samarbeten med flera partners som har testat modellerna inom områden som sammanfattning, kategorisering och textgenerering. Resultaten har gett värdefulla insikter i modellernas potential och begränsningar.
Långsiktiga effekter som förväntas
Projektet har resulterat i en djupare förståelse för hur GPT-SW3 och den bakomliggande tekniken kan användas. Flera partners har identifierat potentiella användningsområden men också utmaningar såsom begränsad prestanda jämfört med andra modeller, rättsliga hinder och tekniska begränsningar. Projektet har därmed bidragit till kunskapsuppbyggnad kring storskaliga språkmodeller i Sverige och skapat förutsättningar för framtida utveckling och implementering av AI-teknik inom olika sektorer.
Upplägg och genomförande
Projektet genomfördes genom samarbeten med projektpartners som testade GPT-SW3 i sina respektive verksamheter. Upplägget har möjliggjort en bred utvärdering av modellerna i olika kontexter. Dock har vissa partners påpekat behovet av mer samordning och kontinuerlig kommunikation för att maximera kunskapsutbyte och effektivitet. Projektet har lyckats identifiera viktiga lärdomar och skapat ett nätverk för framtida samarbete kring AI och språkmodeller i Sverige.