Om Projekt FredrikaVÅRA MÅLGODA SEDERWIKIPEDIAMÖTENTILLBAKABLICKFINLANDUKRAINAHELSINGFORSRASEBORGÅLANDNAGUINGÅIDROTTFÖRFATTAREBIRGER CARLSTEDTÖVRIGT

Projekt Fredrikas år 2025 – och siktet inställt på 2026

Projekt Fredrikas närmaste samlades till julmiddag den 8 december 2025 i Tölö, Helsingfors. Styrelseordförande Kaj Arnö höll kvällens tal om vad vi gjort 2025, vad vi lärt oss och vad vi siktar på 2026.

Vad vi gjort 2025

Årets arbete kan indelas enligt bidragsgivarna: Svenska kulturfonden, Svenska litteratursällskapet i Finland och Harry Schaumans stiftelse i Österbotten.

1. Mata AI-draken

Vi fick två bidrag från Svenska kulturfonden. Det första uppdraget hade rubriken “Mata AI-draken” – att se till att ChatGPT, Claude, Gemini och andra LLM:ar kan det svenska Finland så bra som möjligt. LLM:arna använder Wikipedia och Wikidata som pålitliga källor för “sanning”, information som gått igenom faktagranskning av en community.

“Mata AI-draken” gick ut på att helt enkelt förbättra Wikipedia utgående från metodik där vi använder AI för att mata AI. Vi byggde verktyg som föreslår Wikipedia-redigeringar utgående från utvalda källor. Detta enligt Kajs föredrag hösten 2024.

Kaj håller föredrag

Vi har varit noga med att bära ansvar: vi släpper inte lös botar på Wikipedia som uppdaterar för egen maskin. Det handlar om halvautomatiserade arbetssteg där vi ökar vår egen effektivitet som mänskliga wikipedianer.

För mera detaljer se projektsidan Wikipedia:Projekt_Fredrika/Mata_AI-draken och Wikipedia:Projekt_Fredrika/Yle.

2. Humorgruppen KAJ

När intresset för humorgruppen KAJ exploderade i februari 2025 såg vi en gyllene chans att dela med oss av det svenska Finland för en internationell publik. Vid Melodifestivalen ökade läsningarna av KAJ:s Wikipedia-artiklar på svenska och finska trehundrafalt, och Vörå-artikeln fick nittio gånger fler läsningar.

KAJ hade i början av 2025 två blyga Wikipedia-artiklar med mycket potential till förbättring. Vi koordinerade med Vörå kommun och fick bidrag från Harry Schaumans stiftelse för arbetet.

Vi förbättrade KAJ:s artikel, skapade sidoartiklar för deras verk (se navruta), lade till bilder och uttalsljud (se commons) och förbättrade relaterade artiklar som Vörå och finlandssvensk musik (se navruta). Wikipedia-gemenskapen skapade hela 30 språkversioner av KAJ-artikeln inför Eurovision – vi hoppas de blev bättre tack vare det avsevärt förbättrade innehållet vi gjorde tillgängligt i den svenska, finska och engelska versionen.

För mera detaljer se vår KAJ blog samt projektsidan Wikipedia:Projekt_Fredrika/KAJ.

KAJ på Commons Bilder på KAJ från innan Bara Bada Bastu finns också på Wikimedia Commons nu - tillgänglig för användning över alla Wikipedia språk.

Statistik över KAJ-artiklars visningar Statistik över KAJ-artiklars visningar: svenska (blå) och finska (röd) sköt i höjderna under Melodifestivalen, medan andra skapades och växte inför Eurovision. Tyska (grön) visningar växte även efter Eurovision.

KAJ Mall Alla artiklar vi skapat om KAJ på svenska i en navruta vi skapat för att navigera mellan dem.

3. Finlands författare

Med Svenska litteratursällskapet jobbar vi i “paket”, fyra per år. I år handlade alla om bokserien Finlands författare – tre volymer med totalt över 6 600 författare aktiva 1809–1916, 1917–1944 och 1945–1980 - publicerade 1981, 1985 och 1993.

Arbetet hade två faser. Först förberedde vi scannade materialet och skapade Wikidata-stommen med klassisk IT (Python-script). Över 4200 författare kopplades till Wikidata-objekt – de relevantaste författarna oberoende av finsk- eller svenskspråkighet, medfödelsedatum och flera rader innehåll i boken.

Den andra fasen handlade om att uppdatera författarnas Wikipedia-artiklar med textinnehåll, i huvudsak på svenska men även på finska och engelska. Vi prioriterade enligt Wikipedias lässtatistik, längden i boken och relevans för det svenska Finland.

Med verktyget Lovable byggde vi ett verktyg som AI-genererar förbättringsförslag. Det hämtar Wikipedia-artikeln och bokens innehåll, föreslår tillägg och genererar en förbättrad artikel som man granskar innan publicering.

Inom parentes sagt: Svenska startupen Lovable är den snabbast växande företaget nånsin - den har uppnått 100 miljoner euro ARR på kortaste tid någonsin.

För mera detaljer se projektsidorna Wikipedia:Projekt_Fredrika/SLS-Författare-1809, SLS-Författare-1917, och SLS-Författare-1945 samt koden i github.com/projekt-fredrika/sls-forfattare.

Förbehandling i Cursor av Författar-material

Förbehandling i Cursor med AI-genererad “klassisk IT” python kod: konverterar scannad PDF i förgrunden till strukturerad data i bakgrunden.

Lovable verktyg för Författarna

Lovable verktyg för att generera förbättringsförslag: nuvarande Wikipedia artikeln till vänster, källan i mitten, och AI-genererade förbättringsförslaget till höger.

4. SuRu och Wikidata

Det andra kulturfondsbidraget var annorlunda: att förbättra Wikidata-lexem med Stora finsk-svenska ordboken (SuRu). Idén fick fick från att ha tidigare fört in dialektord från Ordbok över Finlands svenska folkmål i samarbete med Institutet för de inhemska språken.

Att avspegla hela ordboken i Wikidatas lexemstruktur är övermäktigt – boken har över 100 000 inlägg. Vi valde två områden: de vanligaste uppslagsorden enligt Google Analytics, och finlandsspecifika ord betecknade “Suom” i ordboken (t.ex. bergsråd). Ett svårt och intressant uppdrag med komplicerade Wikidata-strukturer.

För mera detaljer se projektsidan Wikipedia:Projekt_Fredrika/Suru och koden i github.com/projekt-fredrika/kotus-suru.

Jääkäri i SuRu

Ordet jääkäri är markerat i SuRu med “hist Suom” iom ordets Finland specifika betydelse. I skärmdumpen ser man även ett verktyg vi utvecklat för att visa SuRu-ordets motsvariga lexem i Wikidata - vilket underlättar ihoplänkning av översättningar i Wikidata.

Jääkäri i Wikidata

Finska “jääkäri” lexemet i Wikidata har kod L1449014. Översättningen är svenska “jägare” lexemets andra betydelse, se L51565#S2.

Jägare

Python scripten vi skapat med Cursor för att anpassa SuRus XML filer till Wikidata lexem.

Vad vi lärt oss 2025

1) AI gör oss produktiva

Med verktyg som Lovable och Cursor har arbetsprocessen gått från helt manuell till delvis automatiserad. När verktygen alltid går igenom samma steg blir resultatet mer konsekvent och pålitligt. Det fanns en tid när Robert kom till Kaj med svåra programmeringsfrågor – nu fräser han på med hjälp av AI.

2) Djupare Wikidata-kunskap

Vi använde Wikidata som stomme i författarpaketen, förde in KAJ:s musikaler och låtar så de är tillgängliga på fler språk, och tillämpade komplicerade strukturer för SuRu:s lexem.

3) Lärdomar från MariaDB

Både Kaj och Robert jobbar för MariaDB där vi lärt oss om 1) AI-embeddings som möjliggör semantisk sökning utan LLMar och, 2) hackathons som kunde tillämpas likt stora skrivstugor inom Wikipedia.

Saker där vi inte nått ända fram

4) Från abiturienter till Universitetssamarbete

Vi jobbar framgångsrikt med deltidsjobbande abiturienter men vill utvidga till universitetsstuderande och forskare. Det finns potential att jämföra Wikipedia med akademisk forskning eller mellan språkversioner – t.ex. beskrivs Kagalen olika på svenska och finska. Under SLS 140-årsjubileum fick vi kontakt till Henrika Tandefelt, historieprofessor vid Helsingfors universitet.

Projekt Fredrikas deltidsarbetare på julmiddagen 2025

I förgrunden är Projekt Fredrikas deltidsarbetare och sommarjobbare (samt verksamhetsgranskare) på julmiddagen 2025.

5) KAJ och lokala krafter

Projektet kunde ha mått bättre av mera lokalhjälp. Vöråborna baxade en bastu till Eurovision i Schweiz, men vi lyckades inte skapa det engagemang kring Wikipedia som vi hoppats på för lokalkunskap och fotografering.

6) Slutat rädda världen med Projekt Kateryna

För ett par år sedan startade vi Projekt Kateryna som skulle göra det för Ukraina som Fredrika gör för det svenska Finland. Trots lokalt intresse i Ukraina och våra egna försök att skapa intresse i väst, lyckades vi inte hitta lämplig finansiering inom Västerlandet. Vi anser att krigen 2008 i Georgien och 2014 samt 2022 aldrig hade uppstått om det inte var för all okunskap om Ukraina och om Rysslands koloniala förtryck – okunskap som senast nu borde lappas till.

Se Kajs föredragi London på Youtube: Saving the World by feeding the AI Dragon with unbiased open data / Kaj Arnö @ SOOCon25 London. Projektets hemsida lever vidare vid projektkateryna.netlify.app.

Vad vill vi göra 2026?

SLS: Biografiskt lexikon och mer

Vi tänker oss fortsätta med Biografiskt lexikon för Finland (blf.fi) i minst två paket. Vi vill också göra “editpartyn” av fler SLS-böcker – ta litterära texter och avspegla dem på Wikipedia. Bland annat siktar vi på böcker om Westermarck och Finlandssvensk antifascism.

Kulturfonden: Mata AI-draken 2

Vi har ansökt om medel för en uppdaterad 2026 version av rapporten “Det svenska Finland på Wikipedia” från 2020. Med AI kan vi göra det snabbare och mer omfattande. Och framför allt: vi vill identifiera hålen – vilka delar av det svenska Finland är dåligt täckta?

Engelska artiklar

AI tränar sig mycket på engelskspråkigt material. Därför borde finlandssvenskar av som på ett eller annat sätt påverkat världshistorien – Westermarck, Nordenskiöld, Alma Pihl – ha ordentliga engelska Wikipedia-artiklar. Det handlar om att synas där AI-modellerna hämtar sin kunskap.

Nationalbiblioteket och Forum

Forum för ekonomi och teknik är en guldgruva för finlandssvensk ekonomisk historia. Och Nationalbiblioteket digitaliserar gamla tidningar. Båda dessa källor borde föras in i öppen data.

Framåt

Det finns mycket kvar att göra. Men 2025 har visat att AI är en kraftfull allierad i arbetet med att synliggöra det svenska Finland på nätet. Bara det finns digitalt material att utgå från kan vi på ett helt annat sätt än tidigare föra in kunskap i Wikipedia och Wikidata.

Projekt Fredrika förbättrar täckningen av det svenska i Finland på Wikipedia, främst på svenska men också på andra språk. Läs om oss på Wikipedia (Projektsidan, Project page, Projektisivut, Projektseite, Page du projet, страница проекта, eller följ oss på Twitter, Facebook, Instagram, eller Youtube.