AI tolkar häxprocesser när Riksarkivet gör handskrift sökbar

Med hjälp av AI har Riksarkivet gjort över en miljon historiska rättsdokument sökbara – från häxprocesser på 1600-talet till hovrättsprotokoll på 1700-talet. Och mer är att vänta.

Publicerad
Med hjälp av AI-modellen Swedish Lion som Riksarkivet utvecklat för handskrivna arkivhandlingar

Efter tre års träning har Riksarkivet släppt sitt AI-verktyg Swedish lion som gör handskrivna arkivhandlingar sökbara.
Bild: RiksarkivetCC BY 4.0

Den 16 juni 1671 ställdes Elin i Staxäng inför kommissarialrätt i Bohuslän, anklagad för trolldom. Enligt protokollet hade hon tillika medh sin Mands Ifwar, tillförendehe för bekendh och tillståndan trolldom, bekommet sin domb, och af Kongl: Håfrätten till dödhen resolverat war, och förehölltz, at hon för sin bekendhe mißgärning, War til dödhen dömbdt, thet henne icke war okunnigt, och förmantes at nu såå wäll som förr tillstå sine begångne synder.

Hon och hennes man Ivar har alltså tidigare erkänt trolldom och dömts till döden, och nu vill kommissarialrätten – Trolldomskommissionens ”mobila” domstol – veta mer om vilka de förlett att följa Satan. Allt enligt transkriberingen med AI-verktyget Swedish lion, som utvecklats på Riksarkivet.

gammal handskriven text om häxprocesser
Elin i Staxäng anklagades för trolldom år 1671. Nu har Riksarkivet gjort domen sökbar digitalt.
Bild: Riksarkivet

Lång inlärning för Swedish lion

Att läsa text från 1600- och 1700-talen är en stor utmaning även för en luttrad historiker eller släktforskare. Att lära Swedish lion göra det har tagit tre år. Men nu har AI-verktyget nått en sådan tillförlitlighet – över 90 procent – att totalt 1,2 miljoner handskrivna sidor från bland annat häxprocesserna men framför allt Svea hovrätt publicerats.

Riksarkivet tog hjälp av släktforskare som läste text i skannade dokument och skrev in sina tolkningar.

Tränar på olika handstilar

Den stora utmaningen för AI är att tolka olika handstilar, berättar David Haskiya som är chef för Riksarkivets AI-labb.

– Därför behöver en modell som Swedish lion inte bara träningsdata av god kvalitet, utan även med variation, säger han till Forskning & Framsteg.

Andra utmaningar för transkriberingen är överstrykningar, infogningar och marginalanteckningar.

Sidorna finns sökbara i Nationella arkivdatabasen, NAD, på Riksarkivets hemsida.

Svårt att läsa historiska texter

Historikern Göran Malmstedt, professor vid Göteborgs universitet, välkomnar publiceringen. Hans bok En förtrollad värld: Förmoderna föreställningar och bohuslänska trolldomsprocesser 1669–1672 (Nordic academic press)från 2018 byggde på flera års forskning i protokoll från häxprocesserna.

– Transkriberingen blir en lättnad för den som inte är tränad att läsa gammal text, även om inte allt blir rätt transkriberat. Det underlättar enormt även för den som är tränad, för det kan vara nog så svårt, säger han.

Med sin forskning visade Göran Malmstedt på vilken föreställningsvärld som avspeglades i häxprocesserna. Även om de är tämligen väl utforskade finns alltid nya infallsvinklar, framhåller han.

I kön står ytterligare 70 miljoner skannade filer som ska tolkas med AI-verktyget. Det kommer att ske successivt och läggas ut i NAD efter hand. Tonvikten ligger på rättsligt material och handlingar från bland annat domkapitlen och statliga myndigheter.

Hoppas transkribera kyrkböcker

– Kyrkböcker är exempel på material som är eftersökt. Men i dag kan vi inte transkribera sådana handlingar i tillräckligt god kvalitet, så det går inte ens att gissa när vi skulle kunna bli klara, säger David Haskiya.

Det ultimata målet menar han vore att konstruera en sökmotor där man matar in ord på nutida svenska, och får träffar på 1600- och 1700-talssvenska. Det är, med David Haskiyas ord, ”inte en trivial utvecklingsinsats”, men något han på mycket lång sikt ändå hoppas kunna nå – om finansieringen kan lösas.

Så söker du i Riksarkivets databas

  • På Riksarkivets Nationella arkivdatabasen, NAD, finns över en miljon handskrivna dokument sökbara. Klicka i rutan ”Endast transkriberat material” och skriv in vad du söker.
  • Tips från David Haskiya chef på Riksarkivets AI-labb: Sök på blåkulla, använd trunkeringar och annan sökhjälp på hemsidan för att hitta ingångar i materialet.
  • Tänk på att 1600-talets stavning är oerhört annorlunda jämfört med dagens – samma ord kan stavas på olika sätt på en och samma sida.

F&F i din mejlbox!

Håll dig uppdaterad med F&F:s nyhetsbrev!

Beställ nyhetsbrev

Kunskap baserad på vetenskap

Prenumerera på Forskning & Framsteg!

Inlogg på fof.se • Tidning • Arkiv med tidigare nummer

Beställ i dag!
Publicerad

Upptäck F&F:s arkiv!

Se alla utgåvor