Statens röst avslöjar tidsandan
Medieforskaren Pelle Snickars läser Statens offentliga utredningar på ett nytt sätt.
Vissa frågor som regeringen arbetar med är svårare att lösa än andra, skriver Regeringskansliet. ”De kräver därför en grundlig genomgång.” Att tillsätta en statlig utredning blir då följden. Normalt arbetar ungefär 120 utredningar samtidigt varje år. Statens offentliga utredningar, SOU, kan lätt framstå som trista med sin byråkratiska utredningsprosa och det torde vara ganska få som på sin fritid förkovrar sig genom att läsa dem. Men träigheten till trots – det svenska utredningsväsendet är unikt i sin omfattning. Under mer än hundra år har kommittéväsendet spelat en betydande roll för genomförandet av politiska reformer i Sverige.
En av Kungliga bibliotekets mest lyckade digitaliseringsinsatser har varit att skanna in Statens offentliga utredningar mellan år 1922 och 1999. Det rör sig om totalt mer än sex tusen SOU:er, och de flesta är på flera hundra sidor. Materialet är populärt bland humanistiska och samhällsvetenskapliga forskare. Det finns till och med ett hyllningskonto på Twitter, @SOU_min_SOU, som muntert delar tidstypiska omslagsbilder och utredningstitlar som Verkan på den mänskliga organismen av maltdrycker med olika alkoholhalt (SOU 1951:44). Eftersom materialet är fritt tillgängligt via kb.se har det också lockat digitala humanister som mig själv, alltså oss som använder digital teknik för att besvara humanistiska frågor, att sammanställa alla utredningar till ett enda stort dataset. Om alla dessa utredningar sätts samman och analyseras som en enda enorm text som staten skriver – ett slags statens röst – vilka teman kan då urskiljas?
Vanligaste orden på 1960-talet
Man kan till exempel undra hur den svenska staten tagit sig an forskningsfrågor. Om alla 3 100 statliga utredningar under åren 1945–89 analyseras som ett dataset, på 87 miljoner ord, så kan en analysmodell som delar in textmassan i hundra teman urskilja ett som specifikt handlar om forskning. Vi kan se de hundra mest förekommande orden i detta forskningstema, liksom hur det fördelar sig över tidsperioden i fråga. Ord som forskning, institution och högskola förekommer mest. Det är uppenbart att den svenska staten främst intresserade sig för forskningsfrågor vid mitten av 1960-talet, liksom precis efter andra världskriget. Forskning framstår som en tydlig markör för välfärdsårens samhällsoptimism.
Jag och mina kollegor vid Umeå och Uppsala universitet använder stora textsamlingar för att analysera politik, medier och kultur i välfärdssamhällets framväxt. På det digitala humaniora-centrat Humlab vid Umeå universitet, ägnar vi oss med hjälp av programmerare åt digital historievetenskap. Humanister sysselsätter sig i regel med att närläsa ett fåtal texter, men här handlar det om distansläsning av miljoner ord med datorers hjälp.
Jämför texternas historiska innehåll
Statliga utredningar utgör ett av de dataset vi arbetar med, dagspress ett annat. Därtill håller vi på att digitalisera alla svenska romaner som publicerades mellan 1945 och 1989, vilket är uppemot tio tusen titlar. Tanken är att jämföra dessa dataset med varandra. Vi använder enklare metoder som ordfrekvenser och ordpar som uppträder tillsammans, liksom mer sofistikerade algoritmer där personnamn, geografi och tidsmarkörer automatiskt kan märkas upp. Det är inte språkets form som intresserar oss utan textmassornas historiska innehåll.
Grundfrågan är vilka diskurser, motiv eller teman som träder fram i de dokument som vi intresserar oss för. Välfärdsfrågor kring barn och familj är ett exempel: De ökar i styrka från mitten av 1970-talet och framåt. Föräldrapenning, barnomsorg, föräldraförsäkring och föräldraledighet är några av de ord som då figurerar allra mest.
Analysen gör det även möjligt att kategorisera utredningar. Vilka teman återfinns exempelvis i en utredning som Bättre miljöskydd (SOU 1983:20)? Teman kring miljöarbete förstås, liksom miljöavgifter. Men teman om buller och flygplatser liksom fiskeri och utsläpp förekommer också, liksom frågor om arbetsmiljö, arbetsolyckor och rent av fängelsestraff.
Modellerna urskiljer vilka ord som ingår i ett tema, vilka statliga utredningar som innehåller detta tema, hur det fördelar sig över tid liksom hur temat – eller ord i ett tema – anknyter till andra teman och utredningar. Grundprincipen är att vissa ord förekommer tillsammans. För att ta ett uppenbart exempel så är det mer sannolikt att ord som biograf och spelfilm finns i en utredning om filmpolitik än termer som fartyg eller jordbruk.
Upptäcker mönster över tid
För en människa är det inte möjligt att läsa flera tusen utredningar och dra slutsatser om teman i dem. Men med datorers hjälp går det. Olika former av text mining handlar inte så mycket om att läsa som om att upptäcka mönster i textmassor, samband som kan vara av olika karaktär. Det gör det möjligt att upptäcka både förväntade diskurser, liksom mer oväntade motiv. Man kan exempelvis spåra hur en diskurs växer fram – och ibland ändrar karaktär.
När textmassan i alla tre tusen SOU delats in två hundra teman så återfinns ett tydligt miljötema. Temat återfinns främst från och med 1970-talet och framåt. Miljöhistorisk forskning har ofta påpekat att miljödiskursen i Sverige ändrades ungefär vid denna tidpunkt.
Migration är ett annat exempel som svenskt utredningsväsende ägnat mycket uppmärksamhet åt – från SOU 1946:36 (om flyktingärenden och säkerhetstjänst) till SOU 1989:111 (om invandrare i storstad). Statens röst har här ändrat karaktär.
Efter andra världskriget finns exempelvis ett tydligt tema kring asyl och invandring, med termer som utlänning, polis, flykting och brott. Från omkring 1970 förekommer brottslighet och invandring inte längre tillsammans – i stället förknippas migration med medborgarskap och undervisning.
Tonläget hos statens röst ändras alltså över tid, från en restriktiv utlänningspolitik till en mer tillåtande och inkluderande migration.
I en visualisering är det uppenbart att tematiker skiljer sig åt över tid. I ett tema återfinns (äldre tidstypiska) ord som landsfiskal och jude, medan ett senare tema listar ord som hyresgästförening och barnomsorg. Andra ord som uppehållstillstånd, invandrarverk, medborgarskap och flykting är gemensamma.
Jag är mediehistoriker och har därför koncentrerat mig på teman kopplade till medier. Under efterkrigstiden och välfärdsåren handlade statens intresse i stor utsträckning om att skapa ekonomiska förutsättningar för medieproduktion. Etableringen av public service, den successiva ökningen av presstöd liksom inrättandet av Svenska filminstitutet är tre exempel. Men med hjälp av vår analys går det att visa att staten också intresserade sig för hur medier skulle sparas. Statlig mediepolitik ägnades åt både produktion och bevarande, något som tidigare forskning inte uppmärksammat.
Prenumerera på Forskning & Framsteg!
10 tidningsnummer om året och dagliga nyheter på fof.se med kunskap baserad på vetenskap.
I en modell vi använt är följande fem utredningar mest framträdande: Ljud och bild för eftervärlden (SOU 1987:51), TV-politiken (SOU 1989:73), Svensk press (SOU 1974:102), Bevara ljud och bild (SOU 1974:94) och Radio i utveckling (SOU 1973:8). Det är slående att två av dessa fem betänkanden handlar om hur medier skulle bevaras. Många medieutredningar var förstås inriktade på framtidsfrågor, men arkiveringen av samma medieformer var något som staten intresserade sig för i nästan lika stor utsträckning.
Det kan vi se genom att ord kopplade till arkiv och medier ofta dyker upp tillsammans i våra analyser av stora textmängder. Det kan röra sig om termer som arkiv, film, material, handling och bibliotek. I en visualisering av sju relaterade teman i modellen – om etermedia, om dagspress, om film, om reklam, om mediearkiv, om ADB (IT) och om massmedieforskning – framträder en tät väv av 260 ordnoder kopplade till arkivering av medier.
Det är fortfarande ganska ovanligt att svenska humanister arbetar med storskaliga dataset. En förtjänst med att analysera text på det här sättet är ökad tillförlitlighet och reproducerbarhet genom att öppet redovisa den data och mjukvara som använts. En annan är att visa hur teman utvecklar sig över tid, och på vilket sätt förbindelser uppträder vid olika tidsperioder. Genom att växla mellan olika analysmodeller går det också att studera hur en tematik förgrenar sig. De här metoderna kan bekräfta tidigare forskningsresultat från andra fält. Men också ge nya insikter. Att den statliga mediepolitiken på 1970- och 1980-talet inte bara handlade om att skapa ekonomiska förutsättningar för medieproduktion, utan även om bevarande och systematisk arkivering är en sådan insikt.
Pelle Snickars
- Professor i medie- och kommunikationsvetenskap med inriktning mot digital humaniora vid Umeå universitet. Affilierad till Humlab, som bedriver forskning och undervisning inom digital humaniora.
- Byter lärosäte i maj 2022 då han blir professor i digitala kulturer vid Lunds universitet, institutionen för kulturvetenskaper.
- Leder forskningsprojektet Välfärdsstaten analyserad – textanalys och modellering av svensk politik, media och kultur 1945–1989.
- Har tidigare varit forskningschef på Statens ljud- och bildarkiv och därefter på Kungliga biblioteket.