Digitala arkiv inget för framtiden

Datorernas snabba teknikutveckling ger oss möjlighet att spara mängder av digital information. Men arkiven har kort bäst före-datum.

I min hand håller jag en diskett som innehåller femton år gamla dagböcker. Där finns berättelser om hur jag blev den jag är i dag, sparade för framtiden. Enda problemet är att jag inte kommer åt dem.

Min dator har nämligen ingen diskettstation, inget Microsoft Works 3 och inget Windows 3.11. Det är dessutom stor risk för att disketten rent fysiskt gått sönder. Mina dagböcker är inte bara sparade. De är inlåsta och håller på att försvinna.

Femton år är en lång tid i datorvärlden – allt hinner bytas ut flera gånger om. Men jag har tur: en annan dator klarar att läsa det mesta av disketten, och det finns program som tolkar de urgamla filerna. Slutet gott, allting gott. Eller?

Om det orsakar så mycket problem att läsa mina gamla dagböcker, hur ligger det då till med lika gamla forskningsdata, medicinjournaler och säkerhetsanvisningar? Och hur vet vi att e-post, databaser och fotoalbum som vi sparar i dag går att läsa år 2040?

De första ansträngningarna för att långtidssäkra digital information gjordes av Nasa i mitten av 1960-talet, men det var inte förrän på 1990-talet som man på allvar började samarbeta internationellt i frågan.

– Det hänger förmodligen samman med det framväxande e-samhället, att allt fler handlingar bara finns digitalt, säger Mari Runardotter, doktorand vid Centrum för långsiktigt digitalt bevarande, Luleå tekniska universitet.

Nya program vart tredje år

Trots det har digital arkivering inte fått så stort genomslag ännu. Det mesta som arkiveras är åtminstone tio år gammalt, och många av de digitala handlingarna har ännu inte nått arkiven.

I dag är arkivarier medvetna om problemen med digital lagring, även om det inte finns några bra lösningar.

– De kan åtminstone skriva ut de handlingar som måste finnas kvar. Så gör många i dag, säger Mari Runardotter. Hos gemene man är medvetenheten om hur man långtidslagrar digital information ännu mindre – exempelvis använder många cd-rom för att spara filer.

– Att arkivera information på cd-rom är tyvärr inte speciellt pålitligt. Delvis för att de skivor man själv har bränt har begränsad livslängd, men kanske främst för att man måste ha koll på när formaten blir gamla, säger Mari Runardotter.

Just föråldrade filformat är ett av de största problemen inom digital arkivering.

– När det gäller digitalt material kan vi inte agera som vi gjort med papper. Det räcker inte att lägga det i en låda i en arkivhylla, säger Jörgen Nilsson, även han doktorand vid Centrum för långsiktigt digitalt bevarande.

Ny programvara vart tredje år

Huvudproblemet är att även om disketter, magnetband eller cd-skivor är i perfekt skick om 30 år, är innehållet värdelöst om du inte vet hur du ska avläsa det.

– Att bevara ettorna och nollorna är egentligen en teknikalitet. Du måste också se till att du har hårdvara så att du kan läsa, och mjukvara som hör ihop med den. Och nya versioner av programvara kommer ungefär vart tredje år, säger Jörgen Nilsson.

Inom digital långtidslagring finns två huvudstrategier för att ta hand om utgångna format. Den ena, emulering, går ut på att bevara filerna i sina ursprungliga format och skriva program som kan läsa dem även i nya datorer. Det går också att behålla originalprogrammen och simulera operativsystemet – skriva ett skalprogram som exempelvis får Works 3 att tro att det befinner sig i Windows 3.1.

Fördelen med emulering är att dokumenten ser ut precis som de gjorde när de skrevs. Nackdelen är att det är dyrt att utveckla de nödvändiga programmen, och i längden riskerar man att behöva emulera i många steg.

Den andra metoden kallas migrering och går ut på att regelbundet flytta över filer till nya format när de gamla går ur tiden. Det är den vanligaste metoden, och den används av nästan alla länder som har en uttalad strategi – så även Sverige. Ett problem med migrering är att innehållet riskerar att förvrängas – precis som när dokument flyttas mellan olika program i dag.

Ett annat problem är om man har stora mängder data. Statens ljud- och bildarkiv har omkring 800 år av ljud- och videoinspelningar lagrade.

– Vi har inte behövt byta format ännu, och vi tror inte att det behövs det närmaste decenniet, säger Martin Jacobson, chef för teknik och utveckling vid Statens ljud- och bildarkiv.

– Men när vi bestämmer oss för att migrera arkivet till ett annat format kan komplikationer uppstå eftersom det är en tidskrävande process.

Tusen års perspektiv

Sverige var tidigt ute med digital folkbokföring och även med digitala arkiv för hälsovård och pension, som började redan under 1960-talet. Myndigheternas gamla arkiv lämnas till Sveriges nationella arkiv, Riksarkivet. Där handlar det inte om att bevara i fem eller tio år, utan i tusen.

Själva lagringen sker på magnetband eftersom det är billigare och lite säkrare än hårddiskar. Banden ligger skyddade i valv under marken, men redan innan data kommer till Riksarkivet har de ibland blivit föråldrade.

– Det finns dvd-skivor så nya som från 2004 som vi har problem att läsa. Ibland beror det på att skivorna har blivit repade, eller att folk har skrivit på dem med olämpliga pennor, säger Birger Stensköld, förste arkivarie vid Enheten för teknikberoende medier, Riksarkivet.

Men även skivor som har behandlats varsamt kan vara oläsliga. Den tekniska utvecklingen har gjort att moderna läsare kan ha svårt med skivor från äldre brännare.

– Vi har insett att vi måste hålla oss med många olika läsare och se vilken som bäst klarar att läsa en specifik skiva. Vi har inte undersökt i detalj varför det är så, utan bara konstaterat att vi får våldsamt olika resultat beroende på vilken läsare vi väljer, säger Birger Stensköld.

För att kunna spara dokument länge har Riksarkivet satt upp regler för vilka filformat som man tar emot. Det är format som det finns tydliga riktlinjer för hur de ska tolkas, vilket gör det möjligt att förstå filerna även om fem, tio och femtio år. Enhetliga format gör det också lättare att skriva om arkiven till andra format i framtiden, när det blir aktuellt.

Trots Riksarkivets ansträngningar är det inte ovanligt att delar av myndigheternas digitala arkiv försvinner.

– Vi upptäcker sådana fall hela tiden. Oftast är det myndigheter som har dåliga databand redan vid leveransen, eller data lagrade på ett sätt som gör att varken vi eller de kan läsa dem. Men tyvärr upptäcker vi också en del äldre databand i arkivet som har tekniska problem, säger Birger Stensköld.

Så långtidslagrar du data

Om du använder hårddiskarna enbart för arkivering kommer de normalt att hålla i många år, men kontrollera åtminstone var sjätte månad att det går att läsa från hårddiskarna. Efter 5-10 år är det klokt att skriva om alla data på hårddiskarna, exempelvis genom att kopiera hela arkivet (och radera källfilerna om det är ont om plats).

Använd ett fåtal vanliga och enkla filformat, och håll ordning på när de är på väg att försvinna från marknaden – en bra tumregel är att åtminstone ha näst senaste formatet. Sedan är det dags att spara om i nytt format. Ett format speciellt anpassat för arkivering är PDF/A, som är en avskalad version av PDF.

Här är några rekommendationer för olika filtyper:

Ordbehandling

Säkrast är att spara som rena textfiler (ASCII eller Unicode). Mer lättanvänt men kortlivat blir det i Microsoft Office-format, OpenDocument-format och Rich Text Format. Rekommenderat är också att spara som PDF.

Kalkylblad

Säkrast är att exportera till textfil (ASCII eller Unicode). Mer lättanvänt men kortlivat blir det i Microsoft Office-format och OpenDocument-format.

Bilder

Använd TIFF eller JPG/JPEG om din kamera levererar i de formaten. Om du behöver konvertera till något av dessa format bör du se till att få med den inbakade informationen som bland annat berättar när bilden togs.

Musik

Använd mp3-format i en kvalitet som passar ändamålet – inspelningar av samtal behöver inte ha lika hög kvalitet som musik.

Video

De flesta videokameror använder så kallat DV-format. Formatet kan behållas, men de bör kapslas in i en AVI-fil för att öka åtkomligheten.

Databaser

Exportera till textfil (ASCII eller Unicode) och var noga med att dokumentera vad de olika kolumnerna står för.

E-post

E-post är något av de svåraste dokumenten att spara på ett enhetligt sätt, eftersom det finns så många olika e-postprogram och format. För att slippa handskas med skiftande format är det bästa förmodligen att spara som PDF.

Teknik

Upptäck F&F:s arkiv!

Se alla utgåvor