Digitalt mörker

Vem tar ansvar för att det som publiceras på internet sparas till eftervärlden?

Aftonbladet var troligen den första svenska dagstidning som publicerade material på internet. Det skedde när kulturdelen lades ut i augusti 1994. Ett knappt år senare, i mars 1995, lade man också ut nyhetsmaterial. Flera andra tidningar experimenterade under den här tiden med elektronisk publicering. Men exakt hur det såg ut vet vi inte. De första digitala tidningarna finns inte i något offentligt arkiv.

Slumpen bevarar

Av en tillfällighet finns den elektroniska kulturdelen av Aftonbladet ändå bevarad. Den finns på Mark Comerfords tjänsterum på Stockholms universitet. Det var han som handgripligen knackade koden och designade sidorna, och han har helt enkelt behållit datorn som han använde.

All publicering på papper, ljudband, videoband, cd och dvd ska enligt pliktlagen sparas för eftervärlden. Pliktexemplar lämnas bland annat till Kungl. biblioteket (KB) eller Statens ljud- och bildarkiv. Men när det gäller elektronisk information på internet finns det ingen plikt att vare sig samla in informationen eller lämna den någonstans.

Lagringen av Aftonbladets elektroniska utgåva är typisk för hur internet sparas för eftervärlden. Det sker till stor del genom privata initiativ, och livslängden på det lagrade materialet är osäker.

Trots att två statliga utredningar, e-pliktutredningen 1998 och KB-utredningen 2003, förordat att ”distansöverfört digitalt material” också ska samlas in systematiskt har regeringen inte fattat något beslut. Ärendet ligger på Utbildnings- och kulturdepartementet, och en e-pliktlag kommer tidigast om ett år. I våra nordiska grannländer finns redan lagar som reglerar insamlingen.

Skälet till de ständiga fördröjningarna i Sverige heter upphovsrätt och integritet. Att samla in och framför allt tillhandahålla det insamlade materialet kan strida mot upphovsrättslagen eller personuppgiftslagen.

När väl e-lagen kommer kanske tekniken återigen har sprungit ifrån lagstiftarna. Just nu sker stora förändringar vad gäller distribution av musik och rörliga bilder. När musiken till mp3-spelaren inte längre säljs på cd-skiva omfattas den inte av pliktlagen. Och hur arkiveras texter som publiceras i helt nya former, till exempel bloggar?

Sverige ändå föredöme

Trots bristande regelverk och snabb teknikutveckling har ett antal entusiaster sett till att Sverige i alla fall ligger långt framme när det gäller att bevara vårt digitala kulturarv. Vid Kungl. biblioteket pågår sedan 1997 ett projekt där man flera gånger per år söker av så stor del av det svenska internet som man kommer åt. Tillsammans med ett liknande amerikanskt projekt var KB först i världen. Numera är det många länder som regelmässigt samlar internetmaterial och arkiverar för eftervärlden.

Det svenska projektet heter Kulturarw3 (av kulturarv www) och har gjort tretton svep på nio år. Jämfört med det tryckta materialet på Kungl. biblioteket, som varje år ökar med cirka 2 hyllkilometer, omfattar ett svep av svenska internet hela 35 hyllkilometer.

Ett svep pågår i flera månader. En dator på KB söker igenom kända adresser och hämtar alla filer den kommer åt. De som är ansvariga för insamlingen vågar inte låta datorn samla alltför snabbt eftersom det kan sinka de datorer som informationen hämtas hos, och det skulle i sin tur kunna påverka hur vanliga besökare upplever webbplatserna.

I det första svepet 1997 samlades endast dokument som hittades under domänen .se, men det visade sig alltför begränsat. Numera hämtas även svenskt material från bland annat .com och .nu-domänerna. Dessutom insamlas dagligen material från ett hundratal svenska dagstidningar.

Inte riktigt öppet

Om du försöker hitta till historiska sidor via Kulturarw3 på nätet får du dock leta förgäves. För att kunna följa personuppgiftslagen och lagen om upphovsrätt är det insamlade materialet inte tillgängligt via internet. De historiska webbsidorna kan bara ses på Kungl. biblioteket. Trots att materialet har varit publicerat på webben kan det alltså efter insamlandet bara ses på en särskild dator i Stockholm!

Några sådana begränsningar har inte den största insamlingen av webbmaterial, Internet Archive, i USA. Stiftelsen bildades 1996 och försöker lagra så mycket digitalt material som möjligt och tillhandahåller det öppet, gratis och sökbart via sin webbplats. Här hittar du visserligen inte Aftonbladets första elektroniska utgåva, men åtminstone en från 23 oktober 1996.

Enligt egna uppgifter omfattar det amerikanska arkivet 1 petabyte (peta=1015) med data och växer med 20 terabyte (tera=1012) per månad. Internet Archive samarbetar bland annat med en söktjänst på internet för att fånga in så mycket material som möjligt. Dessutom gör man speciella insamlingsrundor vid stora händelser, till exempel amerikanska presidentval och terrorattacken den 11 september 2001.

Trots dessa insatser är materialet långtifrån komplett. Stora delar av det som publiceras på internet kommer man inte åt. Det gäller till exempel de sidor som kräver lösenord. Det kan vara så enkelt som att man måste anmäla sig för att få läsa, eller att man måste vara prenumerant på en papperstidning. Annat material är anpassat till användaren och ser därmed litet olika ut beroende på vem som tittar. Ytterligare en del dokument är lagrade i databaser och publiceras bara när de efterfrågas. Dessutom publiceras en hel del information i form av små program. Allt detta missar roboten. Det gäller både det amerikanska Internet Archives robot och det svenska kulturarwsprojektets robot.

För att slippa problemet med att man inte kan samla in allt, har en del insamlingsprojekt valt att samla texter bara från utvalda källor. Det nationella biblioteket i Australien är en av föregångarna enligt den linjen. De samlar numera in information från över 9 000 olika källor som de också kan hålla relativt kompletta.

Projekt som likt det svenska i stället försöker samla så mycket som möjligt menar att det är svårt att veta vad som är relevant information i framtiden och att det därför är bättre att försöka samla allt.

Men går det att läsa?

För två år sedan startade Riksarkivet tillsammans med Luleå tekniska universitet och Bodens kommun ett projekt där man forskar om och utvecklar system för digitalt långtidsbevarande. Här studerar man vilken teknik som bör användas för att lagra informationen, vad som måste lagras för att informationen ska vara begriplig och hur den ska presenteras.

I dag sparas det mesta på magnetband. De rymmer mycket data och kan kopieras utan förlust eller förvrängning. Vid Riksarkivet anser man att band är bäst för långtidslagring av stora mängder digital information. Magnetbanden är visserligen känsliga för damm och magnetfält, men håller man dem rätt lagrade och kopierar dem med jämna mellanrum kan de användas som digitala långtidsarkiv.

När det gäller lagring i femtio år eller mer är det dock troligen inte själva lagringsmediet som är det stora problemet. Det är i stället att de format som används kanske inte längre är läsbara. Och hur är det med Mark Comerfords dator som innehåller Aftonbladets kulturdel? Om den alls kan startas om femtio år, vet då någon vilket kommando man ska ge för att komma till rätt sida?

Upptäck F&F:s arkiv!

Se alla utgåvor