Annons

Digitalt mörker

Digitalt mörker

Vem tar ansvar för att det som publiceras på internet sparas till eftervärlden?

Aftonbladet var troligen den första svenska dagstidning som publicerade material på internet. Det skedde när kulturdelen lades ut i augusti 1994. Ett knappt år senare, i mars 1995, lade man också ut nyhetsmaterial. Flera andra tidningar experimenterade under den här tiden med elektronisk publicering. Men exakt hur det såg ut vet vi inte. De första digitala tidningarna finns inte i något offentligt arkiv.

Slumpen bevarar

Av en tillfällighet finns den elektroniska kulturdelen av Aftonbladet ändå bevarad. Den finns på Mark Comerfords tjänsterum på Stockholms universitet. Det var han som handgripligen knackade koden och designade sidorna, och han har helt enkelt behållit datorn som han använde.

All publicering på papper, ljudband, videoband, cd och dvd ska enligt pliktlagen sparas för eftervärlden. Pliktexemplar lämnas bland annat till Kungl. biblioteket (KB) eller Statens ljud- och bildarkiv. Men när det gäller elektronisk information på internet finns det ingen plikt att vare sig samla in informationen eller lämna den någonstans.

Lagringen av Aftonbladets elektroniska utgåva är typisk för hur internet sparas för eftervärlden. Det sker till stor del genom privata initiativ, och livslängden på det lagrade materialet är osäker.

Trots att två statliga utredningar, e-pliktutredningen 1998 och KB-utredningen 2003, förordat att "distansöverfört digitalt material" också ska samlas in systematiskt har regeringen inte fattat något beslut. Ärendet ligger på Utbildnings- och kulturdepartementet, och en e-pliktlag kommer tidigast om ett år. I våra nordiska grannländer finns redan lagar som reglerar insamlingen.

Skälet till de ständiga fördröjningarna i Sverige heter upphovsrätt och integritet. Att samla in och framför allt tillhandahålla det insamlade materialet kan strida mot upphovsrättslagen eller personuppgiftslagen.

När väl e-lagen kommer kanske tekniken återigen har sprungit ifrån lagstiftarna. Just nu sker stora förändringar vad gäller distribution av musik och rörliga bilder. När musiken till mp3-spelaren inte längre säljs på cd-skiva omfattas den inte av pliktlagen. Och hur arkiveras texter som publiceras i helt nya former, till exempel bloggar?

Sverige ändå föredöme

Trots bristande regelverk och snabb teknikutveckling har ett antal entusiaster sett till att Sverige i alla fall ligger långt framme när det gäller att bevara vårt digitala kulturarv. Vid Kungl. biblioteket pågår sedan 1997 ett projekt där man flera gånger per år söker av så stor del av det svenska internet som man kommer åt. Tillsammans med ett liknande amerikanskt projekt var KB först i världen. Numera är det många länder som regelmässigt samlar internetmaterial och arkiverar för eftervärlden.

Det svenska projektet heter Kulturarw3 (av kulturarv www) och har gjort tretton svep på nio år. Jämfört med det tryckta materialet på Kungl. biblioteket, som varje år ökar med cirka 2 hyllkilometer, omfattar ett svep av svenska internet hela 35 hyllkilometer.

Ett svep pågår i flera månader. En dator på KB söker igenom kända adresser och hämtar alla filer den kommer åt. De som är ansvariga för insamlingen vågar inte låta datorn samla alltför snabbt eftersom det kan sinka de datorer som informationen hämtas hos, och det skulle i sin tur kunna påverka hur vanliga besökare upplever webbplatserna.

I det första svepet 1997 samlades endast dokument som hittades under domänen .se, men det visade sig alltför begränsat. Numera hämtas även svenskt material från bland annat .com och .nu-domänerna. Dessutom insamlas dagligen material från ett hundratal svenska dagstidningar.

Inte riktigt öppet

Om du försöker hitta till historiska sidor via Kulturarw3 på nätet får du dock leta förgäves. För att kunna följa personuppgiftslagen och lagen om upphovsrätt är det insamlade materialet inte tillgängligt via internet. De historiska webbsidorna kan bara ses på Kungl. biblioteket. Trots att materialet har varit publicerat på webben kan det alltså efter insamlandet bara ses på en särskild dator i Stockholm!

Några sådana begränsningar har inte den största insamlingen av webbmaterial, Internet Archive, i USA. Stiftelsen bildades 1996 och försöker lagra så mycket digitalt material som möjligt och tillhandahåller det öppet, gratis och sökbart via sin webbplats. Här hittar du visserligen inte Aftonbladets första elektroniska utgåva, men åtminstone en från 23 oktober 1996.

Enligt egna uppgifter omfattar det amerikanska arkivet 1 petabyte (peta=1015) med data och växer med 20 terabyte (tera=1012) per månad. Internet Archive samarbetar bland annat med en söktjänst på internet för att fånga in så mycket material som möjligt. Dessutom gör man speciella insamlingsrundor vid stora händelser, till exempel amerikanska presidentval och terrorattacken den 11 september 2001.

Trots dessa insatser är materialet långtifrån komplett. Stora delar av det som publiceras på internet kommer man inte åt. Det gäller till exempel de sidor som kräver lösenord. Det kan vara så enkelt som att man måste anmäla sig för att få läsa, eller att man måste vara prenumerant på en papperstidning. Annat material är anpassat till användaren och ser därmed litet olika ut beroende på vem som tittar. Ytterligare en del dokument är lagrade i databaser och publiceras bara när de efterfrågas. Dessutom publiceras en hel del information i form av små program. Allt detta missar roboten. Det gäller både det amerikanska Internet Archives robot och det svenska kulturarwsprojektets robot.

För att slippa problemet med att man inte kan samla in allt, har en del insamlingsprojekt valt att samla texter bara från utvalda källor. Det nationella biblioteket i Australien är en av föregångarna enligt den linjen. De samlar numera in information från över 9 000 olika källor som de också kan hålla relativt kompletta.

Projekt som likt det svenska i stället försöker samla så mycket som möjligt menar att det är svårt att veta vad som är relevant information i framtiden och att det därför är bättre att försöka samla allt.

Men går det att läsa?

För två år sedan startade Riksarkivet tillsammans med Luleå tekniska universitet och Bodens kommun ett projekt där man forskar om och utvecklar system för digitalt långtidsbevarande. Här studerar man vilken teknik som bör användas för att lagra informationen, vad som måste lagras för att informationen ska vara begriplig och hur den ska presenteras.

I dag sparas det mesta på magnetband. De rymmer mycket data och kan kopieras utan förlust eller förvrängning. Vid Riksarkivet anser man att band är bäst för långtidslagring av stora mängder digital information. Magnetbanden är visserligen känsliga för damm och magnetfält, men håller man dem rätt lagrade och kopierar dem med jämna mellanrum kan de användas som digitala långtidsarkiv.

När det gäller lagring i femtio år eller mer är det dock troligen inte själva lagringsmediet som är det stora problemet. Det är i stället att de format som används kanske inte längre är läsbara. Och hur är det med Mark Comerfords dator som innehåller Aftonbladets kulturdel? Om den alls kan startas om femtio år, vet då någon vilket kommando man ska ge för att komma till rätt sida?

:

Digitala arkiv inget för framtiden

Datorernas snabba teknikutveckling ger oss möjlighet att spara mängder av digital information. Men arkiven har kort bäst före-datum.

I min hand håller jag en diskett som innehåller femton år gamla dagböcker. Där finns berättelser om hur jag blev den jag är i dag, sparade för framtiden.

Känslig information på gammal hårddisk

Många glömmer att ta bort informationen på uttjänta datorers hårddiskar. En ny studie visar att begagnade diskar innehåller allt från finansiell information till läkarjournaler.

Under förra året byttes ca 150 miljoner hårddiskar ut runt om i världen. De slängdes och såldes vidare - och få verkar ha brytt sig om att radera informationen på dem ordentligt. Det visar en rapport från Massachusetts Institute of Technology, MIT.

Inför studien köpte två forskare vid MIT in 158 begagnade hårddiskar från auktionsföretag, datorbutiker och återvinningsbolag. Av dessa visade sig 129 vara fullt fungerande, och på dem hittade forskarna känslig information av varierande grad. Endast tolv diskar var fullständigt raderade.

Mycket information kvar

Bland innehållet på hårddiskarna fann forskarna allt från personliga uppgifter, företagsinformation och läkarjournaler till e-post och pornografi i stora mängder. På en disk, som forskarna tror har suttit i en bankomat i Illinois, återfanns 2 868 kreditkortsnummer, kontonummer och uppgifter om transaktioner. Inga försök hade gjorts att radera informationen. En annan hårddisk hade visserligen raderats genom s k formatering, men de två forskarna hittade ändå 3 722 kreditkortsnummer på den. Hela 117 av diskarna, 74 procent, innehöll information som kunde återvinnas och läsas. Studien rapporterades till säkerhetsavdelningen inom den internationella organisationen IEEE, Institute for Electric and Electronic Engineers, i början av året.

Enligt en av forskarna, Simson Garfinkel, ligger en del av skulden för informationsläckan på operativsystemföretag som Microsoft och Apple. Deras filraderings- och formateringsfunktioner tar inte bort information som många användare tror. Han tycker att operativsystemsföretagen ska tillhandahålla verktyg som fullständigt raderar filer och hårddiskar på ett säkert sätt i sina system.

- Men det kommer inte att hända förrän kunderna kräver det, säger Simson Garfinkel.

Det finns faktiskt många datorprogram som kan "städa" hårddisken ordentligt, vissa är till och med gratis. Den vanligaste funktionen hos dem är att de skriver över allt på hårddisken och byter ut alla gamla data mot ny information, ofta slumpvisa sifferserier.

Detta ger oftast fullt tillräcklig säkerhet för den vanliga användaren. Det finns avancerade system som även kan återskapa överskriven information, men då handlar det om säkerhetsnivåer i klass med militära hemligheter.

Vid företaget Aurora IT Systems i Täby, som arbetar både med att säkerställa att hårddiskar är fullständigt rensade och att återställa information som oavsiktligt raderats, är man väl förtrogen med problematiken.

- Det är inte ovanligt att företag säljer äldre datorer utan att hårddiskarna säkerställts. Med dem följer ofta känslig information som licenser, kreditkortsuppgifter och adressböcker, säger Tony Kvarnström, VD vid Aurora IT Systems.

Orsaken tror han är ett informationsglapp mellan IT-chefen och ledningen, där den förra inte vill agera utan mandat och den senare inte förstår säkerhetsriskerna.

Användarna lurade

- Det finns olika programvaror för att skriva över data på diskar, som är utmärkta hjälpmedel till en viss säkerhetsnivå. Vill man vara fullständigt säker på att allt har försvunnit får man antingen slå sönder hårddisken eller lämna in den till företag som vårt, där vi bl a utsätter disken för höga elektromagnetiska fält, säger Tony Kvarnström.

Precis som forskarna vid MIT anser han att en stor del av skulden ligger hos tillverkarna av operativsystem.

- Windows är bedrövligt från säkerhetssynpunkt. Det finns mängder med platser där det lagras information om vad användaren har gjort, installerat eller sparat. Användaren luras också att tro att filer raderats när de ändå finns kvar, och på så vis är systemet vilseledande.

Under förra året byttes ca 150 miljoner hårddiskar ut runt om i världen. De slängdes och såldes vidare - och få verkar ha brytt sig om att radera informationen på dem ordentligt.

Skyttel. Beroende på var järnkristallen sitter (mörkare fläck) lagrar varje nanorör en digital etta eller nolla. Bild: Zettl Research Group, University Of California

IT

Nanorör långtidslagrar arkivdata

Järnkristaller inuti kolnanorör kan användas för att arkivera digital information. Med hjälp av elektrisk spänning kan kristallen flyttas mellan två olika lägen för att spara ettor och nollor, som sedan läses av genom att elektriskt motstånd mäts.

Stabiliteten hos kolnanorör gör att informationen skulle överleva i mer än en miljard år i rumstemperatur utan att brytas ner.

– Lagringen är inte känslig för stötar, och det krävs extremt starka magnetfält för att flytta kristallen oavsiktligt, säger Alex Zettl vid University of California, USA, som medverkade i forskningen.

Metoden lär dock inte användas till annat än just långsiktig arkivering, eftersom den i bästa fall kostar omkring fem kronor per megabyte – 500 gånger mer än dagens hårddiskar.

Forskningen publiceras i Nano Letters.

Järnkristaller inuti kolnanorör kan användas för att arkivera digital information.

Kommentarer

Vansinne

Inlagt av Jenny (inte verifierad)

Det står i artikeln att det inte går att söka på gamla sidor på nätet fastän de finns på KB. Alltså, man samlar in materialet men får inte visa det. Urlöjligt. Särskilt som man lätt kan hitta dem på amerikanska Internet Archive. Snacka om stoppa huvudet i sanden för verkligheten.

Något är galet

Inlagt av Börje (inte verifierad)

Min hemsida finns på KB (från 2001), men jag kan inte titta på sidorna. Måste då ta mig till Stockholm och KB.Samma sidor finns på amerikanska Internet Archive (också där från 2001) och där kan jag titta på dem.Håller med Jenny: Snacka om stoppa huvudet i sanden för verkligheten.

Kommentera

Annons