Den osannolika Slumpen

Att avslöja vad som inte är slump har varit ledmotivet när matematikerna försökt ringa in fenomenet slump.

Kosmos

Text Peter Jagers

Publicerad 2001-04-01

Visst var det en slump att den bosnisk-serbiske nationalisten Gavrilo Princip den 28 juni 1914 svängde in på fel gata i Sarajevo? Och visst var det därmed en slump att han kunde skjuta Österrike-Ungerns tronarvinge Franz Ferdinand, vars chaufför också hade svängt fel? Och en följd av slumpen måste väl också kallas slump? Så visst var det en slump att Första världskriget bröt ut, att den habsburgska dubbelmonarkien gick under, att bolsjevikerna grep makten i Ryssland, Hitler i Tyskland, ja, visst var hela det europeiska 1900-talets politiska historia en slump?

Men inte bara samhällshistorien tycks fylld av slump: Själva livet, dess märkliga komplexitet, ögat, det mänskliga känslolivet, tranornas flykt, ålens vandring, allt detta är ju slumpens skörd, lär oss Darwin, Mendel och den moderna molekylära biologin. Ständiga slumpexperiment, ständiga mutationer och omkombinationer av gener formade livet. Och till och med i universums grundvalar, i dess mikrokosmos av obestämbara partiklar, ja i själva skapelsen i Big Bang, ser fysiker och kosmologer slumpens spel.

Slumpen i en förutbestämd värld

Ändå gnager oron. ”Der liebe Gott würfelt nicht”, käre Gud kastar inte tärning, som Albert Einstein sa. I tvåhundra år har vetenskapens dröm varit 1800-talsmatematikern Pierre Simon de Laplace’ s k världsande: ”En intelligens som . . . i en och samma formel skulle kunna sammanfatta rörelserna av universums största kroppar och av den lättaste atom . . . framtiden såväl som det förflutna skulle vara närvarande inför dess ögon” (Essai philosophique sur les probalités, 1825).

Vi har lärt oss att den newtonska mekanikens regler obönhörligt bestämmer vår vardag och ligger till grund för nästan all vetenskap. I den mån vi har tagit till oss den moderna kvantfysiken och dess tes om osäkerhet i atomernas värld är det som en anteckning i kunskapens marginal. Så i vår makroskopiska värld, finns slumpen egentligen? Skulle inte också – i teorin – Gavrilo Princips ödesdigra förehavanden den där junidagen 1914 kunna ha förutsetts, in i detalj?

Ta slumpmässighetens två riktiga skolexempel, slantsingling och tärningskast. Noga betänkt finns där inte mycket till slump. Klassisk, deterministisk mekanik måste – också enligt modern fysik – bestämma myntets eller tärningens fall och därmed vilken sida som slutligen visas. Och samma borde gälla den mängd händelser som styrde Gavrilo Princip. Så egentligen, när det kommer till kritan, finns slumpen annat än möjligen i elementarpartiklarnas overkliga och annorlunda värld?

Slumpen som okunskap

Tydligen måste vi precisera vad det innebär att något är slumpmässigt. Problemet är att de faktorer som inverkar, vare sig det handlar om slantsingling, roterande rouletthjul eller något annat, är komplicerade och svåra att genomskåda. Dessutom blir utfallet ofta diskontinuerligt: en mycket liten förändring i förutsättningarna och vi får krona i stället för klave, rött i stället för svart, krig i stället för fred. Ytterligare en liten, liten förändring och utfallet ändrar sig igen.

Det som förenar lärobokens tärningskast med förhistorien till Första världskriget tycks alltså vara ofullständigheten i vår kunskap – en invecklad orsakskedja leder till ett specifikt utfall på ett helt oöverskådligt sätt. Eller som Laplace formulerade sig: ”Den kurva som en enkel molekyl av luft eller ånga beskriver styrs lika bestämt som planeternas banor. Det finns inga andra skillnader däremellan än de som vår okunskap lägger där. Sannolikheten bestäms dels av denna okunskap, dels av vad vi vet.”

En objektiv syn på slump

Sannolikheten uppstår alltså enligt denna syn i mötet mellan vår kunskap och ett fenomen. Det som för den allvisa intelligensen är ett välbestämt skeende kan te sig helt slumpmässigt för dig och mig. Sådana resonemang ledde, redan före Laplace, matematiker som Blaise Pascal och Pierre de Fermat under 1600-talet till den klassiska, enkla definitionen av slump och sannolikhet: när vi inget vet är alla möjliga utfall lika sannolika. En viss mängd av möjliga utfall kallas en händelse – säg att du vinner ett tärningsspel om du slår en femma eller en sexa, denna mängd av två olika utfall utgör då en specifik händelse: vinst. Sannolikheten för en händelse är antalet utfall för händelsen dividerat med det totala antalet möjliga utfall – i detta fall är chansen för vinst två dividerat med sex, eller ungefär 33 procent. På detta sätt räknade dessa spelfascinerade herrar ut diverse sannolikheter för kombinationer i kortspel och chanser och risker i alla möjliga hasardsituationer.

Denna klassiska definition av sannolikhet utgår från den totala okunskapen och liknar alltså denna vid en alldeles speciell typ av kunskap: att varje tänkbart utfall har samma sannolikhet. Om detta kan man argumentera fram och tillbaka, men det ger i slutändan ett ganska snävt slumpbegrepp. Slumpen kan ju också ha betydelse i situationer där vi har viss, men inte fullständig kunskap. Vi kan veta att IFK brukar slå AIK eller att Golden Girl vanligen travar snabbare än Clumsy Boy. Det är skillnad mellan slump och likformig slump, där allt är lika möjligt.

Dessutom kan det vara intressant att tala om slumpmässiga händelser trots att utfallen inte bara kan anta ett väldefinierat antal värden (vilket det gör i t ex tärningskast). Detta visste t ex redan 1800-talsmatematikern Carl Friedrich Gauss. Hans s k felfördelning, den klassiska kurvan med utseende som en kyrkklocka, visar hur slumpen fördelas över alla (faktiskt oändligt många!) möjliga värden. I själva verket finns en lång rad exempel på slumpfenomen som inte ryms inom ramen för det enkla och likformiga: alltifrån partiklars s k brownska irrfärd till materiens uppbyggnad av slumpmässiga partiklar i kraftfält, eller evolutionens mer eller mindre slumpmässiga utvecklingsträd av arter.

I början av förra seklet blev det uppenbart att sannolikhetsteorins grundvalar krävde en ny och allmännare formulering. Med hjälp av den nya matematik som växte fram kring sekelskiftet gav den ryske matematikern Andrej Kolmogorov i Grundbegriffe der Wahrscheinlichkeitsrechnung (1933) sannolikhetsläran en ny form.

Kolmogorovs syn på sannolikhet har sedan dess blivit stilbildande. Den kan beskrivas i tre steg: Först måste du ange alla utfall som är förenliga med dina kunskaper om det fenomen som ska studeras. Sedan måste du precisera vilka de händelser är som du vill tillskriva olika sannolikheter. Händelser kan i realiteten utgöras av mycket komplicerade mängder av utfall, och det hörde till det tidiga 1900-talets stora upptäckter att en händelse därför inte alltid kan tillskrivas någon sannolikhet.

Slutligen måste du enligt Kolmogorov göra en uppskattning av sannolikheterna för de olika händelserna. En sådan trippel av (1) tänkbara utfall, (2) olika händelser och (3) sannolikheterna för dessa kallas ett sannolikhetsfält. Ett grundkrav är att sannolikheterna i trippeln måste vara konsistenta: omöjliga händelser ska ha sannolikheten noll, säkra händelser sannolikheten ett, och sannolikheten för att endera av två händelser som utesluter varandra ska inträffa ska vara summan av sannolikheterna för de två händelserna var för sig.

Dessutom ställde Kolmogorov ett mer omstritt krav – ett s k kontinuitetsvillkor: om man betraktar en följd av allt mer orimliga händelser så krävde Kolmogorov att sannolikheten för dessa händelser till slut måste närma sig noll. Detta kan låta trivialt, men i förlängningen bidrar kravet till ett slags objektivt synsätt på sannolikheter. Man talar t ex om relativa frekvenser. När du kastar din tärning om och om igen kommer enligt det objektiva synsättet förhållandet mellan antalet fyror och antalet kast – frekvensen för fyror – allt mer närma sig sannolikheten för att i ett kast slå en fyra, nämligen 1/6. Och görs oändligt många kast så blir slutresultatet verkligen 1/6.

Detta synsätt har kritiserats, framför allt av den italienske matematikern Bruno de Finetti. Han menar att synsättet bygger på matematisk bekvämlighet – det blir lättare att räkna så. I verkligheten går det inte att kasta oändligt många tärningar, och de Finetti menade att valen av sannolikheter alltid är något personligt, ett subjektivt val som görs utifrån just dina kunskaper.

Men huvudströmningen följer i dag i Kolmogorovs spår: sannolikhetsteorin anses stå på empirisk grund. Det personliga valet av sannolikheter betraktas inte som mer subjektivt än något annat i vetenskapen – att du aldrig har något annat att utgå från än dina egna kunskaper är enligt detta sätt att se en trivialitet, något som inte tål att blåsas upp till filosofi.

Mer än bara slump

Finns då slumpen? Som så ofta i vetenskapens utveckling förlorar en till synes avgörande fråga mycket av sin sprängkraft när den placeras i sitt sammanhang. De eviga grälen om viljans frihet ersätts av hjärnforskarnas lugna studium av signalsubstanser – och frågan om vad slumpen är tycks också förlora sin dramatik när den ställs inom ramen för sannolikhetsteori. En händelse anses numera slumpmässig om den kan ses som en av flera möjliga händelser i ett kolmogorovskt sannolikhetsfält . . .

I stället för att ge filosofiska svar på slumpens natur har den statistiska teorin levererat en rad tester som kan användas för att undersöka om en händelse hör till ett visst sannolikhetsfält eller inte. Testerna är i grunden mycket enkla: osannolika händelser tror man inte på, men om en händelse otvetydigt har inträffat, så kan den trots sin påstådda osannolikhet inte betvivlas. I stället riktas misstankarna mot den tänkta slumpmekanismen bakom. Det kanske inte var som vi trodde ändå – vilket Tage Danielsson ju lärde oss!

Låt oss se på det klassiska exemplet med slantsingling. Sannolikheten för att hundra slantsinglingar i följd ger resultatet krona, krona och bara krona är ungefär 0,00000000000000000000000000000079. Skulle vi vara med om detta, ja, då är det klart att vi misstänker något fuffens och att det inte är en slumpföljd av oberoende kast av ett omanipulerat, symmetriskt mynt!

Att avslöja falsk slump

Men vänta nu. Varje följd av hundra kast har ju exakt samma pyttelilla sannolikhet. Om vi symboliserar krona med en etta, och klave med en nolla, varför skulle följden 00101000011100011 . . . vara mer slumpmässig än 11111111111111111 . . . ? På sådana frågor kan man ge olika svar. Den klassiska statistiken formuleras i termer av hypotes och mothypotes, eller som man ofta säger nollhypotes kontra alternativ, där nollhypotesen står för det ”mest slumpmässiga” – inga samband, alla tänkbara symmetrier godtas. I slantsinglingsfallet handlar det om att myntet är symmetriskt och kasten oberoende av varandra. Det naturliga alternativet är väl att myntet är manipulerat så att chansen att få krona i varje enskilt kast är större än 50 procent. I så fall har inte längre alla följder samma sannolikhet: sannolikheten blir i stället beroende av hur många ettor (kronor) följden uppvisar. Det visar sig att om sannolikheten att i varje enskilt kast få en krona kallas p, och antalet kast n, så kan sannolikheten för hela serien av kast beräknas enligt formeln: pn-p101-n.

För sekvensen med hundra ettor (kronor) så blir slutresultatet i själva verket bra mycket större än 0,00000000000000000000000000000079, också om chansen att få en krona i varje kast bara är en liten bit större än 50 procent. Vi har alltså fått en slags måttstock att jämföra sannolikheten med. Om antalet ettor är stort, så är sannolikheten att denna följd skulle ha kommit till på det sätt som vår nollhypotes om total slumpmässighet postulerar oerhört mycket mindre än om vi tar med i beräkningen att myntet är manipulerat. Slutsatsen blir därför att följder som 11111111111111111 . . . inte är slumpmässiga.

Ett bättre test av slumpmässighet?

Men avvikelser från slumpmässighet kan vara mer komplicerade. Den till synes regelbundna följden 010101010101010101 . . . med 50 nollor och 50 ettor skulle inte ha avslöjats av testet ovan. Här störs slumpmässigheten inte av att det har blivit för många ettor utan av att följden alternerar alltför regelbundet. Om detta verkar misstänkt kan man naturligtvis hitta på test med motalternativ som avslöjar regelbundenheten, men det hela börjar därmed också likna litet av ett lappverk. Frågan är om det inte går att formulera ett sammanfattande kriterium på slumpmässighet, ett som avslöjar alla typer av avvikelser från den rena och symmetriska slumpen. I allmänhet verkar detta vara en omöjlig uppgift, men i enkla fall som följder av nollor och ettor borde det väl gå?

Kolmogorov gjorde på 1960-talet ett sådant försök, och andra, däribland den svenske logikern Per Martin-Löf och datalogen Gregory Chaitin, har utvecklat ansatsen (Chaitin kommer förresten i år ut med en ny bok i ämnet, Exploring Randomness, Springer-Verlag). Innehållsmässigt knyter idén an till vad som inledningsvis sades om slumpmässighet som något som uppstår ur svårbeskrivbara situationer. Därutöver utnyttjade Kolmogorov nya framsteg kring matematikens grunder av logiker som Alonzo Church och Kurt Gödel.

Tanken är att följderna 1111111111 . . . och 01010101010 . . . är så långt från slumpmässighet eftersom de är så enkla att beskriva. De korta recepten ”bara ettor” respektive ”börja med en nolla och ta sedan etta och nolla varannan gång” bestämmer ju följdernas innehåll helt och hållet, hur långa de än görs. Kortfattat kan man säga att Kolmogorovs definition av slumpmässighet hos en följd är att denna inte ska kunna genereras av ett ”recept” – en instruktion, algoritm eller ett dataprogram – som är väsentligen kortare än följden själv. Det låter vagt och formulerades i själva verket på ett precist sätt endast för potentiellt oändliga följder – såsom recepten ”1 000 ettor” ,”10 000 ettor” osv, vilka kan generera allt längre följder av ettor trots att de själva håller sig korta och väsentligen likadana.

Kolmogorovs arbeten från 1960-talet väckte stor uppmärksamhet och har fascinerat många, liksom Chaitins undersökningar i hans efterföljd. Men samtidigt har de avgörande genombrotten ändå uteblivit. Det har inte gått att bygga någon ny matematisk teori på Kolmogorovs nya slumpbegrepp. Fortfarande används sannolikhetsteorins traditionella testmetoder för att utröna om datorgenererade slumptal verkligen är slumpmässiga på riktigt – Kolmogorovs algoritmiska definition av slumpmässighet har förblivit isolerad från övrig vetenskap. Den i dag mest spännande utvecklingen av slumpens matematik sker i stället där sannolikhetsteorin används för att förstå fysikens, kemins och inte minst den molekylära biologins grunder. Genom att kunna räkna strikt på osäkra och till synes slumpmässiga fenomen lyfts alltmer av verkligheten in i den noggrant, matematiskt formulerade vetenskapens värld. Men vad slumpen egentligen är lär vi alltså kunna fundera vidare på.

Av Peter Jagers, professor i matematisk statistik vid Chalmers tekniska högskola.

Kosmos

Peter Higgs var lika svårfångad som partikeln som bär hans namn

Fysikern och Nobelpristagaren Peter Higgs blev 94 år. Hans namn lever vidare i Higgspartikeln.

partikelfysik

En stor kamera, linsen mot vänster, människa framför.

Astronomins största digitalkamera är färdig

En tre ton tung digitalkamera står färdig att fraktas till ett teleskop i Chile. Härnäst ska den fraktas till Chile och installeras på teleskopet den är byggd för.

Premium