Biologi: The next generation

Kanske har du läst om att forskare läst av dna, hela genom, från allt från ben från människor och mammutar som levde under istiden till cancerceller och mikroorganismer. Tekniken som gjort det möjligt kallas next generation sequencing och jag vill förklara hur det går till för dig.

Ofantliga mängder genetisk information överförs just nu från organismer till datorer. Tidigare i höstas var jag och besökte SciLifeLab i Uppsala där flera stora sekvenseringsmaskiner står och arbetar. Det var som att kliva in i ett rymdskepp. De modernt designade maskinerna med vita och blå detaljer och led-belysning stod på rad. Det var som att jag inte insett vidden av den teknikutveckling som skett på de tio år som gått sedan jag doktorerade och försökte använda den tidens dna-teknik.

När jag som doktorand sökte efter dna-sekvenser var det som att skicka ner en metkrok i olika delar av en sjö och hoppas att det var en abborre där. Nu för tiden får man ut positionen för varenda fisk i hela sjön på en gång och mer därtill. Det är den enorma kraften bakom den har tekniken.

På den tiden var labben ofta stolta över sin sekvenseringsmaskin, en investering på dryga miljonen. Mina egna prover bestod av dna-fragment på knappt 1000 baspar från en växt. En labbassistent stoppade på en platta där 96 prover fick plats. Maskinen körde sedan ett prov åt gången och stod oftast och körde över natten. Det var bara några av mina prov som lyckades och det vore synd att säga att jag revolutionerade biologin med dem. Jag var tvungen att veta vad jag letade efter i förväg, jag sökte efter en nål i en genetisk höstack, som efter en speciell abborre i hela Mälaren. Det gick sådär. Idag hoppar biologerna över det steget. De får meta på fritiden istället.

Nu är det enklare och mycket billigare. Säg att du är intresserad av att hitta en genetisk förändring hos en växtindivid med en unik egenskap (som jag var). Då tar du ett cellprov från växten som du sedan renar fram dna från, allt dna som finns i dessa celler. Det är hela den växtindividens genom och många kopior dessutom eftersom du kommer att ha många celler i provet. Sedan skickar du helt enkelt in det renade dna:t till en plats som SciLifeLab. Där tar deras labbassistenter över.

De tar ditt prov och bryter sönder det genomiska dna:t till mindre fragment, med den vanligaste tekniken ska de bli till massor av bitar på 150 baspar. Alla miljoner fragment från ditt prov ligger nu i ett litet rör huller om buller. Därefter hälls provet ut på en flödescell, den ser ut lite som ett objektsglas till ett mikroskop men har svarta fält mellan åtta stycken avlånga kanaler. Det speciella med flödescellen är att det sitter massor – flera miljoner – små stubbar där dna-fragmenten från ditt prov fastnar. Sedan sätter själva sekvenseringsprocessen igång (animation).

Sekvenseringsmaskinen låter en vätska med fria baser, alltså adenin, guanin, cytosin och tymin, rinna över flödescellen där alla dina miljoner dna-fragment sitter fast på stubbarna. Men det är inte vilka baser som helst, de här baserna är färgmärkta så att adenin är märkt med en gul flouricerande färg, guanin med blå, cytosin med röd och tymin med grön.

Vid varje fragment kan bara en bas fastna – och de sätter sig där de har sin komplementbas. Den färgmärkta basen C kan bara fastna på G och T kan bara fastna på A och vice versa. Kom ihåg att detta händer på de flera miljoner dna-fragment som kommer från ditt prov. Sedan lyser en laser över flödescellen, alla flouricerande baser lyser upp och en kamera tar en bild av det hela. Nu har en bas, alltså en nukleotid, lästs av per fragment. Sedan sköljs färgmärkningen bort med själva basen sitter kvar.

Proceduren upprepas. Nya färgmärkta baser skickas in, de fastnar, lasern lyser, en ny bild tas. Färgmärkningen sköljs bort och detta upprepas 150 gånger.

Nu har sekvenseringsmaskinen tagit 150 bilder av flera miljoner dna-fragment. Bilderna analyseras och omvandlas till bioinformation – digital information om ordningsföljden av C, T, G och A i de fragment som kommer från ditt prov. Det är nu du behöver ta en dator till hjälp.

Du har nu en fil med flera miljoner dna-sekvenser på runt 150 baspar men du vet inte själv hur du ska pussla ihop dessa så att du får ut en fullständig dna-sekvens, ett helt genom. Det låter du en dator göra. Datorn tar ett fragment på 150 baspar och ser var det passar in på en referenssekvens över hela växtartens genom. Sedan tar den nästa sekvens och placerar in den. För säkerhets skull, och eftersom man kan, vill man att varje del av referensgenomet ska täckas av 30 fragment från ditt prov. Det kallas coverage och används som ett mått på hur bra sekvenseringen gått.

Nu kan du som forskare ta över, eller så tar du hjälp av en duktig bioinformatiker. Det som har hänt är att du överfört den genetiska information som fanns kemiskt i dna-molekylerna hos växten till digital information som processorer kan bearbeta. Med hjälp av modern datorkraft kan du låta datorn leta efter de platser i genomet som skulle kunna ligga bakom den speciella egenskap som växten hade. Det kostar bara en bråkdel av vad mina trevande försök med sekvenseringstekniken gjorde i början av 2000-talet och ger en enorm mängd information. Möjligheterna för biologin idag är svindlande.