Vinnare av Tidskriftspriset: Årets rörligt 2024!

Maskiner kan rädda liv. En dator lär sig att diagnosticera hudförändringar på några timmar. För en läkare tar det fem år.
Bild: Getty images

AI bättre än läkare på att upptäcka hudcancer

Människan är chanslös mot maskinerna i ännu en tävlingsgren: Konsten att ställa rätt diagnos på hudförändringar. Tekniken kan rädda liv i kampen mot hudcancer – som drabbar fler än någonsin.

Jag fotograferar några födelsemärken på höger överarm med telefonen för att få dem undersökta. Jag har den typ av hud man bör hålla koll på – blek och med födelsemärken lite här och var.

Många oroar sig för hudcancer. Den allvarligaste formen – malignt melanom – är Sveriges snabbast ökande cancersjukdom. I år kommer den att drabba ungefär 4 500 människor, mer än fyra gånger fler än i början av 90-talet. Risken ökar om man är ljushyllt och ofta solar så mycket att huden blir bränd.

Om en leverfläck ändrar färg eller form, börjar klia eller blir sårig så är det en bra idé att få den undersökt. Om den är elak och blir kvar för länge är risken stor att cancerceller sprider sig och får fäste runt om i kroppen.

Det finns gott om appar som påstås kunna identifiera farliga födelsemärken med hjälp av artificiell intelligens, AI. Men risken är stor att resultaten är opålitliga. En färsk granskning av sex sådana appar – varav två är CE-märkta och därmed får säljas fritt inom EU – visar att ingen lyckades hitta alla fall av melanom och andra cancerformer.

Lär AI hitta hudförändringar

Men det finns andra alternativ. Sajten modelderm.com ingår i ett forskningsprojekt som går ut på att lära AI att identifiera olika slags hudförändringar. Visserligen säger en röd varningstext att resultaten bara ska användas inom forskning, inte för att ställa diagnoser. Men sajten bygger på seriös vetenskap. Datorns bedömningar stämmer väl överens med vad mänskliga experter kommer fram till, enligt koreanska forskare som beskriver metoden i tidskriften Journal of Investigative Dermatology. Så jag laddar upp mina bilder.

Den första fläcken visar sig vara godartad. Algoritmen klassar den som en helt vanlig leverfläck. Sannolikheten för ett malignt melanom är noll.

Jag upprepar proceduren på en fläck lite längre ner på armen. Efter några sekunder anger algoritmen att det troligaste alternativet är en ofarlig pigmentförändring som är vanlig på kroppsdelar utsatta för mycket sol. Bra.

Forskning & Framsteg som ljud!

Här kan du höra inlästa versioner av våra reportage.

Lyssna!

Men på nästa rad finns ett obehagligt ord: Basalcellscancer. Sannolikheten för den diagnosen är enligt datorns beräkningar 17 procent. Samma sannolikhet som att bli träffad av en kula i rysk roulett. Det känns angeläget att få fläcken ordentligt undersökt.

En av Sveriges främsta experter på att diagnosticera hudcancer heter Jan Lapins och är hudläkare på Karolinska universitetssjukhuset Solna. På senare år har han deltagit i arbetet med att träna en variant av artificiell intelligens som kallas maskininlärning i konsten att klassificera olika slags hudförändringar. Målet är att hitta tidiga tecken på cancer.

– Maskininlärning har kommit till ett genombrott nu, säger Jan Lapins.

Han känner inte till den specifika algoritm som analyserade mina leverfläckar men råder mig att ta resultaten med en nypa salt.

En dator kan lära sig ”se” om den får träna på ett stort antal kända bilder. Ju fler desto bättre. Om bilderna föreställer mänskliga hudfläckar som blivit korrekt diagnosticerade kan datorns algoritmer efter ihärdig träning lära sig att särskilja olika slags hudförändringar.

Läkare och AI tävlar i diagnos

Det är bakgrunden till en internationell AI-tävling med fokus på hudcancer, som organisationen International Skin Imaging Collaboration arrangerar varje år. Den första upplagan genomfördes 2018.

– Vi ville låta de skickligaste människorna tävla mot de bästa maskinerna för att ta reda på vad den här forskningen faktiskt duger till, säger Harald Kittler, professor i dermatologi vid Medizinische Universität Wien i Österrike, och initiativtagare till tävlingen.

Undvik de starkaste solstrålarna

Solens ultravioletta strålning är den viktigaste riskfaktorn för hudcancer som det går att påverka. Här är några konkreta råd från Cancerfonden:

Sök skugga. Undvik att vistas i solen när den är som starkast mellan klockan 11 och 15. Barn under ett år bör inte utsättas för direkt solljus.

Skydda huden med kläder. Var speciellt noga med att skydda barn.

Använd solskyddsmedel med hög faktor där kläder inte skyddar. Välj vattenfast solskyddsmedel med hög faktor (minst 30) och som skyddar mot både UVA- och UVB-strålning. Smörj tjockt med några timmars mellanrum eller efter bad.

Sola inte i solarium.

Det första startfältet bestod av 139 algoritmer från AI-laboratorier runt om i världen. Inför kraftmätningen fick de tillgång till drygt 10 000 bilder av hudförändringar, noggrant diagnosticerade bland annat genom mikroskopiska analyser av vävnadssnitt. Jan Lapins var en av hudläkarna som bidrog med träningsbilder åt algoritmerna. Han ingick också i laget av mänskliga experter.

Det första tävlingsmomentet var en uppgörelse mellan maskinerna. De som lyckades bäst använde en typ av djupinlärning som försöker efterlikna kopplingarna mellan nervceller i synbarken hos däggdjur. Några av de mest framgångsrika hade kompletterat sin träning med fler bilder, utöver dem som arrangörerna erbjöd, vilket var fullt tillåtet enligt tävlingsreglerna.

I finalen fick de tre bästa algoritmerna möta ett lag med 27 erfarna mänskliga experter. Tidigare jämförelser mellan hudläkare och AI har främst handlat om att skilja mellan två saker: vanliga födelsemärken och melanom. Nu skulle de tävlande sortera elakartade och godartade hudförändringar i hela sju olika kategorier, vilket är mycket svårare för en algoritm.

Människorna var chanslösa

Tanken var att alla deltagare – såväl människor som maskiner – skulle bedöma flertalet varianter av pigmenterade fläckar som hudläkare undersöker till vardags. Arrangörerna tänkte sig att de många kategorierna skulle leda till svårigheter för datorerna. Så blev det inte.

– Det överraskade mig att människorna var så chanslösa, säger Harald Kittler.

Algoritmerna vann. Resultatet är omtalat inom dermatologin, som är läran om kroppens största organ, huden. Eftersnacket pågår fortfarande i vetenskapliga tidskrifter och diskussionsgrupper för dermatologer i sociala medier. Somliga anser att bilderna var för tillrättalagda. Därför har arrangörerna i den senaste upplagan av tävlingen även infört bilder med dålig skärpa och andra brister, liksom bilder av sällsynta förändringar utöver de sju kategorierna. Resultaten väntas bli klara i sommar.

En annan invändning är att tävlingssituationen var konstgjord. I verkligheten har läkare mer tid på sig än de tjugo sekunder per bild som reglerna medgav. Och i verkligheten kan en läkare ta in mycket mer information genom att undersöka hudfläckar med fingrarna och prata med sin patient.

Experter bedömer hudförändringar

Men i praktiken är det vanligt att experter bedömer hudförändringar utan direkt kontakt med patienten. Så kallad teledermatoskopi innebär att en doktor på en vårdcentral skickar bilder av en misstänkt hudförändring via nätet till erfarna hudspecialister, för att få hjälp med att bedöma om den är farlig eller inte.

Jan Lapins gör sådana bedömningar varje dag. Han har 30 års erfarenhet av att diagnosticera hudförändringar. Trots det lyckades han inte slå algoritmerna i tävlingens upprepade kraftmätningar. Maskinernas bedömningar var helt enkelt mer pålitliga än människornas.

– När det gäller att diagnosticera hudförändringar så tycker jag att den här händelsen påminner om när en dator vann över människan i brädspelet go, säger Jan Lapins.

Här är de sju typer av hudförändringar som var med i tävlingen mellan AI och människa där det handlade om att ställa rätt diagnos.

Frågan är vilken roll AI-system kommer att få på hudkliniker. Jan Lapins tror inte att de kommer att ersätta människor inom den närmsta tiden. Däremot tror han att AI kan bli ett viktigt komplement, och i en avlägsen framtid kan han tänka sig att vanligt folk tar bilder av sina egna hudförändringar med mobilen och via AI får besked om något behöver kollas upp närmare. Men han anser inte att de appar som finns på marknaden i dag är tillräckligt pålitliga.

AI och etik

Utvecklingen väcker etiska frågor. En läkare som gör ett allvarligt misstag kan bli ställd inför Hälso- och sjukvårdens ansvarsnämnd och förlora sin legitimation. Vad händer om misstaget begås av en AI?

Och vad händer med läkarnas kompetens? Enligt Jan Lapins måste man träna varje dag i minst fem år för att bli riktigt bra på att diagnosticera hudförändringar. En dator med tillgång till en stor databas av bilder blir fullärd på några timmar. Det kan leda till att unga läkare hellre specialiserar sig på något annat.

Å andra sidan kan vältränade algoritmer bidra till att fler människor får tillförlitliga diagnoser, i synnerhet i regioner där det är ont om specialiserade hudläkare.

Algoritmerna kan bara bli skickliga om de har tillgång till stora mängder bilder. Dagens databaser består främst av bilder på hudförändringar hos ljushyllta människor med europeisk härkomst. Hudcancer är mindre vanligt bland mörkhyade, men prognosen är ofta sämre på grund av sen upptäckt. Därför behövs fler träningsbilder från människor med olika pigmentering.

Förtroende för AI saknas

För att AI ska fungera i praktiken behövs också förtroende. Den mänskliga kontakten är viktig. En enkätundersökning från i fjol visar att 43 procent av svenskarna skulle lita på en medicinsk diagnos ställd av en artificiell intelligens – förutsatt att en människa också varit inblandad. Bara 8 procent skulle lita på en diagnos ställd enbart av AI.

Mina egna födelsemärken fick blandade resultat av AI. Ingen fläck blev tydligt klassad som elakartad, men en hade oroande hög sannolikhet för att vara basalcellscancer.

Nätverk sorterar fläckar

Klicka för att ladda ner infografiken som PDF.

Jan Lapins tar fram ett dermatoskop, en kraftig lins med inbyggd belysning fäst vid ett handtag av metall. I ett undersökningsrum får jag ligga på en brits med lakan av papper i bara kalsongerna medan han metodiskt går igenom prick efter prick. Det tar ungefär tio minuter.

– Nej, jag ser inga som helst tecken på maligniteter, säger Jan Lapins till slut.

Maskininlärning i all ära. Den artificiella intelligensen må ha gjort ett genombrott. Men inget skingrar en gnagande oro bättre än känslan av att möta en doktor som verkligen kan sin sak.

Algoritmer slukar data i djupa nätverk

Maskininlärning går ut på att programmera en dator så att den lär sig känna igen olika slags mönster via statistiska beräkningar. För att lyckas behöver datorn tillgång till stora mängder data.

Utvecklingen började redan på 1950-talet. Tidiga varianter lärde sig att känna igen vissa bokstäver och tecken men inte så mycket mer. Så småningom började forskare inom AI tvivla på de statistiska metoderna och satsade i stället på regler och logik. Det ledde snabbt till att datorer bland annat lyckades foga samman ord till begripliga meningar och slå människor i brädspelet dam – och till grandiosa förhoppningar om att AI inom kort skulle klara alla slags arbetsuppgifter bättre än människor.

De orimliga visionerna slutade i besvikelse. I början av 1970-talet stod det klart att datorerna visserligen kunde lösa vissa extremt renodlade uppgifter, men floppade stort i mötet med en mer komplicerad verklighet. De var helt enkelt för ointelligenta. Följden blev mindre pengar till AI-projekt och flera år av allmänt missmod, en period som fick namnet ”AI-vintern”.

Sedan dess har årstiderna växlat inom det breda forskningsfält som kallas artificiell intelligens. Gång på gång har perioder av storvulna visioner förbytts i utbredd pessimism.

Just nu befinner sig forskningen om AI i en utdragen värmebölja. Flera framgångar har skapat rubriker. Redan 1997 blev Deep Blue den första datorn som besegrade en regerande världsmästare i schack. Och år 2011 lyckades datorn Watson utklassa två mänskliga mästare i frågesporten Jeopardy. Något år senare ledde utvecklingen till att neurala nät plötsligt blev mycket bättre på att analysera mänskligt tal och – inte minst – bilder.

Sedan 1990-talet slår maskiner de absolut bästa människorna på schack och sedan 2016 gäller det också det mycket intrikata spelet go. Här går den 19-åriga Ke Jieen en match mot Googles AlphaGo i Wuzhen 2017.
Bild: AFP / TT

En av de största triumferna för AI hittills inträffade i mars 2016. I fyra av fem matcher besegrade datorn AlphaGo den regerande världsmästaren Lee Sedol i brädspelet go. Det var en större bedrift än att klå en schackmästare. I go är reglerna enkla men förflyttningarna extremt invecklade. Det sägs att antalet möjliga partier är långt större än antalet atomer i den synliga delen av universum.

Framgångarna bygger på genombrott inom en gren av maskininlärning som kallas djupinlärning. Tekniken fungerar ofta bra när det gäller att identifiera föremål på en bild. Här handlar ordet ”djup” inte om djupsinnigt tänkande, utan om att datorn gör statistiska beräkningar i nätverk med många lager, så kallade djupa nätverk. Förebilden finns i hjärnans olika lager av sammankopplade nervceller.

F&F i din mejlbox!

Håll dig uppdaterad med F&F:s nyhetsbrev!

Beställ nyhetsbrev

Kunskap baserad på vetenskap

Prenumerera på Forskning & Framsteg!

Inlogg på fof.se • Tidning • Arkiv med tidigare nummer

Beställ i dag!

Medicin & hälsa

Upptäck F&F:s arkiv!

Se alla utgåvor