

Prickar på huden av skilda slag är vanliga och som regel helt ofarliga. Soligt väder kan göra dem mer framträdande. Överdrivet solande är en viktig orsak till hudcancer.

Maskiner kan rädda liv. En dator lär sig att diagnosticera hudförändringar på några timmar. För en läkare tar det fem år.
AI bättre än läkare på att upptäcka hudcancer
Människan är chanslös mot maskinerna i ännu en tävlingsgren: Konsten att ställa rätt diagnos på hudförändringar. Tekniken kan rädda liv i kampen mot hudcancer – som drabbar fler än någonsin.
Jag fotograferar några födelsemärken på höger överarm med telefonen för att få dem undersökta. Jag har den typ av hud man bör hålla koll på – blek och med födelsemärken lite här och var.
Många oroar sig för hudcancer. Den allvarligaste formen – malignt melanom – är Sveriges snabbast ökande cancersjukdom. I år kommer den att drabba ungefär 4 500 människor, mer än fyra gånger fler än i början av 90-talet. Risken ökar om man är ljushyllt och ofta solar så mycket att huden blir bränd.
Om en leverfläck ändrar färg eller form, börjar klia eller blir sårig så är det en bra idé att få den undersökt. Om den är elak och blir kvar för länge är risken stor att cancerceller sprider sig och får fäste runt om i kroppen.
Det finns gott om appar som påstås kunna identifiera farliga födelsemärken med hjälp av artificiell intelligens, AI. Men risken är stor att resultaten är opålitliga. En färsk granskning av sex sådana appar – varav två är CE-märkta och därmed får säljas fritt inom EU – visar att ingen lyckades hitta alla fall av melanom och andra cancerformer.
Lär AI hitta hudförändringar
Men det finns andra alternativ. Sajten modelderm.com ingår i ett forskningsprojekt som går ut på att lära AI att identifiera olika slags hudförändringar. Visserligen säger en röd varningstext att resultaten bara ska användas inom forskning, inte för att ställa diagnoser. Men sajten bygger på seriös vetenskap. Datorns bedömningar stämmer väl överens med vad mänskliga experter kommer fram till, enligt koreanska forskare som beskriver metoden i tidskriften Journal of Investigative Dermatology. Så jag laddar upp mina bilder.
Den första fläcken visar sig vara godartad. Algoritmen klassar den som en helt vanlig leverfläck. Sannolikheten för ett malignt melanom är noll.
Jag upprepar proceduren på en fläck lite längre ner på armen. Efter några sekunder anger algoritmen att det troligaste alternativet är en ofarlig pigmentförändring som är vanlig på kroppsdelar utsatta för mycket sol. Bra.
Men på nästa rad finns ett obehagligt ord: Basalcellscancer. Sannolikheten för den diagnosen är enligt datorns beräkningar 17 procent. Samma sannolikhet som att bli träffad av en kula i rysk roulett. Det känns angeläget att få fläcken ordentligt undersökt.

Jan Lapins är hudläkare på Karolinska universitetssjukhuset i Solna och en av Sveriges främsta experter på att diagnosticera hudcancer.

Ett dermatoskop gör det lättare att se hudförändringar i detalj. Instrumentet är ett slags förstoringsglas med inbyggd lampa.

Daglig träning i minst fem år krävs om man ska bli riktigt bra på att diagnosticera hudförändringar, enligt Jan Lapins.

Hudläkare har byggt upp databaser med stora mängder bilder av väl kartlagda hudförändringar. Databaserna gör det möjligt för datorer med artificiell intelligens att lära sig sortera hudprickar.
En av Sveriges främsta experter på att diagnosticera hudcancer heter Jan Lapins och är hudläkare på Karolinska universitetssjukhuset Solna. På senare år har han deltagit i arbetet med att träna en variant av artificiell intelligens som kallas maskininlärning i konsten att klassificera olika slags hudförändringar. Målet är att hitta tidiga tecken på cancer.
– Maskininlärning har kommit till ett genombrott nu, säger Jan Lapins.
Han känner inte till den specifika algoritm som analyserade mina leverfläckar men råder mig att ta resultaten med en nypa salt.
En dator kan lära sig ”se” om den får träna på ett stort antal kända bilder. Ju fler desto bättre. Om bilderna föreställer mänskliga hudfläckar som blivit korrekt diagnosticerade kan datorns algoritmer efter ihärdig träning lära sig att särskilja olika slags hudförändringar.
Läkare och AI tävlar i diagnos
Det är bakgrunden till en internationell AI-tävling med fokus på hudcancer, som organisationen International Skin Imaging Collaboration arrangerar varje år. Den första upplagan genomfördes 2018.
– Vi ville låta de skickligaste människorna tävla mot de bästa maskinerna för att ta reda på vad den här forskningen faktiskt duger till, säger Harald Kittler, professor i dermatologi vid Medizinische Universität Wien i Österrike, och initiativtagare till tävlingen.
Det första startfältet bestod av 139 algoritmer från AI-laboratorier runt om i världen. Inför kraftmätningen fick de tillgång till drygt 10 000 bilder av hudförändringar, noggrant diagnosticerade bland annat genom mikroskopiska analyser av vävnadssnitt. Jan Lapins var en av hudläkarna som bidrog med träningsbilder åt algoritmerna. Han ingick också i laget av mänskliga experter.
Det första tävlingsmomentet var en uppgörelse mellan maskinerna. De som lyckades bäst använde en typ av djupinlärning som försöker efterlikna kopplingarna mellan nervceller i synbarken hos däggdjur. Några av de mest framgångsrika hade kompletterat sin träning med fler bilder, utöver dem som arrangörerna erbjöd, vilket var fullt tillåtet enligt tävlingsreglerna.
I finalen fick de tre bästa algoritmerna möta ett lag med 27 erfarna mänskliga experter. Tidigare jämförelser mellan hudläkare och AI har främst handlat om att skilja mellan två saker: vanliga födelsemärken och melanom. Nu skulle de tävlande sortera elakartade och godartade hudförändringar i hela sju olika kategorier, vilket är mycket svårare för en algoritm.
Människorna var chanslösa
Tanken var att alla deltagare – såväl människor som maskiner – skulle bedöma flertalet varianter av pigmenterade fläckar som hudläkare undersöker till vardags. Arrangörerna tänkte sig att de många kategorierna skulle leda till svårigheter för datorerna. Så blev det inte.
– Det överraskade mig att människorna var så chanslösa, säger Harald Kittler.
Algoritmerna vann. Resultatet är omtalat inom dermatologin, som är läran om kroppens största organ, huden. Eftersnacket pågår fortfarande i vetenskapliga tidskrifter och diskussionsgrupper för dermatologer i sociala medier. Somliga anser att bilderna var för tillrättalagda. Därför har arrangörerna i den senaste upplagan av tävlingen även infört bilder med dålig skärpa och andra brister, liksom bilder av sällsynta förändringar utöver de sju kategorierna. Resultaten väntas bli klara i sommar.
En annan invändning är att tävlingssituationen var konstgjord. I verkligheten har läkare mer tid på sig än de tjugo sekunder per bild som reglerna medgav. Och i verkligheten kan en läkare ta in mycket mer information genom att undersöka hudfläckar med fingrarna och prata med sin patient.
Experter bedömer hudförändringar
Men i praktiken är det vanligt att experter bedömer hudförändringar utan direkt kontakt med patienten. Så kallad teledermatoskopi innebär att en doktor på en vårdcentral skickar bilder av en misstänkt hudförändring via nätet till erfarna hudspecialister, för att få hjälp med att bedöma om den är farlig eller inte.
Jan Lapins gör sådana bedömningar varje dag. Han har 30 års erfarenhet av att diagnosticera hudförändringar. Trots det lyckades han inte slå algoritmerna i tävlingens upprepade kraftmätningar. Maskinernas bedömningar var helt enkelt mer pålitliga än människornas.
– När det gäller att diagnosticera hudförändringar så tycker jag att den här händelsen påminner om när en dator vann över människan i brädspelet go, säger Jan Lapins.
Här är de sju typer av hudförändringar som var med i tävlingen mellan AI och människa där det handlade om att ställa rätt diagnos.

1 | Aktinisk keratos, en ytlig cellförändring i överhuden på en kind. Oftast rodnade och fjälliga och när de som här är brunt pigmenterade kan de förväxlas med vissa typer av melanom. Dermatoskopiskt ses bruna linjer orsakade av pigmenterade fjäll.

2 | Basalcellscancer, den vanligaste typen av hudcancer som i detta fall är blågrått pigmenterad och kan då imitera malignt melanom.

3 | En morbus Bowen, en ytligt växande skivepitelcancer, som i detta fall är pigmenterad och därför kan imitera melanom.

4 | Dermatofibrom, en godartad bindvävsknuta, oftast lätta att känna igen men kan ibland likna maligna hudtumörer.

5 | Ett hemangiom, en godartad blodkärlsknuta, som i detta fall är blå i färgen och kan då ha vissa likheter med melanom eller pigmenterad basalcellscancer.

6 | Ett malignt melanom, den allvarligaste typen av hudcancer. Oregelbundet pigmenterad och strukturerad i brunt, blått och svart med en förtjockning centralt.

7 | Ett nevus, ett vanligt födelsemärke, med jämn struktur och färg.
Frågan är vilken roll AI-system kommer att få på hudkliniker. Jan Lapins tror inte att de kommer att ersätta människor inom den närmsta tiden. Däremot tror han att AI kan bli ett viktigt komplement, och i en avlägsen framtid kan han tänka sig att vanligt folk tar bilder av sina egna hudförändringar med mobilen och via AI får besked om något behöver kollas upp närmare. Men han anser inte att de appar som finns på marknaden i dag är tillräckligt pålitliga.
AI och etik
Utvecklingen väcker etiska frågor. En läkare som gör ett allvarligt misstag kan bli ställd inför Hälso- och sjukvårdens ansvarsnämnd och förlora sin legitimation. Vad händer om misstaget begås av en AI?
Och vad händer med läkarnas kompetens? Enligt Jan Lapins måste man träna varje dag i minst fem år för att bli riktigt bra på att diagnosticera hudförändringar. En dator med tillgång till en stor databas av bilder blir fullärd på några timmar. Det kan leda till att unga läkare hellre specialiserar sig på något annat.
Å andra sidan kan vältränade algoritmer bidra till att fler människor får tillförlitliga diagnoser, i synnerhet i regioner där det är ont om specialiserade hudläkare.
Algoritmerna kan bara bli skickliga om de har tillgång till stora mängder bilder. Dagens databaser består främst av bilder på hudförändringar hos ljushyllta människor med europeisk härkomst. Hudcancer är mindre vanligt bland mörkhyade, men prognosen är ofta sämre på grund av sen upptäckt. Därför behövs fler träningsbilder från människor med olika pigmentering.
Förtroende för AI saknas
För att AI ska fungera i praktiken behövs också förtroende. Den mänskliga kontakten är viktig. En enkätundersökning från i fjol visar att 43 procent av svenskarna skulle lita på en medicinsk diagnos ställd av en artificiell intelligens – förutsatt att en människa också varit inblandad. Bara 8 procent skulle lita på en diagnos ställd enbart av AI.
Mina egna födelsemärken fick blandade resultat av AI. Ingen fläck blev tydligt klassad som elakartad, men en hade oroande hög sannolikhet för att vara basalcellscancer.
Jan Lapins tar fram ett dermatoskop, en kraftig lins med inbyggd belysning fäst vid ett handtag av metall. I ett undersökningsrum får jag ligga på en brits med lakan av papper i bara kalsongerna medan han metodiskt går igenom prick efter prick. Det tar ungefär tio minuter.
– Nej, jag ser inga som helst tecken på maligniteter, säger Jan Lapins till slut.
Maskininlärning i all ära. Den artificiella intelligensen må ha gjort ett genombrott. Men inget skingrar en gnagande oro bättre än känslan av att möta en doktor som verkligen kan sin sak.
Du har just läst en text ur nummer 6/2020 av tidskriften Forskning & Framsteg. Vill du läsa mer? Prenumerera här!
Forskning & Framsteg berättar om fackgranskade forskningsresultat och om pågående forskning. Våra texter ska vara balanserade och trovärdiga, och sätta forskningsresultaten i sitt sammanhang för att göra dem begripliga. Forskning & Framsteg har rapporterat om vetenskap sedan 1966.
Prenumerera på Forskning & Framsteg!
Tidskriften med faktakollade och ögonöppnande reportage och vetenskapsnyheter utkommer med 10 nummer per år.