Språkmodellen ger kreativitet åt matematik-AI

En maskin för matematikgåtor visar hur framtidens AI kan vara uppbyggd.

Text Anna Davour

Publicerad 2024-01-30

Människor kan lösa geometriproblem genom att pröva sig fram med papper och penna.
Bild: Josef F. Stuefer, Getty images

Traditionella AI-program som löser matematikproblem använder förprogrammerade regler. De kan bli bättre genom att kombineras med en språkmodell, som liknar den kända AI-tjänsten Chat GPT.

En grupp forskare från AI-företaget Google Deepmind och New York University i USA har kombinerat ett program som härleder matematiska bevis med en specialtränad språkmodell. På så vis har de konstruerat bevismaskinen Alphageometry och lärt den att lösa geometriproblem. Sådana problem brukar gå ut på att bevisa att vissa relationer gäller mellan olika delar av geometriska figurer. Maskinen har testats på problem från Internationella Matematikolympiaden, en prestigefylld matematiktävling för gymnasieelever som hållits sedan 1950-talet, och presterar på nästan samma nivå som en mänsklig guldmedaljör.

Vägen framåt för AI

AI-forskaren Moa Johansson vid Chalmers tekniska högskola säger att sättet att bygga ihop flera sorters AI-system liknar de metoder hennes egen forskargrupp arbetar med. Att kombinera traditionella AI-system som bygger på regler och algoritmer och sådana som bygger på maskininlärning med artificiella neuronnät är vägen framåt inom AI-forskningen, anser hon.

– De har integrerat de här systemen på ett bra sätt för att spela på de respektive systemens styrkor, säger Moa Johansson.

Språkmodellen bidrar med något som skulle kunna kallas kreativitet. Medan det traditionella systemet testar sig fram med en uppsättning regler kan språkmodellen gissa ett steg som ser ut som om det skulle kunna passa in i en lösning. Det hjälper det symboliska systemet att hitta framåt, och inte fastna. Det kan till exempel handla om att införa extra hjälppunkter i ett diagram.

När systemet testades på olympiadproblemen genererade det lösningar och redovisade dem steg för steg. Forskarna lät en erfaren person rätta lösningarna.

Långt från generell intelligens

Även om maskinen löser geometriproblem på samma nivå som de bästa gymnasieungdomarna i världen skulle den inte klara sig i en riktig matematikolympiad där de tävlande testas i flera olika grenar av matematiken.

– Det här är absolut inte någon generell intelligens. Det här systemet är specialiserat på en specifik typ av uppgift, säger Moa Johansson.

Maskinen fungerar enbart på plan geometri, med figurer som går att rita på ett papper.

Språkmodellen har tränats på en mycket stor mängd syntetiskt genererade geometriresonemang. På det viset fick den stor erfarenhet av hur bevis i just den här sortens matematik brukar se ut. Det ger Alphageometry en fördel jämfört med hur det har fungerat att lösa geometriproblem med sedvanliga datorprogram för matematik.