Hvordan kan kunstig intelligens avgjøre om en sædcelle er god til å svømme? Foto: Michael Riegler, Simula

Kunstig intelligent befruktning

Algoritmen vurderer om en sædcelle er sunn eller ikke.

Publisert

Menn som har for dårlig sædkvalitet er et voksende problem i dagens samfunn. Manuell sædanalyse er kostbart og tidkrevende, og krever også omfattende opplæring for å oppnå reproduserbare resultater.

For å lette arbeidet ble automatisert sædanalyse (computer-aided sperm analysis; CASA) utviklet på 1980-tallet. Det viste seg likevel å være utfordrende å oppnå pålitelige og reproduserbare svar fra CASA. To av grunnene var bakgrunnsstøy fra partikler eller andre typer celler, samt vanskeligheter for datamaskinen å følge spermienes bevegelsesmønster.

Automatisk analyse av kliniske data har utviklet seg mye siden 1980-tallet. Utviklingen har særlig skjedd innen multimodal bildeanalyse, der en algoritme lærer fra flere datakilder samtidig.

Jeg er med i en forskergruppe der vi bruker avanserte maskinlæringsmetoder for å analysere videoer av sædprøver.

De nyeste resultatene våre viser at maskinlæring kan være et nyttig verktøy i å vurdere sædkvaliteten(1). Vi har vist at bruk av sofistikerte maskinlæringsmetoder i analyse av spermievideoer er lovende for å forutsi spermienes bevegelse, såkalt spermiemotilitet.

Eksempler på bilder fra videoer av sædprøver med forskjellige konsentrasjoner (kolonner) og de fire forestillinger som brukes til å trene de nevrale nettverksbaserte algoritmer (rader). Bilderepresentasjon; 1) original video, 2) sparsom optisk flyt, 3) tett optisk flyt og 4) vertikal rammematrise.
Eksempler på bilder fra videoer av sædprøver med forskjellige konsentrasjoner (kolonner) og de fire forestillinger som brukes til å trene de nevrale nettverksbaserte algoritmer (rader). Bilderepresentasjon; 1) original video, 2) sparsom optisk flyt, 3) tett optisk flyt og 4) vertikal rammematrise.

Vi analyserte videoer av svømmende sædceller i sædprøver fra 85 deltakere. I motsetning til CASA, der analysen blir påvirket av konsentrasjonen av spermier i prøven, viste resultatene våre at utvalgte dype læringsalgoritmer for spermiemotilitet ikke ble påvirket av spermiekonsentrasjonen. Videre fant vi metoden vår gjorde det bedre ved å inkludere tidsinformasjon fra videoene, slik at algoritmene tolket bildene som del av en serie og ikke isolerte og usammenhengende bilder.

Et av de viktigste funnene våre er at metoden vår er i stand til å forutsi andelen spermier som beveget seg i prøven på bare fem minutter, langt raskere enn manuelle analyser.

Mer informasjon for å gjøre algoritmene bedre

Fremover blir det viktig å evaluere maskinlæringsalgoritmene våre med omhu, da beregninger av for eksempel nøyaktighet med høy prosent sjelden er en indikator på en robust og godt fungerende algoritme.

Studien vår er den første som brukte en multimodal tilnærming, og vi inkluderte lett tilgjengelige data om alder, kroppsmasseindeks (BMI) og dager med seksuell avholdenhet før sædprøven ble avlagt. Målet var å undersøke om personopplysningene kunne bedre algoritmenes evne til å forutsi andelen svømmende spermier i prøvene.

Vi fant at den ekstra informasjonen ikke gjorde at algoritmene gav et bedre svar. Årsaken kan være at vi ikke inkluderte den mest relevant typen data. Vi har tidligere vist at andre deltakerrelaterte data kan resultere i bedre resultater (2,3).

Fremover håper vi å undersøke ulike kategorier av deltakerdata, og hvordan de bør kombineres med bildeanalysene for å øke nøyaktigheten.

I en tid hvor mange diskuterer åpne data i forskningen, vil jeg også trekke frem at studien vår ble utført på et datasett som er offentlig tilgjengelig. Hvem som helst kan derfor reprodusere resultatene våre og utføre egne analyser med de tilgjengelige dataene (4).

Samlet sett viser funnene våre at maskinlæring åpner nye muligheter for å bidra til å løse utfordringene for menn som har for lav sædkvalitet.

Vi bør sette høye krav til kvalitet og grundighet i evalueringen av de nye metodene, og arbeide for å unngå en flom av resultater med begrenset relevans. Selv om maskinlæring er et buzz-ord, betyr det ikke at vi bør ta lett på forskningen (5).

Referanser:

1. Hicks SA, Andersen JM, Witczak O, et al. Machine learning-based analysis of sperm videos and participant data for male fertility prediction. Nature Sci Rep 2019; 9, 16770. doi:10.1038/s41598-019-53217-y2.

2. Riegler MA, Andersen JM, Hammer HL, et al. Artificial intelligence as a tool in predicting sperm motility and morphology. Hum Reprod 2019; 34: suppl 1, P-116.

3. Witczak O, Andersen JM, Hicks SA, et al. Artificial intelligence predicts sperm motility from sperm fatty acids. Hum Reprod 2019; 34: suppl 1, P-120.

4. Haugen TB, Hicks SA, Andersen JM, et al. VISEM: a multimodal video dataset of human spermatozoa. In Proceedings of the 10th ACM Multimedia Systems Conference 2019: pp 261-266).

5. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med 2019; 25: 44-56