Sublime visualiseringer av stordata

Av Jill Walker Rettberg, Professor i digital kultur, Universitetet i Bergen

Du vet de datavisualiseringene som viser deg så mye data så effektivt at du mister pusten og bare må stoppe og stirre et lite øyeblikk? Jeg følte det sånn første gangen jeg så Benglers visualisering av hvor folk flytter i Norge, eller da jeg zoomet gjennom Stravas Global Heatmap som viser alle sykkelturene til alle brukerne i alle land.  

I det siste har forskere begynt å snakke om det sublime i datavisualiseringer. Datamengdene er så «absolutt store» (som Kant kanskje ville ha sagt) at det overgår den menneskelige fatteevnen. Det gir oss følelsen av å se noe sublimt, ikke så ulikt 1800-tallets vandrer som så utover enorme fjellkjeder eller ville stormer på havet og følte ærefrykt. Kanskje du har følt noe av den ærefrykten, følelsen av at du ikke helt kan forstå hva dataene betyr, men at det er stort og viktig.

Men er sublime visualiseringer nyttige? Og i så fall, for hva og for hvem?

Caspar David Friedrichs Vandrer over tåkehav (1817) er et klassisk maleri som representerer følelsen av å erfare det sublime. (Kunsthalle Hamburg/Wikimedia)
Caspar David Friedrichs Vandrer over tåkehav (1817) er et klassisk maleri som representerer følelsen av å erfare det sublime. (Kunsthalle Hamburg/Wikimedia)

Det sublime er et gammelt konsept, som først ble brukt av Longinus for omtrent 2000 år siden. For Longinus var det sublime en retorisk teknikk brukt i en tale for å «overkomme de rasjonelle evnene» til publikum. Publikumet blir «ravished, or more disturbingly, raped by the power of words,» forklarer Philip Shaw (s. 5). 

Noen datavisualiseringer er definitivt retoriske forsøk på å overbevise et publikum om noe. Men interessant nok, er den viktigste retoriske påstanden til en datavisualisering at den viser oss dataene. Bare fakta. Datavisualiseringer appellerer til vår rasjonalitet, de lover oss en «fantasy of knowing». 

Kant er nok den filosofen som har hatt mest innflytelse på vår forståelse av det sublime. Mens Longinus så på det sublime som en retorisk teknikk for å påvirke folk, så forsto Kant det sublime som en menneskelig respons til storhet i kunst eller natur. Han skilte mellom det dynamisk sublime, hvor du i grunnen er livredd for det du ser, men hvor du ser fra et trygt sted, og det matematisk sublime, som er mer relevant for datavisualiseringer.

Det matematisk sublime vekkes i oss når vi sanser noe som er absolutt stort. Noe er absolutt stort, skriver Kant, når vi ikke tenker på det som større enn eller mindre enn andre ting, det er rett og slett stort uten sammenligning, og dermed kan vi ikke begripe det matematisk. Så hvis du ser opp på Fløyen og tenker at det er et ganske stort fjell, større enn Løvstakken, men ikke så stort som Ulriken, ja da har du nok ikke en sublim opplevelse. Men om du ligger på gresset en sommernatt og ser på Melkeveien, eller du ser på et maleri av et fjell som ser helt overveldende stort ut, eller du tenker på uendelig kjærlighet, ja da opplever du kanskje det sublime.

Det sublime for Kant ligger ikke i objektet men i vår erfaring av det. Så jeg opplever kanskje noe sublimt når jeg zoomer gjennom Stravas globale kart over alle sykkelrutene til alle dens brukere, eller når jeg ser på bilder av jorden sett fra verdensrommet, men disse tingene er ikke sublime i seg selv. Hvis de faktisk vekker det sublime i meg, så er det fordi jeg kan sanse men ikke fullt ut forstå det jeg ser: Dataene som er vist, er så absolutt store at jeg verken kan kalkulere eller forstå størrelsen av dem rasjonelt. Noe av lysten vi forbinder med det sublime, skriver Kant, ligger i det at vi vokser på erfaringen av det uendelige som lar oss strekke oss forbi det sansbare (Kritikk av dømmekraften, §26).

Stort er ikke alltid et stort nok ord for stordata. Ta Stravas Global Heatmap, for eksempel. Det visualiserer løpingen og syklingen til brukerne over hele verden. Det er, leste jeg i en bloggpost som introduserte kartet, «the largest, richest, and most beautiful dataset of its kind,» og inneholder:

  • 1 milliard aktiviteter
  • 3 billiarder aktiviteter
  • 13 billiarder rasteriserte piksler
  • 10 terrabytes med rådata
  • En totalavstand på 27 milliarder km
  • En total aktivitetsvarighet på 200.000 år
  • 5% av all landmasse på jorden dekket av brikker

Det er stort. Enormt. Kanskje det til og med er «absolutt stort» i Kants forstand. 

Når du åpner Strava Heatmap så ser du et kart over San Francisco med lysende linjer på kryss over tvers som viser hvor folk har løpt og syklet. Hvis du ikke er så kjent i San Francisco begynner du kanskje i søkefeltet, ved å skrive inn navnet på et sted du kjenner bedre. Bergen, kanskje. Kartet zoomer ut, og flyr deg over en spinnende globus for å zoome inn et nytt sted, den svimlende zooming vi etterhvert kjenner godt fra Google Earth og andre kart som straks forteller oss at vi nettopp er globale.

Bergenskartet har også linjer av lys tegnet over det, som linjene vi tegner på natthimlen med SPARKLERS på nyttårsaften. Når jeg klikker en knapp for å legge det kjente satelittkartet som et lag under lyslinjene ser jeg at stiene som er valgt er helt andre enn de som er størst på Google Maps. Strava-kartet viser at folk har valgt gangstier og trapper, sykkelveier og natur. De går langs vannet, opp Fløyens sikksakkveier, og de sterkeste linjene er i skogen hvor ingen biler kjører. 

Bergen som sett av Strava.
Bergen som sett av Strava.

Men er dette en datavisualisering da? Er det ikke bare et kart? 

Joda, det er en datavisualisering. Lyslinjene er visualiseringer av numeriske data. Kanskje det blir tydeligere om du ser på en annen visualisering av noe av den samme rådataen som brukes til Global Heatmap:

Fra Stravas årlige rapport, 2017.
Fra Stravas årlige rapport, 2017.

Mye mer hverdagslig, syns du ikke? Jeg føler i hvert fall ingen ærefrykt når jeg ser på det bildet. Ikke når jeg ser på dette neste, heller:

Sykkelaktivister i Glasgow <a href="https://glasgowcycleman.files.wordpress.com/2015/06/glasgow_cycling_strava_evidence.pdf">kombinerte Strava data med byens egne opptellinger</a> av syklister for å argumentere at det var behov for bedre sykkelveier. 
Sykkelaktivister i Glasgow kombinerte Strava data med byens egne opptellinger av syklister for å argumentere at det var behov for bedre sykkelveier. 

Begge disse visualiseringene er nyttige og kan brukes til å støtte visse argumenter. Stravas globale data blir bruk av geografer, byplanleggere og aktivister for å designe bedre byer eller finne ut bedre måter å støtte en sunn befolkning – gjør et søk i Google Scholar så finner du en god del publikasjoner som gjør nettopp dette. 

Kanskje det zoombare verdenskartet i Stravas Global Heatmap er like informativt som tidspunktvisualiseringen og aktivistvisualiseringen. De visualiserer bare andre aspekter av den samme dataen. Men de to siste vekker ikke det sublime som verdenskartet gjør.

Vekker bergenskartet til Strava en følelse av noe sublimt i meg bare fordi jeg vet hvordan fjellene og fjordene ser ut, og jeg ser for meg at jeg ser på dem som Caspar David Friedrichs «Vandrer»?

Jeg tror ikke det. Jeg tror det er den «absolutte storheten» til dataene i seg selv jeg blir overveldet av. Og det er ikke bare en følelse av ærefrykt for akkurat bergenskartet jeg kjenner på, følelsen handler om det globale kartet. Jeg kom til bergenskartet ved å zoome forbi en jordklode full av en mengde data som jeg ikke er i stand til å fatte. Bare ved å zoome ut og fly over et kart som representerer en spinnende klode blir vi minnet om hvor små vi er i forhold til jorden. Den rammen er viktig. Og som Martin Engebretsen har drøftet, har zoombare kart er blitt en velkjent sjanger innen datavisualisering.

Verden sett fra Stravas synspunkt.
Verden sett fra Stravas synspunkt.

Lysene mot mørket har noe av den samme effekten: se på disse sporene av mennesker mot nattens mørke, mot det ukjente. Vi kjenner igjen dette bildet fra de sammensatte bildene NASA har skapt av jorden sett fra verdensrommet:

«Earth’s City Lights», fra NASAs Visible Earth Catalog. Data fra 1994-1995, visualisering laget i 2000.
«Earth’s City Lights», fra NASAs Visible Earth Catalog. Data fra 1994-1995, visualisering laget i 2000.

Faktisk er selv dette kjente bildet en visualisering av numeriske data. Det er ikke et fotografi, det er ikke engang et kompositt bilde satt sammen av flere fotografier. Det er en kompilasjon av datapunkt som måler lysstyrke fra forskjellige steder på jorden som er målt fra flere forskjellige satelitter over en periode på seks måneder. Dataene er ikke «rå», men «kokt» ved at intensiteten til noen lys er minket for å fremheve byene. 

Både NASAs og Stravas visualiseringer har valgt en representasjon som også spiller på gamle metaforer om sivilisasjonens lys mot mørket. Afrika er nesten helt mørkt, både i NASAs og Stravas visualiseringer, akkurat som den var i gamle kart. I NASA sitt tilfelle speiler bruken av lys og mørke dataen som gjengis: lys i nattens mørke. Strava har derimot tatt et bevisst valg om å bruke lys og mørke for å visualisere sine brukeres aktiviteter.

Datavisualiseringer er ikke bare visuelle og de er ikke bare kvantitative. De er en type kommunikasjon som fremhever data, og videre, en verden som kan forstås som en modell. Noen ganger er det nettopp det at de presenterer virkeligheten som forståelig og forutsigbar gjennom datamodeller som gjør datavisualiseringer så overbevisende. 

Så hvis presentasjon av absolutt store data(«the largest, richest and most beautiful dataset of its kind») kan vekke det sublime i oss, er det i Longinus sin betydning, hvor det sublime overfaller oss og forbigår vår rasjonalitet for å overbevise oss gjennom ren storhet? Eller er det sublime mer som hos Kant, noe som utvider våre sinn gjennom en behagelig spenning mellom vår forestilling om det uendelige og vår evne til å rasjonelt forstå det?

Når vi ser stordata visualisert, som i disse globale kartene, så er det viktig å huske at de ikke egentlig viser uendelige datamengder. Mye er utelatt. Særlig utelates de «vanskelige detaljene» (som Johanna Drucker nevner i Graphesis, s. 92). Ofte er de de vanskelige detaljene, det som ikke passer inn i mønstrene, som forteller de viktigste historiene.