Fra kileskrift til kunstig intelligens
Hvordan blev alting data?
Matthew L. Jones, professor på Princeton University og forfatter til bogen How Data Happened, fortæller historien om data fra oplysningstiden til algoritmernes tidsalder. Den er vigtig, fordi den handler om sandhed og magt.
Månen den 1. august 2023. Borja Suarez/Reuters/Ritzau Scanpix
Historien om data kan begynde mange steder, men det giver mening først at kigge op på nattehimlen. Med det blotte øje – og sidenhen teleskoper – har menneskeheden indsamlet data om himmellegemerne i tusindvis af år.
På et tidspunkt begynder vi at indsamle lignende data om samfundet og befolkningen, og i det attende århundrede bliver Europa ramt af det, der er blevet beskrevet som en “lavine af tal”: Kontinuerlige konflikter og krige krævede penge, som krævede skatter, som krævede voksende bureaukratier, som krævede data.
Matthew L. Jones, der arbejder som professor på Princeton University, samt Chris Wiggins, der arbejder som professor på Columbia University, begynder deres historiefortælling med denne første bølge af ‘big data’. Specifikt med afsæt i den belgiske astronom Adolphe Quetelet, der var med til at grundlægge en videnskabelig tankegang, som stadig spøger i nutidens algoritmiske systemer.
Magtfuld videnskab
I 1830 blev Quetelets karriereplaner afsporet. Han var blevet ansat i det nybyggede astronomiske observatorium i Belgien, men blev pludselig fanget i krydsilden af en revolution.
Muligvis inspireret af de kaotiske politiske omvæltninger i perioden, sætter han sig for at skabe orden – inspireret af astronomien. Ved at bruge de statistiske metoder fra astronomien til at analysere samfundet frem for stjernerne, ville han blive samfundsvidenskabens Isaac Newton.
“Det er svært at udtrykke den enorme succes, som astronomien opnåede i det 18. århundrede. Det var den mest magtfulde, forudsigende form for videnskab, som nogen nogensinde havde frembragt. Og Quetelet ønsker at tage denne type tilgange og anvende dem på menneskets domæne,” siger Jones.
Så hvordan gør man lige det?
Den gennemsnitlige mand
Når astronomer for eksempel skulle måle hastigheden af et himmellegeme, ville de ofte komme frem til forskellige målinger, men et gennemsnit af tiderne ville være tættest på korrekt.
Quetelet trækker dette begreb om gennemsnit ned til jorden, og kommer frem til l’homme moyen, eller den gennemsnitlige mand.
Med de nyligt tilgængelige data udregnede Quetelet gennemsnittet for vægt, højde, hudfarve, dødsalder, men også for årlige fødsler, kriminalitets- og selvmordsrater.
Quetelet var ifølge Ian Hacking “glad for tal” og “glad for at drage forhastede konklusioner.” Der kan være temmelig indlysende problemer ved hans tankegang. Som en anden Ian – matematikeren Ian Stewart – påpeger i Do Dice Play God?, har den gennemsnitlige person ét bryst og én testikel.
Mens vi i dag forstår noget gennemsnitligt som noget midt imellem – omtrent et solidt 4-tal på 12-trins skalaen – så repræsenterede den gennemsnitlige mand for Quetelet “alt, hvad der er stort, godt eller smukt.” Inspireret af astronomien, hvor gennemsnittet repræsenterede den sande værdi, mente Quetelet, at det gennemsnitlige menneske var det sande menneske: “Alt, der afviger fra den gennemsnitlige mands proportioner og tilstand, vil udgøre misdannelse og sygdom.”
Altså går man fra at beskrive, hvordan noget er, til at beskrive, hvordan det bør være, hvilket kan have alvorlige konsekvenser. Mens de astronomiske forudsigende modeller ikke kunne ændre solsystemets funktion, kunne denne videnskabelige, statistiske metode, når den anvendes på samfundet, ikke blot repræsentere verden. Den kunne ændre verden.
“Et af de største slagsider ved dette – og det var tilfældet i slutningen af det 19. århundrede, og det har været tilfældet i de sidste 20 år – er, at hvis man ser på data, der udtrykker forholdene for en befolkning, f.eks. de forskellige niveauer af fattigdom eller uddannelsesniveau i forskellige typer kvarterer, får man et statisk billede af, hvordan folk er i øjeblikket. Man kan vælge at sige, at dette på en eller anden måde er evigt sandt for denne type mennesker. Og på baggrund af det kan man lade være med at forsøge at forbedre deres situation, eller man kan sige, at dette er et produkt af en hel række historiske udviklinger.”
“Det sidste er ret sjældent. Så i mange tilfælde, hvor man indsamler store mængder data om befolkninger og derefter skaber forudsigende algoritmer – også i forhold til at organisere skolegang og andre offentlige goder, der ikke handler om at tjene penge – ender man med at gentage det, der egentlig er et historisk faktum, som om det er evigt sandt,” uddyber Jones.
Alligevel er det en del af næsten ethvert forudsigende algoritmisk system i dag.
Det optimerede samfund – og menneske
Med sin statistiske metode ville Quetelet ændre verden til det bedre.
“Quetelet oplevede den franske revolution, som bredte sig til hele Europa, og for ham og mange af hans kolleger var der en fornemmelse af, at det var den forkerte form for menneskelig forbedring, fordi revolutionen var så ødelæggende. Han havde en anden vision om at skabe gradvis forandring i form af forbedringer af de offentlige goder. Og af det han ville kalde moral, men som vi ville kalde skikke. Det vil sige, at flere mennesker lever længere, at folk ikke bliver skilt, at kriminaliteten falder, og at der er økonomisk velstand,” forklarer Jones.
Adolphe Quetelets metode fik dog også andre utilsigtede konsekvenser: Senere i det nittende århundrede bliver tanken om at forbedre selve mennesket grundlaget for eugenik.
“Det er mærkeligt nok meget udbredt blandt nogle meget teknologiorienterede mennesker i dag, som mener, at teknologien ikke kun skal gøre, at vi får bedre e-mail- og kommunikationsformer, men at der vil blive avlet en slags overlegne mennesker. Det er en gammel idé,” siger Jones.
Ikke en uundgåelig udvikling
Historien om data er ifølge Matthew L. Jones og Chris Wiggins afgørende, fordi det er historien om sandhed og magt. Først bliver data magtfuldt fordi det bruges til at argumentere for, hvad der er sandt, og med datadrevne algoritmiske systemer bliver data magt i sig selv.
“Quetelet bruger en stor del af sit liv på at være fortaler for, at vi ikke kun skal indsamle data – hvilket staterne i stigende grad gjorde – men at vi også skal offentliggøre dem. Den gængse holdning i den periode var, at staterne skulle holde data hemmelige, men han mener, at både den akademiske verden og forskningsverdenen – men også erhvervslivet og frem for alt den offentlige sektor – skal baseres på data,” siger Jones.
Problemerne, der opstår i århundrederne efter Quetelets levetid, er dog ikke iboende i data. “Ofte udvikles værktøjer af personer, der er ret bevidste om deres begrænsninger og erkender, at vi har en ekstremt begrænset mængde data om nogle vigtige emner, og at vi er nødt til at finde ud af, hvordan vi skal håndtere det. Hvis disse værktøjer imidlertid indbygges i systemer eller bruges af mennesker, der ikke tænker over det, opstår problemerne. Det gør de nu med virkelig høj hastighed og meget lidt menneskelig indgriben, når de først er i gang. Så det er ikke iboende, men meget almindeligt,” siger Jones.
Så almindeligt, at det er svært at forestille sig, hvordan det kunne være anderledes. Men det kan det, insisterer Jones. Det kræver “blot” at finde en ligevægt mellem staters, virksomheders og individers magt, så data kan være i overenstemmelse med demokrati. Og selvom det lige nu lader til, at en række få virksomheder sidder tungt på magten, så er dette magtspil stadig i gang.
Som Jones siger: “Når vi lever med en given teknologi, kan det virke, som om det er uundgåeligt. Som om det er den eneste måde at organisere tingene på. Men det er bare ikke tilfældet. Det er nyttigt at forestille sig det øjeblik, hvor man var nødt til at argumentere for det og sige, at der er fordele og ulemper ved det. I fortiden blev der truffet valg, som slet ikke var indlysende. Statistiske metoders magt er så fast forankret i de fleste af vores bureaukratier, vores skoler, og så videre, at den på en måde er vævet ind i hele vores liv.”
/Emilie Ewald
Mens der håndteres stigende mængder af data inden for videnskab, handel og bureaukrati, bliver der konstrueret mindre og mere funktionelle regnemaskiner til at behandle data. I morgen taler vi med videnskabshistoriker Lorraine Daston om disse maskiner og menneskerne i dem.