Nyhedsanalysen
Information er blevet digital, men ikke nødvendigvis mindre skrøbelig
Algoritmer og kunstig intelligens truer adgangen til information. Brewster Kahle, der har været internettets selvudnævnte bibliotekar i 30 år, er klar til kamp for fremtidens biblioteker.
Illustration: Klara Graah
Biblioteket i Alexandria blev ikke ødelagt på én dag.
Det er oftest den romerske diktator Julius Cæsar, som får skylden for at have antændt den destruktive brand i det, der på daværende tidspunkt var verdens største arkiv for menneskelig viden – biblioteket, som formentlig var blevet grundlagt af Ptolemaios 1. eller på initiativ af hans rådgiver Demetrios fra Faleron.
Under en borgerkrig i Egypten omkring 48 år før vores tid rejste Cæsar med sin flåde til Alexandria for at forsvare sin allierede Kleopatra i krigen mod sin bror Ptolemaios 14. Flammer, der skulle forhindre Ptolemaios’ flåde fra at forlade havnen i Alexandria, spredte sig til bibliotekets bygninger.
Ifølge historikeren Plutarch gik hele biblioteket op i røg, mens filosoffen Seneca har skrevet, at 40.000 papyrusruller gik tabt.
Senere kilder antyder, at der var mere end aske tilbage, og at biblioteket – eller dele af det – blev stående i hundredvis af år derefter. Nogle peger på politiske og religiøse årsager til, at biblioteket ikke findes den dag i dag. Andre, herunder bibliotekar Sebastian Modrow, hævder, at det “gik langsomt til grunde på grund af forsømmelse.”
Ifølge den britiske historiker Guy de la Bèdoyére ved man “frustrerende lidt” om biblioteket. “Måske er dets største bidrag til videnskabens historie, at det overhovedet eksisterede,” skriver han i bogen The Fall of Egypt and the Rise of Rome: A History of the Ptolemies, hvor han ligeledes kalder biblioteket for “ptolemæernes største gave til den antikke verden”.
Internettets bibliotekar
Det var det gamle bibliotek i Alexandria, der for tredive år siden inspirerede den amerikanske ingeniør og entreprenør Brewster Kahle til at oprette Internet Archive, som i dag opererer fra en nedlagt kirke i San Francisco. Da kirken, en hvid storslået bygning med hellenistiske søjler, blev sat til salg i 2009, købte Kahle den, fordi den lignede nonprofitorganisationens logo.
“[Biblioteket i Alexandria] var første gang, menneskeheden forsøgte at arkivere og gøre alle værker tilgængelige. Det var en stor vision, og på mange måder var det muligt takket være en ny teknologi: papyrus,” fortæller Kahle. Papyrus var let og fyldte meget mindre end de mesopotamiske lerplader med kileskrift, hvilket gjorde det muligt at skalere og samle et bibliotek større end nogensinde før.
På samme måde blev internetarkivet ifølge Kahle muligt – og nødvendigt – på grund af ny digital teknologi: World wide web, der ofte forveksles med selve internettet, men i virkeligheden er en tjeneste på internettet, der gør det muligt at samle, udveksle og tilgå digital information.
“World wide web er et meget simpelt system, men det har en virkelig grundlæggende fejl. I modsætning til et forlag, hvor man laver kopier, som ender i biblioteker eller folks bogreoler, er der kun ét sted, hvor tingene findes: På webadressen (også kendt som URL red.). Det kan derfor ændres eller slettes når som helst, og den gennemsnitlige levetid for en hjemmeside er kun 100 dage,” fortæller Kahle. Internettet er dermed på mange måder en kirkegård for links, og de døde links fører til hjemmesider eller servere, som er permanent utilgængelige.
Da de gik i gang med at bygge Internet Archive for tredive år siden, var det derfor lidt som at bygge et bibliotek ovenpå kviksand. “Vores idé var at internettet ikke kun skulle have en nutid, men en fortid, og vi har arkiveret world wide web siden da,” siger Kahle.
Med organisationens Wayback Machine, som er offentlig tilgængelig, kan man altså finde frem til sin gamle blog, de tusindvis af hjemmesider, som den nuværende amerikanske regering ændrede eller slettede for at fjerne information om vacciner, hadforbrydelser og videnskabelig forskning, eller Føljetons mission om at skrive “om flygtningekrisen, om batterier, om Taylor Swift og om COP21. Om EU-afstemningen, om Hjørring, om robotter og Nicki Minaj,” som der stod på vores hjemmeside den 20. februar 2016.
Det kan vise sig at være afgørende at have adgang til fortiden. Som den 17. juli 2014, hvor Malaysia Airlines’ passagerfly MH17, der var lettet fra Amsterdam, styrtede ned i Ukraine. “Vi har lige skudt et fly ned,” skrev Igor Girkin, den selverklærede russiske nationalist, der dengang var separatistleder, på det russiske sociale medie VKontakte. Han inkluderede et link til en video af flyvraget. Han slettede sidenhen sit opslag, så det eneste bevis for hans egen indrømmelse af forbrydelsen, som Den Internationale Domstol i Haag desuden dømte ham skyldig for i 2022, findes i Internet Archives Wayback Machine.
Sidste år fejrede organisationen, at de havde arkiveret mere end en trillion, altså en milliard milliarder, hjemmesider. Det er både robotter og mennesker, der har medvirket til at krydse denne målstreg, som selvfølgelig flytter sig hver eneste dag. For der oprettes 252.000 nye URL’er i døgnet, cirka tre hvert sekund.
Målet med arkivet over internettet er at give universel adgang til information. En mission, som mange er villige til at støtte økonomisk – i hvert fald indtil videre. Internet Archives primære modstand har derfor været “forretningsinteresser”, siger Kahle. Udfordringer inkluderer ophavsret og en stigende tendens til at bygge betalingsmure.
Arkivets opgave er kun blevet sværere med årene, for der kommer også nye udfordringer til: “Algoritmer gør, at alle ser et forskelligt web. De ser et forskelligt feed. Det er målrettet og profileret, og det gør arkivering meget udfordrende. Nu hvor vi også har KI, hvor hvert svar er forskelligt, hver gang – selvom man stiller det samme spørgsmål, får du forskellige svar – så bliver det endnu mere udfordrende for arkiver og biblioteker i fremtiden. Men vi er klar til at tage udfordringen op.”
Det gør de blandt andet med nye projekter, hvor de spørger chatbots og store sprogmodeller om aktuelle emner for at arkivere det, som de svarer på det gældende tidspunkt. “Vi arkiverer det, så folk kan kritisere det og forstå det,” forklarer Kahle.
Informationsalderen
Claude Shannon skrev mange af sine forskningsartikler – herunder “A Mathematical Theory of Communication”, som blev udgivet i 1948, hvor han præsenterede sin såkaldte informationsteori – da der var færre end 10 computere i hele verden.
Alligevel er Shannons teoretiske fundament afgørende for, at computere fungerer, som de gør i dag, altså kan udføre algoritmer.
Med sin informationsteori introducerede han bits som den grundlæggende enhed for information. En bit er den mindst mulige mængde information og kan enten repræsentere 0 eller 1.
“Shannons generelle kommunikationsteori er så naturlig, at det er, som om han opdagede universets kommunikationslove snarere end opfandt dem. Hans teori er lige så grundlæggende som naturens fysiske love,” skriver David Tse, som er professor på Stanford, i Quanta Magazine.
Sidenhen er bits blevet en universel valuta, fordi man med dem kan repræsentere al slags information, herunder musik, billeder og videoer. Hvis du ikke kender ordet bit, så kender du formentlig ordet byte, hvilket svarer til otte bits. 1.000 bytes er en kilobyte, 1.000 kilobytes er en megabyte, 1.000 megabytes er en gigabyte, 1.000 gigabytes er en terabyte og 1.000 terabytes er en petabyte.
Det er også Shannons informationsteori, der er fundamentet for Internet Archives projekt, der baserer sig på at kunne digitalisere, komprimere og opbevare enorme mængder af information. En kopi af hele Internet Archives arkiver fylder 175 petabytes.
Evig information?
I modsætning til lerpladerne med kileskrift, der udsat for ild blot ville bage og blive forvandlet til endnu mere holdbare og næsten uforgængelige artefakter, var papyrus, som biblioteket i Alexandria viste, yderst skrøbelig over for brand. Men digitale data er skrøbelige på deres egen måde.
“Biblioteket i Alexandria brændte ikke på én gang. Det blev også bare langsomt gjort irrelevant af tidens forandringer. Det nye bibliotek, Internet Archive, har ligeledes sine udfordringer med at forsøge at overleve og forblive eksisterende,” siger Kahle.
Ligesom papyrusrullerne i biblioteket i Alexandria angiveligt gjorde, kan digitale data gå til grunde, hvis de forsømmes. “Hvis man ikke aktivt arbejder for at bevare materialerne, så vil de forsvinde; bits vil blive ulæselige, harddiske vil gå tabt og i stykker, og bånd holder ikke engang så længe,” siger Kahle.
Udover at arkivere world wide web, har Internet Archive også samarbejdet med østaten Aruba for at digitalisere deres nationalhistorie, som var udsat på grund af ekstreme vejrbegivenheder. “De var stort set én katastrofe fra at miste alt,” har Stacy Argondizzo, der arbejdede på projektet, sagt til Wired. Østaten Tuvalu, der står til at blive det første land, der forsvinder på grund af havniveaustigninger forårsaget af menneskeskabte klimaforandringer, har ligeledes lavet en digital kopi af alt fra sine træer til strande.
Selvom servere virker mindre antændelige end papyrusruller, findes der derfor delvise kopier af Internet Archive i Canada, rundt omkring i Europa og i et nyt bibliotek i Alexandria.
Bibliotheca Alexandrina
Om vinteren er det stadig varmt i Alexandria. Bådene vugger i Middelhavet, og palmetræerne er vindblæste. I havet ligger ruiner af det fyrtårn, der i antikken var et af verdens syv vidundere. Ovenpå ruinerne er der blevet bygget et citadel, hvorfra jeg kan se byens bibliotek. Ikke det berømte bibliotek, der brændte, men det nye bibliotek, som åbnede i 2003.
Den italienske forfatter Umberto Eco, der sad i bestyrelsen for Bibliotheca Alexandrina frem til sin død, skriver i Rosens navn om et klosterbibliotek, der går op i flammer. Da fortælleren vender tilbage til resterne, bygger han et nyt, mindre bibliotek med de fragmenter af bøger, som han finder blandt asken.
På den åbne plads udenfor er der en statue af titanen Prometheus, der tildelte mennesket ild, viden og teknologi. Den cirkulære bygning ligner et gigantisk solur, bygget af sten og indgraveret med bogstaver på forskellige sprog.
Lige inden for er der en statue af Demetrios fra Faleron, og der er plads til mere end fire millioner bøger fordelt på de elleve etager, hvoraf fire befinder sig under jorden. Her er delvist oplyst af naturligt lys, men hældningen på den skrånende bygning sikrer bøgerne fra skadeligt, direkte sollys og gør at bibliotekets studerende og forskere – der er 2.000 siddepladser – kan læse uden at få solen i øjnene.
“Jeg tror virkelig, at det er vigtigt at forstå og lære af det, der er sket før, og opbygge mere modstandsdygtige strukturer,” siger Kahle om den kopi af Internet Archive, der findes her i Alexandria. “Bibliotekernes historie er en historie om ødelæggelse, og det er som regel bevidst ødelæggelse. Der kan være et jordskælv, men det er som regel de magtfulde, der ødelægger dem. Før var det kirken og regeringen, og nu er det virksomhederne og de regeringer, der tjener virksomhederne. Det er sådan, Internet Archive bliver angrebet,” siger Kahle.
Den amerikanske forfatter James Gleick er mindre bekymret omkring, hvorvidt information er skrøbeligt. “Biblioteket vil bestå,” skriver han i bogen The Information: A History, a Theory, a Flood. “Vi går gennem gangene, gennemsøger hylderne og omarrangerer dem, på jagt efter meningsfulde linjer midt i en kakofoni af usammenhængende ord.”
Og hvorfor er det vigtigt med biblioteket? Med al den information, som Internet Archives ansatte og robotter hver evig eneste dag indsamler og arkiverer? “Idéen med et bibliotek er at gøre folk klogere og føre til nye idéer, der er værdige til at være i biblioteket,” svarer Kahle.
Succeskriteriet er altså, at biblioteket vokser sig større og større, at der bliver ved med at blive skabt nye værker, der skal have plads på hylderne – eller serverne. /Emilie Ewald
I næste afsnit tager vi forbi endnu et bibliotek – Visdommens hus i Bagdad – hvor den persiske matematiker, astronom og astrolog Muhammad ibn Mūsā al-Khwārizmī, som sidenhen lagde navn til algoritmen, grundlagde algebra.