Nyhedsanalysen
Den store datahøst
Træningen af AI-modeller kræver data, og rigtig meget af den. En af de løbende diskussioner omkring tjenester som Chat-GPT og DALL-E er derfor også, hvor alt det tekst- og billedmateriale, som AI’en trækker på, egentlig kommer fra – og hvem der givet techvirksomhederne lov til at bruge det. Som The New York Times beskriver, har bl.a. OpenAI, Google og Meta allerede bøjet en hel del regler. Og situationen bliver næppe bedre, når mængden af tilgængelig kvalitetsdata begynder at tynde ud.