7 min read

Hoe AI Wikipedia op kosten jaagt, desinformatie, link rot en natuurlijk... vibe coding! - week 15

Gelukkig ben ik niet de enige die geen AI in het onderwijs wil! We horen veel over de verborgen kosten van AI; klimaat, uitbuiting, maar bots jagen ook traditionele kennisproviders zoals Wikipedia op kosten. Welke groep mensen is het meest vatbaar voor desinformatie? En weten ze dat zelf?
Hoe AI Wikipedia op kosten jaagt, desinformatie, link rot en natuurlijk... vibe coding! - week 15
Bart Smit boekje uit 1990, bron: https://nl.pinterest.com/pin/127719339403772133/

Daar ben ik weer met een verse nieuwsbrief, deze week op zaterdag in plaats van zondag, want morgen hol ik over de Coolsingel!

Het is leuk om in het 'echte leven' te horen dat mensen mijn stukken lezen, dat geeft energie! Maar ik hoorde ook een klacht deze week, een collega zei: "Ja Felienne ik loop al twee weken achter met je nieuwsbrief, want ik moet al die linkjes nog lezen". Nu hoef je natuurlijk niet alles te lezen; mijn zegen heb je om gewoon even in de stream te dippen en te kijken wat je wel en niet meeneemt.

Maar het gaf me ook een zinnig inzicht, want ik denk dat ik inderdaad wel een beetje schrijf als zo'n boekje van Bart Smit dat je als kind in de bus kreeg in december, vol met dingen die je ook allemaal wel zou willen en dat geeft ook keuzestress voor je 5 gulden zakgeld/je ene uurtje leestijd.

Dus ik ga proberen vanaf nu sommige stukken wat meer samen te vatten zodat je ze niet hoeft te lezen—het is nu eenmaal niet iedereens werk om het AI nieuws bij te houden—maar kan lezen als je echt meer verdieping wilt.

Veel lees- alsook oversla-plezier dus deze week!

Realisten in het onderwijs houden chat op afstand

Ik kreeg van meerdere mensen het verhaal van geschiedenisdocent Eric Ex in Trouw doorgestuurd, waarin hij beargumenteert dat

tech-optimisten (dikwijls ook van buiten het onderwijs) snappen niet waar onderwijs over gaat: het werkstuk is niet het doel!

Zoals ik zelf ook al in NRC schreef, onderwijs gaat over worstelen en zoeken, en niet over snel wat afkrijgen. Voor wie mijn stukken vaker leest zijn deze argumenten niet nieuw, maar Ex haalt ook nog deze heerlijke quote aan van psycholoog Daniel Willingham, auteur van het boek Why don't students like school:

Memory is the residue of thought

Dat deed me weer denken aan het heerlijke boek How I wish I had taught maths waarin wiskundedocent Craig Barton reflecteert op een aantal jaren falen voor de klas. Hij verzon de leukste lessen, zoals pizza's en boterhammen snijden om breuken uit te leggen; leerlingen waren lekker bezig en het was gezellig. Top! Dan moet er toch wel geleerd worden met zoveel enthousiasme.

En dan komt hij komt een paar jaar later een leerling tegen die zegt dat hij het zo jammer vindt geen les meer van Barton te hebben. Waarom dan? vraagt Barton nieuwsgierig. Nou, zegt de leerling, we mochten altijd lekkere broodjes eten, en dat was super! Niks over breuken was blijven plakken, want de leerling was vooral bezig geweest met gedachten over lekkers: "Memory is the residue of thought", waar je de aandacht van de leerling op vestigt, dat gaat erin. Deze interactie was voor Barton de aanleiding om zijn lesgeefpraktijk om te gooien met veel minder toeters en bellen.

Het mooiste aan dit boek (oops nu ben ik geloof ik toch weer aan het Bart Smitten) is dat het zo oprecht is, zowel in zijn eerste intenties om leuk les te geven, als in de reflectie dat het niet zo goed werkt.

Als we leerlingen zouden leren 'prompten', wat onthouden ze dan? Welk denkproces zijn ze dan aan het uitvoeren en wat leren ze daarvan?

De impact van AI op Wikipedia's traffic

In een korte blog leggen een aantal mensen van de Wikimedia foundation (de NGO achter Wikipedia) uit hoezeer zij de impact van AI terugzien in server- en bandbreedtecapaciteit: 65% van hun dure internetverkeer komt van bots die data scrapen om algoritmes mee te trainen.

Waarom is juist dat verkeer duur? Daarvoor moet je een beetje snappen hoe servers werken. Mensen lezen meestal dezelfde pagina's, van celebs, of van dingen die net in het nieuws zijn geweest; obscure pagina's krijgen nauwelijks traffic (de bekende long tail). Als een Wikipedia-server ziet dat een pagina's veel opgevraagd wordt, wordt die opgeslagen in een cache, een lokale server dichtbij de lezers. Een beetje zoals je drie boeken op je bijzettafel legt omdat je ze aan het lezen bent (of dat toch aanstonds van plan bent, heus!). Steeds naar de boekenkast boven lopen voor drie bladzijdes, is te veel gedoe.

Maar een bot beperkt zich niet tot een paar artikelen, die is geprogrammeerd om alle data inlezen, ook de pagina's die niet vaak worden opgevraagd. Dus moet de Wikipedia-server als het ware voor ieder boek naar de boekenkast boven lopen, met grote kosten tot gevolg, die Wikipedia zelf moet dragen.

In een eerlijkere wereld zouden de AI bedrijven vrijwillig geld afdragen aan Wikipedia om die kosten te delen, en als bedankje voor de gratis data. In een betere wereld—eentje waarin beleidsmakers snappen hoe algoritmes en webservers werken en hoe belangrijk goede en gratis informatie is—hadden landen misschien al jaren zelf geld afgedragen aan Wikipedia. Maarja, we leven in deze wereld waarin data gewoon gestolen mag worden en de bestolene ook nog moet bijdokken.

AI en leren


Als je 10 minuutjes hebt, is dit korte interview met een van mijn programmeerhelden Scott Hanselman. Ik vind het echt knap hoe hij hier geïnterviewd wordt over AI, maar zelf het narratief schuift naar shareholder-kapitalisme en het dogma van meten is weten, en wat dat doen voor ons denken.

Hij tipt in de video ook nog dit boek (dat ik nog niet gelezen heb, maar dat wel geweldig klinkt) over hoe werk steeds meer gekwantificeerd is geraakt en verder van de menselijkheid af.


Heel tastbaar artefact van link rot (het idee dat links na verloop van tijd niet meer werken). Programmeur en handwerkster Kris Howard maakte een paar jaar geleden deze self-replicating wanten: als je de QR code scant, kom je op het patroon van de wanten zelf. Creatief en grappig!

Een want met een QR code erop, waar nu groot 404 overheen gezet is. Bron: https://mastodon.social/@web_goddess@aus.social/114169036885979068

Maar, links zijn lang (als je goed kijkt zie je dat de inzet met dunner garen gemaakt is omdat je anders de pixels niet kwijt kan) dus ze gebruikte een link shortener van Google. En het vervolg laat zich raden: Google stopt met de shortener en nu doet de want het niet meer... Het is een leuke anekdote, maar ook weer een teken dat we niet op big tech moeten vertrouwen (dat schrijft Kris zelf ook) want Google ziet zichzelf blijkbaar niet als iemand die verantwoordelijk is voor een stevig en goed bewaard internet (zie ook de dood van Google Reader).

Desinformatie

Ik ben blij dat er mensen zijn die goed en gedetailleerd onderzoek doen naar misinformatie, wat mij betreft één van de grote gevaren van onze tijd. Bijvoorbeeld dit recente paper, dat onderzoek deed naar maar liefst 65.000 mensen uit 24 landen om te kijken wie er het meest vatbaar is voor desinformatie, én wie dat zelf het beste weet. De resultaten zijn opvallend!

Meest vatbaar voor nepnieuws zijn Zoomers, vrouwen, lager opgeleiden en conservatieven, maar vrouwen en Zoomers weten dan weer goed van zichzelf dat er er snel intrappen, terwijl conservatieven wat betreft nepnieuws het meest 'Donning Kruger' zijn, en dus denken dat ze er niet vatbaar voor zijn terwijl ze dat juist wel zijn. Zoals de auteur zelf schreef op Linkedin:

Gen Z are more susceptible (and they know it) & those on the extreme right are more susceptible (but they don't know it).

Doet een AI wat hij moet doen?

Ook in Trouw deze week filosoof Marijn Sax die Alexander Klopping's onzin over een gpt-therapeut van tafel veegt met de heldere uitleg dat een psycholoog veel meer doet dan alleen maar waarheden voor je unpacken (Freud, anyone?). Wil je echt in AI en therapie duiken, dan is dit achtergrondstuk uit NY Times ook de moeite waard.

Wat Sax zegt is vergelijkbaar met wat Hanselman zegt over werken en leren, wat zijn we eigenlijk aan het doen, wat is het doel?

Daar kun je heel lang over debatteren, maar je kan er ook scherp over denken vanuit historisch en filosofisch perspectief en dat doen mensen gelukkig ook nog. Bijv Nederlandse wetenschappers Buijsman en Veluwenkamp (TU Delft en Groningen), die in hun recente werk uitleggen dat het kiezen van een metriek niet zomaar wat is. Veluwenkamp schrijft op Linkedin dat AI werk vaak gaan van

een abstracte morele waarde (zoals "eerlijkheid" of "welzijn") naar een specifieke metric, zonder expliciet te maken wat precies wordt gemeten, en waarom dat gerechtvaardigd is.

Je moet dus, expliciet zijn in welke metriek je kiest en waarom. Hebben we meer efficientie nodig in het onderwijs? Wil je 'sneller' powerpointjes voor je colleges kunnen maken? Waarom? En voor wie is dat goed en voor wie misschien niet?

Meer detail in de voorpublicatie van het paper.

Vibe Coding

Programmeren met chatGPT heeft een nieuwe buzzwoordnaam: vibe coding. Gewoon lekker een beetje codes oproepen, runnen, kijken wat werkt en hoppa je hebt een app. Iedereen heeft het erover, zo ook de NRC techredactie en Laurens Vreekamp (met een fijne shoutout naar mij, zelfs)

Maar als je IT-er bent, of echt veel van programmeren weet, lees dan geen stukken over vibe coden (zelfs niet uit NRC) maar lees dit heerlijke, hoopvolle, en genuanceerde stuk van Ian Cooper. Hij legt in in een uitgebreide historische context uit hoe de echte kosten van software niet zitten in het schrijven van code, maar in het begrijpen van hoe de wereld is, en in snappen wat al die maffe programmeurs voor jou (soms ben je dat zelf, een paar maanden terug) hebben gedacht. Zo schrijft hij (emphasis mine):

The dream of domain experts writing code over software engineers interpreting the requirement often fails because it tends to create write only software, even assuming domain experts are willing to become DSL programmers in the first place.

Een grappig appje dat je niet echt wilt gebruiken is 'write only' software, je schrijft het een keer en daarna gebruik je het alleen. Maar zodra je code gaat aanpassen (en dat is in de praktijk echt heel vaak, veel vaker dan je zou denken als je geen programmeur bent) dan moet je echt snappen hoe het werkt, en wat je precies wilt. En juist daar helpt GPT niet, omdat het vaak hele onhandige en onnodig complex code uitspugt.

Goed nieuws...?

Pfff, het was een beetje zoeken deze week, want het was natuurlijk importheffingen galore de hele week. Zoals ik al eerder schreef stap ik binnenkort over op een dumb phone, en ik kreeg al een mail van de makers dat ze echt geleverd gaan worden, geen zorgen over de tariffs! Dat was voor mij het beste nieuws van de week, want ik kijk er echt naar uit om mijn iPhone weg te doen. Verder niks in de happy department, sorry. Zoals ik wel eens zeg in lezingen: "Ik heb geen goed nieuws; ik ben niet leuk op feestjes".