Het klimaat, chatGPT in/uit de klas, Delpher en Arabische letters - week 17

Hoe redden we klimaatdata?
Afgelopen week sprak ik over klimaatverandering op een avond van New Scientist in het Discovery Museum in Kerkrade, dus nieuws over het klimaat viel me dus extra op. Zo zag ik een stuk in the Guardian over alle klimaatdata die door de regering Trump 2 verwijderd en in sommige gevallen vernietigd wordt. Het is een stukje kiekeboe van de hoogste plank, als we onze ogen sluiten, dan is het er gewoon niet meer. Het is natuurlijk fantastisch hoe mensen nu vrijwilligen om de data op te slaan en te behouden, zoals de Public Environmental Data Partners doen die genoemd worden in het stuk.
Maar vergeet niet dat data vaak ook in een sociale context leeft, dat om data te snappen en te verwerken je vaak goed moet ingevoerd in hoe het werkt. Niet voor niets liet onderzoek van Wageningen zien dat welke softwaremodel je gebruikt voor je data het beste wordt voorspeld door uit welke onderzoeksgroep je komt, en niet door welk model het beste is. De datasets die hier verwijderd worden zijn misschien nog te redden, de informele netwerken veel moeilijker. Geen toeval ook natuurlijk dat Trump en Musk de aanval op Wikipedia steeds weer voeren, deze week met de dreiging dat ze geen belastingkorting meer krijgen als NGO (tax exempt status), omdat ze niet voldoende positief over de Amerikaanse overheid schrijven en dus niet neutraal zijn maar een gevaar voor de staatsveiligheid.
Technologische foplossingen
In mijn lezing in Kerkrade sprak ik over technologische 'foplossingen'; techniek die nog helemaal niet werkt, maar wel meteen afleidt van de echte problemen omdat mensen denken dat het wel gaat helpen. Dat zien we nu met het klimaat, mensen nemen het minder serieus omdat "AI het probleem binnenkort wel verhelpt" zelfs het World Economic Forum zegt het, nou dan moet het wel zo zijn, kunnen wij weer rustig barbecuen en naar Thailand vliegen.
Hetzelfde zien we in Nederland in de landbouw, al weetikniet hoe lang roepen boeren dat technologie uitstoot gaat verlagen en dierenwelzijn gaat verhogen (to be fair we worden daarbij natuurlijk door de overheid ondersteund dmv subsidies to that end). Follow the Money schreef een schrijnend stuk over megastallen en het idee 'Nieuw Gemengd Bedrijf ' dat er kwam, niet werkte en weer afgebroken gaat worden. Zo wordt, zo schrijft FtM gevat, een gram stikstof die keer zo duur als een gram goud. En natuurlijk waarschuwden onderzoekers en activisten er vanaf het begin voor dat het niet zou helpen, en zo zie je precies wat een foplossing doet, niet alleen niet werken, maar afleiden en uitstellen en het probleem zo nog erger maken.
Iets vergelijkbaars zien we in the UK, in een geweldig stuk in the Guardian met daarin een quote for the ages:
Nature is ever the afterthought. And afterthoughts are expensive.
Later handelen is altijd duurder. Wat speelt er daar? Nou, een nieuwe wet gaat het voor bedrijven die willen bouwen mogelijk gaat maken alle natuurschade af te betalen met offsetting. Ook dat is technologisch zand in de ogen, want wat gaat die offsetting precies doen? Ergens een boom planten? Investeren in een zonne-paneel? Die toekomstfantasie beschermt geen natuur van vandaag en kwam de overheid dan ook op fikse kritiek te staan, de wet werd "introduced without an evidence base, truncating its own consultations and expert assessments" zo schreef de Chartered Institute of Ecology and Environmental Management. Wie vond dit dan wel een goed idee? CEOs, aldus Keir Starmer. Zoals het stuk zegt:
All this is supposed to promote economic growth, which appears to be Labour’s sole remaining principle.
Met zo'n linkse partijen hebben we geen VVD\Conservatives meer nodig. Maar ja als je ziet hoe Blair tegenwoordig big tech verdedigt, dan mag dit op zich ook geen verrassing meer heten.
Ik ❤️ Delpher
Over databronnen gesproken... Delpher is wat mij betreft een van de best bewaarde geheimen van het Nederlandse internet, het is een collectie van digitaliseerde bronnen vanaf de 17e eeuw! Er zit nu 1 miljoen boeken in, ruim 1.7 miljoen kranten, 12 miljoen tijdschriftpagina’s en 1.5 miljoen radiobulletins, en dat kunt u allemaal gratis en voor niets doorzoeken!
Ik gebruik graag bronnen van Delpher, bijvoorbeeld dit schitterende stuk uit het Rotterdams Nieuwsblad uit 1899 (!) waarin een lesgeefmachine beschreven wordt die mensen moet leren fietsen.

Maar, als ik bij lezingen dan wel eens vraag of het publiek Delpher kennen, dan is het antwoord heel vaak nee. Dat is jammer! Dus bij deze mensen, zoek eens wat op in Delpher als je iets wilt weten. Reden om het deze week op te nemen in de nieuwsbrief is dat ik een geweldig stuk las over Wikipedia pagina's die Delpher gebruiken als bron (spoiler alert: dat zijn er een hele hoop!). Zo zie je ook het tweede-orde-effect van goede databronnen, het maakt ook andere informatie sterker.
Wiens wetenschap, wiens technologie?
Ik zag geweldig mooi onderzoek van Microsoft langskomen deze week, een nieuw soort lettertype waarin je tempo en nadruk kan aangeven, zodat kinderen beter weten hoe ze iets moeten lezen.
Maar ik was natuurlijk benieuwd of ik het voor mijn lessen Arabisch kan gebruiken, dat zou daadwerkelijk handig zijn! Maar je raadt het al, zelf een simpele weergave (dwv zonder klinkertekens) van hallo ("مرحبا") doet het niet. Bekijk hieronder een filmpje.
Simplified Chinese gaf dezelfde error messages; Cyrillisch geeft geen verkeerd gerenderde letter, maar voor zover ik het kan lezen klopt dit ook niet; het dwingt het de letters in iets dat lijkt op het Latijnse alfabet.
Nu kun je me een zeurpiet noemen, dat mag, maar het geeft weer eens aan hoezeer het zelfs maar even proberen van Arabisch buiten scope valt van zo goed als al het onderzoek naar technologie.

Nog een stukje Vibe Coding
Bovenstaand stuk over de ondersteuning van Arabisch is ook nog een goed voorbeeld van waarom we vibe coding niet moeten willen (aanvullend op wat ik twee weten terug al schreef), de code die er nu is, is niet op allerhande zaken berekend, en als we daarmee meer code maken, dan komt de inclusiviteit er nooit in. Een ander goed argument zag ik via Mastodon deze week. Als we leren vibe coden, blijf je voor altijd afhankelijk van tools waar je een abonnement op moet nemen, en dat is superduur, en niet nodig als je wat basiskennis hebt.
Waar ik vroeger fan was van browser-based tooling om te programmeren zoals repl.it (omdat het door het gebrek aan gedoe met installeren ee drempel verlaagt) ben ik daar goed van teruggekomen nu ze steeds minder mogelijkheden gratis aanbieden en je overspoelen met AI suggesties, ook als je dat niet wilt.
De seculiere dominee
Als je net als ik, nu Rutger Bregman de hele week in het nieuws is met de Engelse versie van zijn nieuwe boek, hartstochtelijk probeerde er niks over te lezen, pik dan wel even dit vlijmscherpe stuk mee van Dieuwertje Kuijpers van Follow the money mee. Ze weet mijn irritatie voor mensen als Bregman, alsook Schimmelpenninck en Luytendijk goed te duiden, door de observatie dat ze geen identiteit aannemen (zijn ze nu journalist, columnist, schrijver of activist) en dat het daarom zo lastig is met ze in discussie te gaan. Blijkt iets dat ze schrijven niet te kloppen (en dat is regelmatig, zie Kuijpers voor een paar voorbeelden) dan zijn ze opeens geen journalist, in de betekenis dat ze hierop aangesproken mogen worden) maar proberen ze gewoon een discussie op gang te brengen.
Wat Kuijpers ook kraakhelder maakt is dat deze heren het altijd over hun eigen gevoelens en problemen spreken, dat zie je voor mij het beste aan Luytendijk en de zeven vinkjes. Nu is er natuurlijk niks mis met iets ervaren en dat als de vonk zien van een verhaal, ik grap weleens dat mijn laatste paper mijn poging was mijn gevoel van niet thuis te zijn in de informatica een poging was om therapie te vermijden. Maar de vraag is wat je daarna doet.
Luytendijk ontdekt door dingen die hij meemaakt dat de meritocratie er helemaal niet is, nou dat is even slikken. Maar dan kan je twee kanten op denk ik: je eigen emoties verwerken en je daarbij laten informeren door andere mensen die dat altijd al gezegd hebben, in Luytendijks geval had hij zich denk ik opeens in zogoed als alle feministische of anti-racisistische literatuur kunnen herkennen. Zoals James Baldwin zegt:
You think your pain is unique, and then you read.
En hoe mooi had dat kunnen zijn (voor mijn part als theatertour, ik heb niks tegen narcisten althans niet uit principe) Luytendijk leest Baldwin. Luytendijk leest Wajcman. Luytendijk confronts meritocratie. Dat nu meer mensen in Nederland het begrip intersectionaliteit of intergenerationele rijkdom zouden bezigen in plaats van "ik heb zeven vinkjes".
Maar wat we krijgen is iets anders; het product van het helemaal zelf doorstaan, dan doen of jij de gelijkheidsstrijd hebt bedacht, en die gospel dan gaan verkondigen.
ChatGPT in de klas
Ok, dus je snapt dat ik dacht: "Ow een stuk van de Correspondent over chatGPT, dat wordt tech halleluja" (alhoewel Johannes Visser meestal best goed is, en zelf ook ervaring heeft als docent!), maar vriend en scherpe denker Hans de Zwart werd geïnterviewd, en dan moet het wel goed zijn!
Hans beschrijft uitgebreid hoe studenten in zijn vakken zo gefocust zijn op het inleveren van een verslag, dat ze helemaal niet meer bezig zijn met werken en nadenken. Een schrijnend voorbeeld dat hij geeft is dat studenten voor een vak naar een debatavond mochten (dat lijkt mij nu een leuke en ook nuttige activiteit!) maar dat een student ervoor koos om een video automatisch te transcriben en de tekst aan chatGPT te voeren om de (simpele) vragen te beantwoorden.
En dan is je eerste gevoel misschien: tsjonge wat een luiaard! Maar is het ergens ook niet te begrijpen? Misschien niet voor deze debatopdracht, maar voor heel veel andere dingen wel. We laten studenten vaak in hun eentje moeilijke dingen doen (boeken of papers lezen, een scriptie schrijven) en er is geen goede begeleiding, behalve misschien een uurtje per week contact met je begeleider als je geluk hebt[[1]]. En als studenten dan worstelen (en, vind ik, begrijpelijkerwijs valsspelen overwegen) gaan we hen er de schuld van geven te lui te zijn.
Ik zeg vaak dat de enige reden dat ik blij ben met chatGPT is dat het de problemen van een slecht systeem eens goed blootlegt. Want een ander model is goed denkbaar, en dat heeft niks met chatGPT te maken. Want anders dan Hans geloof ik wel in laptops dicht en met de hand aan het werk. Zo doe ik dat ook in mijn vakken. Maar ik vind dat niet schoolser, ik vind dat de kans op leerrendement verhogen.
Misschien waren er tijden dat een fiks gedeelte van de studenten zelfstandig een stuk konden lezen, maar toen waren er wel heel veel minder studenten, en hadden docenten heel veel minder andere taken uit te voeren, en dus veel meer informele leertijd (gewoon eens bij een docent binnenlopen, na college blijven plakken, kom daar nu maar eens om!). Bovendien hadden studenten redelijke studiefinanciering en (dus) er weinig social pressure om op te schieten met je studie, en geen social media om je aan te moedigen een groots en meeslepend leven te hebben.
Ik weet niet of we van studenten moeten verwachten dat ze het in deze wereld zelf kunnen. Maar hoe mooi zou het zijn als je een stuk opgeeft aan studenten, en het ze ter plekke in de klas laat lezen en met elkaar bespreken? (Voordeel is dat je het ondertussen ook zelf nog eens kan (her)lezen!) Hoe mooi is het als studenten gewoon een middag met de docent in een collegezaaltje kunnen zitten om aan huiswerk van jouw vak of van een ander vak te werken en tips te vragen als ze vastzitten. Zouden ze in zo'n context veel gebruik maken van GPT, of van jouw en elkaars expertise? Dus als je je afvraagt hoe we GPT toch uit het onderwijs kunnen weren, dat is dit het volgens mij. En als je antwoord is: daar hebben we toch helemaal geen geld/tijd voor, tsja... willen we nu dat ze leren of niet?
Slopsquatting
Ik leerde deze week een nieuw AI-gerelateerd woord, maar ik geloof liever dat ik het niet had gekend, het woord slopsquatting. Nou, dat vergt dus even uitleg. Slop komt natuurlijk van AI slop, de geautomatiseerde drek dus uit AI komt (zie ook dit recente stuk over SI slop in NRC waarvoor ik werd geïnterviewd samen met scherpe techniekdenker Siri Beerends).
Tech blog The Register legt uit dat er uit AI niet alleen lelijke plaatjes en teksten komen met hallucinatiefouten, maar ook codes die soms een ander stukje software aanroepen. In veel programmeertalen zit niet alles ingebakken, maar zijn er een soort extensies die je kan installeren om de programmeertaal meer opties te geven (die heten in verschillende systemen anders: packages of libraries of modules). Je installeert die modules met code, bijvoorbeeld import math
geeft Python extra rekenopties.
Nu is het zo dat chatGPT vaak van die extensies verzint, die er niet zijn, maar wel logisch klinken, het stuk in the Register noemt een voorbeeld van een fout bij Google die ontstond doordat iemand @async-mutex/mutex
installeerde ipv de echte module @async-mutex
. En nu denk je misschien, ach ja, dat is toch niet zo erg, als die tool niet bestaat, krijg je gewoon een foutmelding! Maar dan heb je buiten de waard gerekend, want zelfs al voor chatGPT had je boefjes die expres pakketen maken met een naam die lijkt op een wel bestaande tool (voor @async-mutex
zou je bijvoorbeeld ook @async_mutex
of @asyncmutex
kunnen typen) en op die neppe namen dan iets anders neem te zetten, een bitcoin-minor of een tool die je wachtwoorden uitleest. Maak je dan per ongeluk een typo, dan krijg je geen foutmelding maar malware. Dat fenomeen heeft een naam, namelijk typo-squatting, van de Engelse term voor kraken, squatten.
Nu er zoveel foute namen uit AI komen (zo'n 5 procent, schrijft de Register) gaan mensen niet meer gokken op typos, maar op slop en hebben we te maken met slopsquatting. De slop packages hebben vaak sterk geschreven readme files waarin (soms beter dan voor echte packages) beschreven staat wat ze doen. Dus vraag je aan chatGPT of dat echt het goede package is, dan krijg je de ronkende zinnen (misschien ook met AI gemaakt) van de squatter te zien.
What a world we live in: AI hallucinated packages are validated and rubber-stamped by another AI that is too eager to be helpful.
En dan vragen mensen zich nog af waarom ik geen fan ben van generatieve AI...
Hoe beschermen we de rechtsstaat?
Ik ontmoette Tamar de Waal laatst op een event en ik was meteen fan. Ze houdt er een stevige mening op na over onrecht en een gezonde democratie, en uit zich helder en eloquent. In dit (wat bij betreft veel te korte!) stuk in de Groene Amsterdammer schetst ze context bij het vertrek van Omtzigt uit de Nederlandse politiek.
Weldoen, misschien gewoon niet?
Schreef ik een tijdje terug al over Bill Gates en zijn mislukte bemoeienis met onderwijs, ook Zuckerberg kan er wat van. Hij opende twee scholen, zogezegd om minderbedeelde kinderen in de buurt van het Facebook kantoor te helpen, maar NY Times rapporteert dat die scholen nu weer dicht gaan.
Alsof ze over midden jaren 50 schrijven en niet over een paar jaar geleden schrijft NY Times dat de scholen stammen uit
a different era when tech leaders were pouring resources into racial justice and diversity measures that were intended to reduce societal inequality
En ook dit geval staat niet op zichzelf, Zuckberg investeerde al eerder 100 miljoen in scholen in Newark en dat liep ook uit op een mislukking. Waarom staan we dit toch toe? Ik vraag me steeds vaker af waarom we geen cap zetten op hoeveel een mens mag hebben. Is, laten we zeggen, 100 miljoen niet gewoon echt meer dan genoeg? Dan kan je de rest gewoon als belasting betalen aan de overheid om op een fatsoenlijke en democratische manier besluiten te nemen over onderwijs en wetenschap. Klinkt dat goed? Verdiep je dan eens in limitarisme van held Ingrid Robeyns.
Voetnoten
[[1]] Ik denk trouwens in tegenstelling tot Hans dat dat vroeger ook al geen goed model was, want er waren altijd al manieren om een ander werk te laten doen en openlijk vals te spelen, en dan zijn er nog studenten die uit een nest komen waar ouders meedenken of nalezen uit oprechte interesse en dat is ook niet eerlijk en niet wat je wil.
Member discussion