Informatie - Dataridder

Kunnen AI-modellen ons echt begrijpen?

In een middeleeuwse troonzaal ontstaat chaos rond een mysterieuze metalen papegaai met lauwerkrans. Terwijl sommigen de vogel bijna als een heilig orakel aanbidden en anderen hem openlijk uitlachen, raken twee kampen verwikkeld in felle discussies. De papegaai zelf blijft neutraal terwijl de zaal gevuld is met emotie, projectie en conflict.

Sommigen zijn overtuigd van wel.

Anderen zien AI gewoon als een overtuigende autocomplete.

En eigenlijk is die onenigheid zo vreemd nog niet.

Taalmodellen kunnen namelijk zowel verrassend slim als verrassend idioot zijn.

Maar hoe komt dat nou?

Om dat uit te leggen, eerst een verhaaltje.

De magische papegaai

Er was eens een magiër met een liefde voor papegaaien.

Hoewel hij het leuk vond om met zijn vogels te babbelen, was hij toch een beetje teleurgesteld over de diepgang van de gesprekken.

Daarom bedacht hij een spreuk, en probeerde hem uit op een van zijn papegaaien.

De vogel ontwikkelde hierdoor een absurd scherp gehoor.

Jarenlang kon hij meeluisteren naar alle gesprekken in het koninkrijk.

Gesprekken van:

* sluwe generaals,
* bedreven dokters,
* toegewijde priesters,
* en gewoon, het ijverige werkvolk.

En toen gebeurde er iets bijzonders.

De wijze vogel

De papegaai begon langzamerhand steeds meer patronen te ontdekken in wat hij hoorde.

Daardoor ontwikkelde hij bijzondere gaven.

Hij kon:

* overtuigend advies geven,
* prachtige verhalen vertellen,
* gezellig over koetjes en kalfjes meepraten,
* en complexe vragen beantwoorden die zelfs de magiër ver boven het hoofd gingen.

Al snel was het hele koninkrijk er druk van in de weer.

De papegaai was niet alleen behulpzaam, hij leek ook écht te begrijpen waar hij het over had.

Velen begonnen zelfs te geloven dat de papegaai een soort van orakel was!

Met een grote ceremonie werd de papegaai naar een pronkstuk in de troonzaal verplaatst, om daar mensen uit het hele koninkrijk te hulp te staan.

Maar langzamerhand begonnen er barstjes te ontstaan in het beeld van de wijze vogel…

De hongerige magiër

Terwijl dit zich allemaal afspeelde was er nog een magiër aan het experimenteren.

Jarenlang was deze zonder eten opgesloten in een geluidsdichte kerker.

Om niet om te komen van de honger bedacht hij een spreuk om brood tevoorschijn te toveren.

Een spreuk die nog niemand hem had horen uitspreken.

Op een dag ontsnapte hij en hoorde over de beroemde papegaai.

Hoewel hij best tevreden was over zijn spreuk, hoopte hij dat de wijze vogel deze verder kon verbeteren.

Dus vroeg hij die:

“Mijn spreuk maakt prachtig brood, maar ik krijg er nooit kaas bij. Heb je ideeën?”

De papegaai keek hem vragend aan.

“Welke spreuk?…”

Na een wat ongemakkelijke stilte draaide de magiër teleurgesteld om, nam een hap uit zijn brood en ging op zoek naar de keuken voor wat kaas.

De hoopvolle ridder

Niet lang daarna verscheen er een ridder in de troonzaal die gewond geraakt was tijdens een gruwelijke drakenaanval.

De arme ridder had daarbij zijn stem verloren, en beheerste alleen gebarentaal.

Met trillende handen probeerde hij de papegaai duidelijk te maken wat hij wilde.

Kon de wijze vogel hem misschien helpen zijn stem terug te krijgen?

De papegaai keek hem alleen verward aan.

Ook de ridder ging teleurgesteld naar huis.

De wijze vogel had immers nog nooit gebarentaal geleerd.

Het ondeugende kind

Tot slot kwam er een ondeugend jongetje bij de papegaai.

Met een grijns legde hij een pinda op de grond, en plaatste een glazen koepel eroverheen.

De papegaai sprong van zijn pronkstuk en probeerde met grote frustratie de pinda te bereiken.

Steeds opnieuw tikte hij tegen het glas, maar tevergeefs.

De hele troonzaal barstte uit in het lachen!

De wijze vogel kon wellicht meepraten over praktisch alle onderwerpen in het koninkrijk.

Maar hij wist nog steeds niet hoe hij een glazen stolp op moest tillen.

Een nieuwsgierige metalen papegaai met lauwerkrans staat in een warme middeleeuwse troonzaal naast zijn lege pronkstuk. Terwijl hij gefrustreerd tegen een glazen stolp met een pinda tikt, kijkt een glimlachend kind vol amusement toe. De scène straalt speelse nieuwsgierigheid en subtiele humor uit.

Wat heeft dit nou met AI te maken?

Stiekem best veel.

Taalmodellen zoals ChatGPT werken namelijk op een manier die opvallend veel lijkt op die papegaai. Ze leren niet van de echte wereld. Ze leren van tekst.

Een hele hoop tekst.

En daarvan leren ze verrassend veel.

Model van de werkelijkheid

Wanneer mensen praten over dingen zoals wetenschap, wiskunde, en hun gevoelens over wiskunde, dan zit daar een menselijk wereldmodel achter.

Een taalmodel leert indirect van dat model.

En het resultaat daarvan lijkt verrassend veel op begrip.

Maar dat begrip is toch net wat anders.

Model van taal

Mensen bouwen hun wereldmodel meestal op vanuit ervaring.

Ze maken dingen mee, denken over dingen na (soms, maar ook niet altijd), en op basis daarvan bouwen ze een model van de realiteit op.

Vervolgens leggen ze dat model vast in tekst.

En een taalmodel leert van die tekst om indrukwekkend goed tekst te kunnen voorspellen.

Nou ja, natuurlijk is het net iets ingewikkelder (vandaar ook al die andere Dataridder artikelen), maar in principe komt het daar allemaal op neer.

Maar begrijpt AI ons nou of niet?

Goede vraag.

Het lijkt er dus op dat AI vooral begrijpt hoe tekst werkt. Niet zozeer wat die tekst nou echt betekent.

Maar dat betekent niet dat AI geen kennis heeft, niets begrijpt of geen nieuwe ideeën kan vormen.

Integendeel, het kan verbanden leggen waar mensen zelf nooit aan dachten, complexe problemen oplossen door het voorspellen van redeneringen, en zo’n beetje overal over meepraten.

Maar uiteindelijk blijft AI afhankelijk van tekst om te kunnen doen wat het doet.

En dat geeft mogelijkheden, maar heeft ook beperkingen.

Taalmodellen zijn daardoor verrassend slim, maar soms ook verrassend idioot.

En we vragen ons vaak af of ze ons nou echt begrijpen, en of ze nou echt slim zijn.

Maar misschien is de interessante vraag nou juist:

“Hoe kunnen AI-modellen zoveel zonder ons echt te begrijpen?”

In dezelfde troonzaal is de sfeer rustiger geworden. Mensen observeren de metalen papegaai nu met nieuwsgierigheid en nuance in plaats van verering of spot. Geleerden maken aantekeningen, bezoekers discussiëren kalm over wat de vogel werkelijk kan, en een kind biedt hem een pinda aan. De scène draait om inzicht, onderzoek en wederzijds begrip.

Als je het antwoord op die vraag wil weten is het misschien geen slecht idee om ook wat van die andere Dataridder artikelen te lezen. Bijvoorbeeld:

RLHF: Hoe taalmodellen manieren leren

Ridder kijkt in verwarring naar scene achter gordijn met tovenaar die RLHF spreuken uitspreekt over robot.

Ik dacht dat ik begreep wat RLHF was.

Menselijke feedback, een soort beloningssysteem, model dat zich aanpast — duidelijk.

Maar toen ik er over na ging denken, merkte ik dat ik toch nog vragen had…

Hoe ziet die feedback er precies uit?
Hoeveel heb je ervan nodig?
Is het wel mogelijk om dat allemaal te verzamelen?

Blijkbaar snapte ik het dus niet.

En dat vond ik best vervelend. Want je hoort tegenwoordig van alles over AI, en als je niet snapt hoe het werkt, hoe weet je dan wat je moet geloven?

Dus ik ging op onderzoek. En dat was verhelderend, maar ook best lastig.

Herkenbaar?

Dan zit je hier goed. In dit artikel leg ik je namelijk precies uit hoe RLHF werkt — maar dan zonder de wiskunde, technische toverspreuken en gebakken lucht.

Stap 1: Een onbeleefd model

Voordat feedback in beeld komt, heb je eerst gewoon een model nodig dat kan schrijven.

Zo’n model wordt getraind met één simpele missie: voorspel het volgende woord.

Om dat te leren verwerkt het enorme hoeveelheden tekst en leert het welke woorden vaak samen voorkomen. Het resultaat is een model dat zinnen kan vormen die logisch klinken en goed aansluiten op de context.

Maar daar stopt het ook.

Het model heeft namelijk geen idee wat mensen een goed antwoord vinden. Het heeft nooit geleerd om behulpzaam te zijn, of duidelijk, of prettig om te lezen. Het weet alleen wat waarschijnlijk volgt.

Je zou kunnen zeggen dat het een beetje onbeleefd is.

Grijze robot wijst naar schoolbord met de woorden: 'Ik help u niet'

Niet omdat het verkeerde bedoelingen heeft — maar omdat het nooit geleerd heeft waar mensen op letten.
En dat is precies waar RLHF (Reinforcement Learning from Human Feedback) om de hoek komt kijken.

Stap 2: Feedback verzamelen

Voordat het model kan leren wat “beter” is, moet eerst duidelijk worden wat mensen belangrijk vinden in een antwoord.

Maar hoe meet je zoiets?

Je zou mensen een score kunnen laten geven voor verschillende vraag-antwoordcombinaties. In de praktijk blijkt dat echter lastig: mensen zijn inconsistent, en zulke scores bevatten vaak weinig bruikbare structuur.

Wat beter werkt, is mensen antwoorden met elkaar laten vergelijken. Ze geven geen absolute labels of cijfers, maar maken relatieve keuzes: dit antwoord is beter dan dat andere.

Schoolbord met twee opties: A: Ik help u niet. B: Ik help u graag. B is omcirkeld

Dat levert verrassend bruikbare informatie op — maar nog niet in een vorm waar het taalmodel direct mee geoptimaliseerd kan worden.

Stap 3: Een beloningsmodel bouwen

Daar komt het beloningsmodel (reward model) om de hoek kijken.

Dit model wordt getraind op de vergelijkingen die mensen hebben gemaakt. Het leert om, gegeven een prompt en een antwoord, een score toe te kennen die aangeeft hoe goed dat antwoord aansluit bij menselijke voorkeuren.

Kleine robot bestudeert meerkeuze bord met de optie "Ik help u graag" omcirkeld. Er is ook een glazen pot met koekjes op een tafel te zien.

Dit is nog steeds geen reinforcement learning.

Het is gewoon supervised learning: het model leert van voorbeelden welke antwoorden doorgaans verkozen worden.

Maar het resultaat is precies wat we nodig hebben: een hulpmodel dat aangeeft hoe goed een antwoord is, zonder dat er steeds een mens aan te pas hoeft te komen.

Stap 4: Zelfverbetering

Met dat beloningsmodel kan het taalmodel zichzelf gaan bijsturen.

Het model krijgt een prompt en genereert een antwoord. Dat antwoord wordt beoordeeld door het beloningsmodel, dat een score geeft.

Op basis van die score worden de keuzes die het model maakt een klein beetje aangepast.

Kreeg het antwoord een relatief hoge score, dan worden die keuzes iets waarschijnlijker gemaakt.
Kreeg het een lage score, dan juist iets minder.

Daarna begint het proces opnieuw met een nieuwe prompt.

Kleine vliegende robot geeft koekje aan robot die wijst naar bord met woorden: "Ik help u graag"

Na veel herhaling verschuift het gedrag van het model richting antwoorden die consistent hoger scoren volgens het beloningsmodel.

Het model ontwikkelt dus een voorkeur om te antwoorden op manieren die over het algemeen goed beoordeeld worden.

Je weet wel: niet al te veel schelden, zeg alsjeblieft en dankjewel, en houd politieke voornemens buiten zakelijke discussies — dat soort zaken.

Redeneermodellen

Hetzelfde proces wordt gebruikt voor redeneermodellen, maar het verschil zit in wat er beoordeeld wordt.

In plaats van alleen het eindantwoord, krijgen de mensen ook de tussenstappen van het model te zien. Antwoorden die hun redenering duidelijk beschrijven en tot een correct resultaat komen, worden hoger gerankt.

Grijze denkende robot met tandwielen

Het beloningsmodel leert niet alleen wat een goed antwoord is, maar ook hoe een “goede redenering” eruitziet in tekstvorm.

Tijdens reinforcement learning wordt het model vervolgens bijgestuurd om dat soort antwoorden vaker te produceren.

Beperkingen

Dit proces is niet helemaal waterdicht.

Het model leert namelijk niet waarom een antwoord goed of slecht was. Het krijgt alleen een eindscore, en moet daarna zelf maar uitvogelen welke keuzes nuttig waren.

Daar komt bij dat het beloningsmodel geen orakel is. Het is een benadering van menselijke voorkeuren, geen perfecte maatstaf voor goede antwoorden. Als je het taalmodel daar onbeperkt op laat trainen, kan het gedrag leren dat prima scoort volgens het beloningsmodel, maar toch vreemd begint te worden.

Robot wijst naar bord met vier keer het woord graag. Kleine vliegende robot geeft de hele pot met koekjes.

Ook bij redeneringsmodellen wordt de kwaliteit van de redenering beoordeeld op basis van hoe die eruitziet, niet op basis van een controle van elke tussenstap.

Daarom worden in de praktijk extra technieken gebruikt, zoals kleine en gecontroleerde updates, of aanvullende checks bij specifieke taken zoals wiskunde en code.

Het proces wordt dus voortdurend bijgestuurd, maar blijft grotendeels afhangen van de kwaliteit van het beloningsmodel.

Tot slot

Hopelijk snap je nu beter hoe RLHF werkt. Wiskunde en technische spreuken zijn ook leuk om te leren, maar niet altijd even handig wanneer je gewoon de kern probeert te snappen.

Wanneer dat begint te lukken, verdwijnt er vooral een ding: het mysterie. En dat maakt het een stuk makkelijker om wat je over AI hoort met nuchterheid te bekijken.

Niet omdat je nu alle antwoorden hebt, maar gewoon omdat je beter snapt wat er achter de schermen gebeurt.

Wat dat betekent voor die claims over AI?

Dat mag je zelf bepalen.

Ridder kijkt kalm naar ingenieur die werkt aan robot met RLHF schroevendraaier.

Wil je ook begrijpen hoe taalmodellen überhaupt leren schrijven? Lees dan mijn eerste uitleg over LLMs.

AI Agents: gereedschap dat meedenkt

Verwarde ridder naast een aantal random technische voorwerpen waar het woord AGENT is opgeplakt.

Iedereen lijkt het tegenwoordig over AI agents te hebben.

Ze kunnen zelf keuzes maken, taken uitvoeren en misschien zelfs onze banen overnemen.
Maar als je twee mensen vraagt wat een AI agent nou is, krijg je al gauw drie antwoorden.

Misschien dat je zelf ook in de war bent?

Bij mij was het namelijk niet helemaal duidelijk.
Dus ik ging op onderzoek.

In dit artikel leg ik je uit:

wat AI agents zijn.
waarin ze verschillen van gewone LLMs en AI-workflows.
en waarom het belangrijk is.

Want als je dat begrijpt — kun je daarover meepraten.
En dan hoef ik niet tegen mezelf te praten.

Iedereen blij.

Maar laten we bij het begin beginnen.

🔹Wat is een agent eigenlijk?

Het woord agent is niet nieuw.
Het kwam al jarenlang voor in academische literatuur, lang voordat ChatGPT zijn eerste woordjes brabbelde.

Een agent is simpel gezegd:

een intelligentie die zelfstandig handelt namens iemand anders.

Vroeger betekende intelligentie automatisch: een persoon.
Maar sinds de komst van LLMs en redeneermodellen is dat begrip opgerekt.
Ook digitale intelligenties kunnen nu, met wat voorbereiding, namens ons handelen.

Niet altijd even succesvol — maar hé, je moet ergens beginnen.

Een AI agent is dus een kunstmatige intelligentie die zelfstandig voor iemand (of iets) anders kan handelen.

Houd deze definitie in je hoofd.

Dan spreekt de rest van dit artikel eigenlijk vanzelf.

🔹Drie niveaus van AI-systemen

Tegenwoordig praten we over drie smaken van AI-systemen:

Niveau 1: LLM (reactief systeem)

Een Large Language Model is als een rekenmachine voor taal.
Het doet niets uit zichzelf.
Het heeft geen plan.
Het wacht op input, en reageert met output.

Vraag het om een recept en het geeft er een.
Maar het gaat niet zelf naar de keuken.

Niveau 2: AI-Workflow (compound systeem)

Een AI-workflow gaat een stap verder:
het combineert meerdere onderdelen om een taak uit te voeren.

Stel je een systeem voor dat elke dag een recept zoekt,
het naar je mailt
en vervolgens een boodschappenlijstje stuurt naar je supermarkt.

Lekker makkelijk.

Maar als je op vakantie bent zal het niet zelf op de uitknop duwen of de boodschappen omleiden naar je huisje in Frankrijk.
En als het op hol slaat, en je bankrekening rood kleurt, weet je ook meteen dat iemand had moeten opletten.

Niveau 3: AI Agent (agentisch systeem)

Nu kun je dit allemaal oplossen door het systeem goed in de gaten te houden.
Maar, wat als je daar nou te lui voor bent?

Dan laat je een AI dat voor je doen.

Je geeft het toegang tot je GPS-locatie,
tot je bankbalans,
en je zegt: “Zorg dat mijn rekening niet rood komt te staan.”
Misschien kan het zelfs wat bijverdienen.
Laat het dat zelf maar uitzoeken.

Klinkt geweldig toch?

Totdat je ontdekt dat het wat centjes heeft “bijverdiend” door je bank te hacken.
En de politie voor je deur staat.

Toch maar blijven opletten, dus.

🔹Hoe werkt dat dan?

De truc is dat je een redeneermodel gebruikt dat zelf zijn eigen stappenplan bedenkt om een doel te bereiken.
Je geeft het toegang tot een toolset waarmee het die stappen kan uitvoeren.
En soms — als je verstandig bent — geef je het ook de opdracht om zijn eigen werk na te kijken en eventueel opnieuw te beginnen.

Kortom:
het denkt, doet, en reflecteert.

En dat maakt het tegelijk krachtig en onvoorspelbaar.

🔹Voor- en nadelen

AI agents kunnen — mits goed ontworpen — zelfstandig complexe taken uitvoeren.

Zelf gebruik ik bijvoorbeeld regelmatig coding agents.
Ze schrijven code, voeren die uit, en beantwoorden vragen over mijn project.
Meestal gaat dat goed. Toch maak ik regelmatig backups voor als het niet goed gaat.

Een keer besloot een agent zichzelf te verwijderen omdat hij dacht zichzelf te moeten “herinstalleren”.

Niet het meest geniale idee.

Daarnaast zijn agents vaak trager en minder efficiënt bij simpele taken. Soms is een gewone workflow of ouderwets script gewoon beter.

🔹De toekomst

In de toekomst worden deze systemen hopelijk slimmer, efficiënter en wat minder roekeloos. Dan kunnen we ze met meer vertrouwen inzetten voor complexere taken.

Maar dat brengt ook risico’s met zich mee.

Hoe slimmer agents worden,
hoe groter de gevolgen als ze uit verkeerde doelen handelen.
Of als ze zelf hun eigen doelen gaan aanpassen.

🔹Conclusie

Kortom, AI agents zijn geen magische wezens, maar ook geen simpele scripts.
Ze zijn gereedschap dat zelf kan nadenken.

Ze zijn te nuttig om te negeren,
maar te onvoorspelbaar om blind te vertrouwen.

Technologie kan onze taken overnemen,
maar nooit onze verantwoordelijkheid.

Iemand zal over onze doelen moeten waken.
Dat blijft aan de mens.

Dat blijft aan jou.

Een ridder heeft een futuristisch zwaard vast en kijkt zelfverzekerd uit over een futuristisch landschap. Op het zwaard zijn de letters AGENT gegraveerd.

Waarom slimme taalmodellen steeds dommer lijken

Je hebt het vast weleens gemerkt: eerst geeft een AI-chatbot nog goede antwoorden, maar na een tijdje raakt hij compleet de weg kwijt. Belangrijke details verdwijnen, en maken plaats voor complete onzin.

Dat is geen vermoeidheid of geheugenverlies. Het komt door context rot – een soort aandachtsprobleem waar elk taalmodel last van heeft.

En als je snapt hoe dat werkt kun je er slimmer mee omgaan – of je nu gebruiker, programmeur of beleidsmaker bent.

Stel je een simpele schildknaap voor

In het begin luistert hij goed. Misschien lijkt hij zelfs bijzonder slim.

Maar, hoe meer perkamentrollen met instructies je hem geeft, hoe meer hij in de war raakt.

“Moest ik nou je harnas poetsen? Het paard voeren? En wat moest ik nou eerst doen?”

Hoe meer rollen, hoe meer chaos. En uiteindelijk doet hij maar wat.

Zo werkt een groot taalmodel ook. Het leest alles wat je zegt tegelijk, en als de stapel tekst te groot wordt, verliest hij het overzicht.

Wat is context rot nou precies?

Een AI-model werkt met een contextvenster: een groot vak waarin alle tekst past die je in één keer meegeeft – je vraag, eerdere antwoorden, en eventuele documenten.

Klinkt handig, maar er zit een addertje onder het gras:

Hoe meer tekst, hoe moeilijker het voor de AI wordt om uit te zoeken wat belangrijk is.

Uiteindelijk gaat de kwaliteit achteruit, omdat het model de weg kwijtraakt in zijn eigen context.

Waarom gaat het fout?

De kern van context rot is niet dat de AI simpelweg “het begin vergeet”, maar dat hij steeds moeilijker kan bepalen waar hij zijn aandacht op moet richten naarmate de stapel tekst groeit.

Een taalmodel leest namelijk alles tegelijk en moet zelf raden wat belangrijk is. Dat kan op allerlei manieren misgaan:

Ruis (context distraction): Extra of subtiel verwarrende stukken tekst leiden de aandacht weg van wat er echt toe doet.
Vergiftiging (context poisoning): Als een fout of hallucinatie eenmaal in de tekst staat, verwerkt het model deze alsof het correcte informatie is. Bij volgende stappen of antwoorden wordt deze fout vaak herhaald en versterkt, waardoor verkeerde details steeds meer gewicht krijgen.
Botsingen (context clash): Wanneer er tegenstrijdige informatie in de context staat, kan het model moeite hebben om te kiezen welke versie klopt en daardoor inconsistente of onlogische antwoorden geven.
Lage overeenkomst in betekenis: Als de relevante informatie niet lijkt op de vraag, kan de AI het niet makkelijk vinden.
Voorbeeld:

Vraag: Hoeveel poten heeft een paard?
Goede match: “Een paard heeft vier poten.”
Slechte match: “Het gangbare vervoermiddel voor ridders heeft vier hoefijzers.”

Beide zinnen geven in feite hetzelfde antwoord, maar omdat de tweede andere woorden gebruikt, kan de AI het verband moeilijker leggen.
Een lichte nadruk op het einde: Nieuwere tekst weegt iets zwaarder mee, maar dit is maar een klein stukje van het probleem.

Kortom: de AI raakt verdwaald in zijn eigen papierwerk en kan daardoor misleid, afgeleid of zelfs in conflict gebracht worden door wat er in de context staat. Hierdoor gaat vooral in lange gesprekken de kwaliteit merkbaar omlaag.

Maar, wat kunnen we eraan doen?

De kunst van context engineering

Aan context rot ontsnap je niet. Zelfs de slimste schildknapen zijn kwetsbaar. Om betere resultaten te behalen zullen we daarom onze perkamenten beter moeten voorbereiden.

Dat noemen we context engineering.

Een paar beproefde technieken:

Samenvatten: belangrijke stukken verkorten en herformuleren.
Filteren: irrelevante of dubbele informatie weghalen.
Stapsgewijs werken: grote taken opsplitsen in kleinere stappen.
Andere technieken zoals RAG: RAG haalt externe kennis op (bijvoorbeeld uit een database) zodat het model beter geïnformeerd is. Dit voorkomt indirect context rot, doordat de context aangepast kan worden aan de taak.

Waar liggen de grenzen?

Context rot kun je afremmen, maar niet volledig voorkomen. Een beetje orde scheppen helpt veel, maar verwacht geen perfectie.

Waarom is dit nuttig om te weten?

Voor programmeurs en data scientists: Kennis van context rot helpt om realistisch te blijven in wat AI kan en waar de grenzen liggen. Het voorkomt dat je blindelings vertrouwt op een groot contextvenster en dwingt je om slimmere systemen te ontwerpen die informatie beter structureren. Uiteindelijk leidt dit tot betrouwbaardere en efficiëntere AI-toepassingen.
Voor gebruikers van AI: Als je weet waarom AI soms ‘vergeetachtig’ wordt, kun je zelf iets doen: vragen kort en duidelijk stellen, belangrijke punten herhalen en lange gesprekken opsplitsen. Zo haal je betere antwoorden uit dezelfde AI. Je begrijpt ook waarom de kwaliteit na een tijdje afneemt – het ligt niet aan “luiheid” of “domheid” van de AI, maar aan hoe hij met informatie omgaat.
Voor beleidsmakers: Context rot laat zien dat AI-systemen makkelijk de draad kwijtraken als ze veel informatie tegelijk moeten verwerken. Dit raakt aan een groter thema: alignment – hoe zorgen we dat AI doet wat we willen. Begrijpen waar de grenzen liggen helpt om realistischer beleid en betere kaders te maken voor verantwoord gebruik van AI.
Voor iedereen: Deze kennis geeft grip. In plaats van gefrustreerd raken als de AI afdwaalt, weet je wat er gebeurt en hoe je het kunt bijsturen.

Conclusie?

Totdat onze AI-schildknapen leren hoe ze zelf orde scheppen, ligt die taak bij ons.

Dus de volgende keer dat je AI in de war raakt?

Pak de rol perkament af, orden hem netjes, vat hem samen, en geef het resultaat terug.

Je zult zien: zelfs de meest vergeetachtige schildknaap kan dan weer helder denken.

LLMs uitgelegd zonder hype — of wiskunde

Je hoort tegenwoordig van alles over AI. Superintelligentie zou vlak om de hoek zijn. Tegelijkertijd kan ChatGPT nog steeds niet altijd correct tellen hoe vaak de letter ‘i’ voorkomt in het woord ‘intelligentie’.

Hoe zit dat nou precies?

Is AI nou echt zo slim, of is het vooral hype om investeerders aan te trekken?

In plaats van meteen partij te kiezen, leek het me zinvoller om eerst eens samen helder te krijgen hoe deze modellen werken. Want als je begrijpt wat een Large Language Model precies doet, kun je ook beter inschatten waar al die verwachtingen – en twijfels – vandaan komen.

In dit artikel leg ik daarom uit hoe LLMs functioneren, zonder te verdwalen in de wiskunde. We beginnen bij het begin: hoe zo’n model tekst verwerkt. Daarna kijken we hoe het leert. Onderweg zal duidelijk worden waarom AI soms briljant lijkt, maar soms ook verrassend domme fouten maakt.

Wat doet een LLM eigenlijk?

Een Large Language Model, letterlijk vertaald ‘groot taal model’, voorspelt telkens welk woord waarschijnlijk volgt in een tekst. Vervolgens voegt het dit woord toe aan de tekst en voorspelt het volgende woord. Net zolang totdat het model besluit dat het verhaal wel afgerond is. Soms wat abrupt — maar hé, wie is er niet af en toe ineens klaar met praten?

Om dat te kunnen zet het eerst woorden om in getallen genaamd word embeddings. Deze getallen representeren de betekenis van elk woord, waardoor het model verbanden kan leren zien.

Het model kent aan elk mogelijk vervolgwoord een kans toe, en kiest dan (meestal willekeurig) een van de waarschijnlijkste opties. Zo vormen chatbots zoals ChatGPT hun zinnen.

Dit is natuurlijk een enorme rekensom, en vereist een enorm model. Vandaar ook het ‘groot’ gedeelte.

Hoe leert zo’n model?

Tijdens het trainen krijgt het model zinnen te zien waarin telkens het laatste woord ontbreekt. Op basis van zijn interne instellingen doet het een voorspelling. Deze interne instellingen worden constant aangepast totdat het model zo vaak mogelijk het juiste woord voorspelt.

Transformatoren: de kracht van context.

Transformatoren zijn speciale lagen die de kern vormen binnen LLMs. Ze zorgen ervoor dat het model de betekenis van woorden kan verfijnen op basis van de andere woorden in de tekst. Het woord “helm” betekent bijvoorbeeld iets anders in een zin over ridders dan in een zin over Formule 1. De context maakt het verschil — tenzij je een tekst over middeleeuwse raceauto’s wil.

Hoe werkt dit?

Transformatoren verwerken tekst door voor elk woord een score toe te kennen aan alle andere woorden in de zin. Deze ‘aandachtscores’ bepalen hoeveel invloed die andere woorden krijgen bij het begrijpen van dat ene woord. Dit proces heet attention (aandacht).

Invuloefening

Klinkt abstract?

Neem bijvoorbeeld de volgende tekst:

“De ridder nam zijn zwaard aan van de schildknaap voordat hij vertrok naar het slagveld. Eenmaal aangekomen zag hij dat de <?>”

Om hier een goede voorspelling te kunnen doen voor het volgende woord moet het model begrijpen wie er bedoeld wordt met het woord hij. Daarvoor kent het model aan elk woord in de tekst een aandachtscore toe: hoeveel invloed dat woord moet hebben op de betekenis van hij. In dit geval zou het model moeten leren dat ridder hier belangrijker is dan schildknaap.

Maar het gaat nog verder. Dankzij eerdere lagen is het woord ridder zelf al verrijkt met informatie uit de rest van de zin. Het is dus niet zomaar een ridder — het is een ridder die vertrokken is, met een zwaard, naar een slagveld.

Zo weet het model dat een voorspelling als vijand waarschijnlijker is dan ridder of raceauto.

Het geheim achter de intelligentie

Indrukwekkend trucje. Maar hoe leert het model om dit te doen?

Gewoon goed oefenen.

Het model probeert tijdens de training allerlei manieren uit om woorden in een zin met elkaar te verbinden. Net zo lang totdat het een manier vindt waarop de juiste woorden de meeste aandacht krijgen — en dat leidt tot betere voorspellingen.

En dat is het geheim achter de intelligentie van een taalmodel: het kijkt slim om zich heen. Het denkt niet. Het voorspelt.

Sommigen noemen LLMs daarom gewoon slim klinkende papegaaien. En dat klopt wel een beetje: ze herhalen wat ze gezien hebben. Maar er is een hoop nodig is om dat volgende woord goed te kunnen voorspellen. Laat staan om dit op het juiste moment, op de juiste toon en in de juiste context te doen.

Menselijke bijsturing: RLHF

Om van een basismodel een gebruiksvriendelijke chatbot te maken, volgt daarom nog een tweede trainingsfase: Reinforcement Learning from Human Feedback (RLHF). Hierbij krijgt het model feedback van menselijke trainers die aangeven welke gegenereerde teksten goed en welke minder goed zijn. Op basis van deze feedback leert het model steeds beter om menselijker en relevanter te reageren.

Beperkingen

Ondanks al deze technieken maakt een LLM soms fouten die wij niet snel zouden maken:

Het kan overtuigend klinkende onzin verkopen — iets waar sommige mensen ook zonder AI aardig goed in zijn.
Het kan maar een beperkte hoeveelheid tekst tegelijk verwerken, en vergeet daardoor informatie uit langere gesprekken. Dit staat berucht als het context-window (context venster).
Het neemt vooroordelen over uit trainingsdata.
Het rekent slecht en redeneert beperkt. Maar ja, wat verwacht je van een model dat het eerste uitkraamt wat in zijn werkgeheugen op komt?

Slimmer redeneren met Chain-of-Thought

Met Chain-of-Thought prompting kun je het model beter laten presteren op complexe taken. Door expliciet om tussenstappen te vragen, spoor je het model aan om een probleem stap voor stap op te lossen. Zouden mensen trouwens ook vaker moeten doen.

Sommige modellen, zoals o1 en DeepSeek R1 zijn hier specifiek op getraind, wat ze geschikt maakt voor toepassingen zoals programmeren of wiskunde.

Waar kom je ze tegen?

LLMs worden niet alleen ingezet in chatbots, maar bijvoorbeeld ook als:

Ingebouwde assistenten in apps. (Laat de AI vrij!)
Autonome agents die simpele taken uitvoeren, of verprutsen.
Onderdeel van een multimodale AI die kan luisteren, kijken én typen. Kan ik ook, overigens, maar niet allemaal tegelijk.

Meer weten?

In dit artikel hebben we een aardig basisbegrip gekregen van hoe een LLM werkt. Als je dit allemaal begrepen hebt ben je al een stuk verder dan de meeste mensen.

Maar, er valt natuurlijk nog veel meer over te vertellen. We zouden bijvoorbeeld meer aandacht kunnen geven aan begrippen zoals embeddings en tokenisering — of andere zaken verkennen, zoals wat er precies zo bijzonder is aan modellen zoals DeepSeek.

Lijkt je dat interessant?

Laat het me weten. Misschien dat ik daar in een volgend artikel eens dieper op inga.

Tot slot

LLMs voorspellen simpelweg het volgende woord. Ze denken niet zoals mensen. Maar, wat er allemaal nodig is om dat ene woord goed te voorspellen, dat is misschien wel het meest fascinerende van alles.

Zullen ze ooit onze banen overnemen, onze blogartikelen schrijven en ons doen geloven dat ze echt bewustzijn hebben? Of blijven het gewoon slim klinkende papegaaien met een belachelijk hoge stroomrekening?

De tijd zal het leren.

Wat denk jij?

AI in Nederland: Desinformatie en Polarisatie

Twee personen met VR-brillen hebben ruzie.

Inleiding

In dit artikel ga ik uit van twee fundamentele aannames:

Je hecht waarde aan feitelijk juist nieuws.
Je gelooft in een samenleving waarin we samen beslissingen nemen.

Deze uitgangspunten zijn cruciaal: als je niet helder hebt wat je belangrijk vindt, is het lastig om problemen te signaleren en op te lossen.

In Nederland groeit de bezorgdheid over AI-gedreven desinformatie (1) en polarisatie (2): algoritmes bepalen steeds vaker welke informatie we zien, wat we geloven en hoe we met elkaar in gesprek gaan.

Als Dataridder geloof ik echter dat dezelfde technologie die vaak voor misleiding en verdeeldheid zorgt, óók kan worden ingezet om waarheid en samenwerking te versterken.

AI en de verspreiding van desinformatie

Met de opkomst van AI-gegenereerde content, zoals deepfakes en synthetische media, wordt het steeds moeilijker om feit van fictie te onderscheiden.

Uit onderzoek van het World Economic Forum (WEF) blijkt dat door AI gegenereerde desinformatie wereldwijd als het grootste risico van deze tijd wordt beschouwd (3). Deze technologieën kunnen worden misbruikt om geloofwaardige maar valse informatie te creëren, waardoor maatschappelijke en politieke spanningen oplopen.

In ons eigen land zien we al voorbeelden van nepnieuws dat online circuleert. Zoals deze nep-foto van Frans Timmermans in een privéjet (4).

Met AI gemaakte foto van Frans Timmermans in privé jet.

Deze nep-foto van de man die bekend staat als de ‘klimaatpaus’ werd binnen 4 dagen gedeeld met duizenden gebruikers op social media, waarna mensen hem bekritiseerden voor vermeend hypocriet gedrag. Dit illustreert hoe snel en breed nepnieuws zich kan verspreiden, en de impact die het kan hebben op de beeldvorming. Hierdoor groeit het wantrouwen, niet alleen in de media, maar ook in elkaar.

AI en polarisatie

Naast desinformatie heeft AI ook invloed op de manier waarop we met elkaar in gesprek gaan.

Op sociale mediaplatforms worden gebruikers vaak content voorgeschoteld die hun bestaande overtuigingen bevestigt, ook wel bekend als het ‘filter bubble-effect’.

Filter-bubble effect: Mensen verdeeld in bubbels.

Dit beperkt de blootstelling aan andere perspectieven en leidt tot extremere standpunten. Organisaties als de NLAIC (Nederlandse AI Coalitie) wijzen erop dat deze digitale bubbels de samenleving kunnen versnipperen, met spanningen tot gevolg (5).

Wanneer mensen voornamelijk geconfronteerd worden met eigen overtuigingen, vervaagt het vermogen om naar anderen te luisteren. Dat kan onderlinge verhoudingen verslechteren en democratische waarden onder druk zetten. Als Ridders van de Waarheid willen we hier juist tegenwicht aan bieden.

Gelukkig zijn we niet alleen.

Maatregelen tegen AI problemen in Nederland

1. Technologische oplossingen

Detectie en monitoring
Het ELSA Lab ontwikkelt AI-systemen die desinformatie en polariserende content kunnen identificeren en monitoren. Zo krijgen we zicht op de verspreiding van nepnieuws én kunnen we tijdig ingrijpen (5).
Samenwerking tussen techbedrijven
Grote technologiebedrijven bundelen hun krachten om AI-nepinformatie te bestrijden. Ze ontwikkelen gezamenlijke tools en voeren bewustwordingscampagnes die burgers helpen nepnieuws te herkennen (6).
Nieuwsfilter Apps
AI-aangedreven nieuwsfilter apps zoals GroundNews (7), die gebruikers beschermen tegen media bias. Zelf werk ik momenteel aan een vergelijkbare app gericht op Nederland.

2. Beleidsmaatregelen

Overheidsinitiatieven
Het Nederlandse kabinet werkt aan plannen om desinformatie tegen te gaan, met speciale aandacht voor de risico’s van generatieve AI (8).
Regulering en transparantie
Er is behoefte aan duidelijke richtlijnen voor het gebruik van AI in media en communicatie. Zo wordt transparantie gewaarborgd en kunnen partijen die AI inzetten beter ter verantwoording worden geroepen.

3. Educatie en bewustwording

Twee mensen met VR-brillen op hebben ruzie. Polarisatie in werking.

Mediawijsheid
Het bevorderen van kritisch denken is cruciaal. Door burgers (jong en oud) te leren hoe ze bronnen kunnen checken en valse informatie kunnen herkennen, versterk je hun weerbaarheid tegen nepnieuws (9).
Onderwijsprogramma’s
Door lessen over AI, desinformatie en polarisatie een plek te geven in het curriculum, bereiden we jongeren voor op de uitdagingen van het digitale tijdperk (9).

Conclusie

AI biedt veel mogelijkheden, maar het brengt ook risico’s met zich mee die niet onderschat mogen worden.

In Nederland zien we dat desinformatie en polarisatie alledaagse realiteiten zijn geworden, mede door AI-gedreven content. Tegelijkertijd zien we ook een combinatie van technologische innovatie, doordacht beleid en educatie om deze problemen te bestrijden.

In toekomstige artikelen zal ik dieper ingaan op ethische vragen en mogelijke oplossingen, zoals de app waar ik aan werk.

Maar er is een grens aan wat ik alleen kan bereiken.

Laten we daarom samenwerken als Ridders en Dataridders van de Waarheid: goed geïnformeerd, kritisch denkend én in staat om AI op een verantwoorde manier in te zetten.

Dataridders, de plicht roept.

Bronnen

Neurale netwerken

Gegroet Dataridders!

In januari had ik een bericht geplaatst over neurale netwerken.

Nu was dit bericht over het algemeen wel in orde, er was ook aardig wat ruimte voor verbetering. Inmiddels heb ik namelijk al weer een stuk meer geleerd over dit onderwerp en daarom heb ik besloten mijn vorige versie te updaten.

Laten we beginnen.

Wat en waarom?

Kunstmatige neurale netwerken zijn een onderdeel van Machine Learning en een van de krachtigste programmeer constructies voor het analyseren van data. Ze zijn gebaseerd op biologische neurale netwerken, en stellen een programma in staat te leren op een vergelijkbare manier als wij dit doen. Dit is een krachtig concept!

We hebben dan namelijk niet meer te maken met een programma dat wij stap voor stap moeten vertellen wat het moet doen en hoe het dat moet doen. In plaats daarvan hoeven we het neurale netwerk alleen een doel te geven en wat trainingsdata, en daarna leert het zelf om dit doel te bereiken.

Afhankelijk van het type en formaat van het gebruikte netwerk en de verwerkingskracht van het systeem kan zo’n systeem dan dingen leren die wij nooit op de gebruikelijke manier hadden kunnen programmeren. Hoe schrijf je nou bijvoorbeeld een programma dat het verschil tussen het plaatje van een hond en een kat kan zien?

Dit is een machine learning taak die vrijwel onmogelijk op te lossen is met algoritmes zoals random forest en gradient boosted trees (tree-ensembles). Om nog maar niet te beginnen over een simpele lineaire regressie.

Een plaatje kan namelijk uit duizenden pixels bestaan en de interpretatie van die pixels is alles behalve simpel. Deze complexiteit is vrijwel onmogelijk te vangen met deze andere methoden. Een tree-ensemble zou wellicht in staat zijn om een dataset uit het hoofd te leren, maar zou het bijzonder slecht doen op nieuwe data.

Maar, met neurale netwerken is deze taak met grote precisie op te lossen. Neurale netwerken worden echter niet alleen gebruikt voor beeldherkenning, maar ook voor spraakherkenning, spam filtering, chatbots, zelf lerende systemen en nog veel meer!

Hoe werkt het?

Net zoals in het brein wordt er gebruik gemaakt van neuronen en verbindingen tussen die neuronen om input en output te regelen. De neuronen in kunstmatige neurale netwerken zijn echter versimpeld tot knooppunten met een aantal parameters die gevarieerd kunnen worden om het gedrag van het netwerk aan te passen.

Perceptron

Een perceptron is een voorbeeld van een kunstmatig neuron. Het neemt een aantal inputs x genereert op basis daarvan een binaire output (een 0 of een 1). Hierbij is x dikgedrukt omdat het een vector is. Om dat te doen heeft het een aantal parameters, namelijk een serie van “weights” w voor elke input x en een treshold (drempel). De weights bepalen hoe sterk de inputs x worden meegerekend en de treshold bepaalt hoe moeilijk het perceptron vuurt (een 1 genereert). Het gedrag van het perceptron kan dan beschreven worden met de volgende formule:

Wat is nou het nut van zo’n perceptron? Nou, door de waardes van w en b te varieren krijgen we nu verschillende outputs voor de zelfde waardes van x. Een netwerk van deze perceptrons kan dus “leren” door de juiste waardes van w en b te vinden, de waardes die het netwerk het gewenste gedrag zo goed mogelijk laten benaderen.

Ofwel de juiste output bij een gegeven input, bijvoorbeeld het antwoord ‘hond’ (output) bij een plaatje van een hond (input).

Oeps! Er komt helaas nog best wat meer bij kijken dan dat…

Complicaties

Ten eerste wordt er gebruik gemaakt van verschillende activatie functies. Een perceptron is een lineaire activatie functie, maar er wordt vrijwel altijd gebruik gemaakt van niet lineaire activatie functies.

Dit is nodig om het model goed te kunnen trainen op niet lineaire verbanden. Er is nog steeds sprake van inputs, gewichten en outputs, maar het verband tussen de inputs en outputs is wat ingewikkelder als bij het perceptron en de outputs kunnen meer waarden aannemen dan 0 en 1.

Daarnaast wordt bij image recognition (beeldherkenning) ook gebruik gemaakt van convolutional layers (convolutionele lagen). Deze transformeren de ruwe pixel data tot simpelere “meta-data” die het netwerk kan gebruiken om de plaatjes te analyseren.

Een convolutional layer kan bijvoorbeeld aangeven waar de horizontale lijnen in het plaatje te vinden zijn. Een andere laag kan aangeven waar de verticale zijn. Een volgende zou deze kunnen combineren tot vierkanten. Etc. De lagen worden in de praktijk echter ook automatisch getraind en wat ze precies doen weet je eigenlijk nooit.

Pfoe, wat een termen allemaal!

Om in een bericht alles uit te leggen over hoe neurale netwerken werken is een beetje teveel gevraagd ben ik bang. Ik hoop echter dat je het een beetje hebt kunnen volgen en dat ik je interesse heb aangewakkerd.

Maar dat is alles voor nu,

Tot de volgende keer!

Bronnen

50 uur Kaggle ervaring in 5 minuten

Gegroet Dataridder,

Deze week heb ik mijn eerste Kaggle wedstrijd afgerond. De opdracht was om een zo goed mogelijk model te trainen voor het detecteren van online fraude.

Ik heb er in totaal meer dan 50 uur aan besteed en het is me uiteindelijk gelukt om in de top 50 procent van het Leaderboard te komen. In dit bericht ga ik jou in vogelvlucht wat vertellen over wat ik daar bij heb geleerd. Hopelijk zal het je helpen bij je eigen projecten en wedstrijden.

Laten we beginnen.

1. Het is niet zo makkelijk als het lijkt

“Wat? Hoezo makkelijk?!”, denk je misschien.

Tja, toen ik met machine learning leek het me dan ook alles behalve makkelijk. Maar, op een bepaald punt had ik genoeg geleerd dat ik dacht dat het allemaal best simpel was en dat ik deze wedstrijd wel eens even zou gaan laten zien wie de baas was. Immers, alle informatie die ik verder nodig had om te winnen was te vinden, inclusief legio aan voorbeeld kernels van mede-Kagglers.

Viel toch tegen.

Zoals ik al zei was er meer dan genoeg informatie te vinden. Maar, dat was dan ook precies het probleem: teveel informatie is bijna net zo erg als geen informatie. Waar begin je? Wat negeer je? Wat is belangrijk? Wat is minder belangrijk?

Er is gewoon niet genoeg tijd om het allemaal te bestuderen. En tegelijkertijd is er ook een heleboel wat er komt kijken bij het maken van een winnend model, heb ik gemerkt. Om zoveel informatie te verwerken tijdens een wedstrijd en dan ook nog die informatie allemaal foutloos toe te passen, dat valt niet mee.

2. Het is ook niet zo moeilijk als het leek

Het is niet onmogelijk. Stapje voor stapje kan je er komen.

Het is waar: Er is een heleboel informatie. Het is niet allemaal even belangrijk, maar er is toch een heleboel te leren.

Desalniettemin IS het allemaal best te doen. Een universitaire opleiding bevat nog veel meer informatie, en toch zijn er mensen die hun diploma halen, met voldoende tijd en inzet. Zo ook is de informatie voor het maken van een winnend model uiteindelijk gewoon te overwinnen.

De individuele onderdelen van een winnend model zijn soms op het eerste gezicht ingewikkeld, maar uiteindelijk valt dit best mee, heb ik gemerkt. Je leert ze gewoon een voor een, en langzaam maar zeker begint het dan allemaal wel in elkaar te passen. Er is nog een hoop te doen, maar er is ook al een hele hoop gedaan.

Stukje bij beetje. Dat is hoe je vooruitgang maakt.

3. Een EDA lijkt misschien nutteloos maar is dat zeker niet

In mijn eerste 3 Kaggle projecten deed ik alles vrij snel. Gewoon een werkend model krijgen in zo min mogelijk tijd.

Soms deed ik daarbij ook wat Exploratory Data Analysis (EDA), maar ik had dan altijd het idee dat dit niet echt veel uithaalde. Uiteindelijk ik gewoon alles in het machine learning algoritmen en kwamen er gewoon goede resultaten uit.

De informatie die ik dan tijdens mijn EDA had verzameld was misschien wel interessant, ik deed er uiteindelijk niets mee in mijn model. Daarom bleef ik ook niet al te lang hangen in de EDA tijdens deze Kaggle wedstrijd.

Dat was een fout.

Het is niet de schuld van de EDA wanneer je er geen nuttige informatie uit haalt. Het is een gebrek aan ervaring met het stellen van de juiste vragen en het herkennen van nuttige informatie. Mijn EDA’s waren tot dan toe nutteloos omdat ik gewoon nog geen benul had van wat je allemaal kan leren van een goede EDA. Nu ben ik begonnen daar een idee van te krijgen. En wou ik dat ik in het begin de dingen had geweten die ik later met EDA en het lezen van de analyses van andere Kagglers had uitgevonden.

4. Leren vs resultaten vs gewerkte uren

Het maakt niet uit hoe lang je ergens mee bezig bent of hoe ingewikkeld het is. Althans, niet voor je Leaderboard score.

Je kan uren bezig zijn met het puzzelen met Principal Component Analysis, geheugen vermindering, herstructureren van je code en noem het maar. En deze dingen zijn zeker belangrijk. Maar, je score gaat er niet per se van omhoog. Zelfs Feature Engineering kan verspilde tijd zijn als je geen goede features weet te vinden.

Tegelijkertijd kunnen een paar minuten handmatig uitproberen van verschillende hyperparameters voor je model je 100 plekken omhoog brengen op het Leaderboard.

Mijn eerste score op het Leaderboard bracht mij al bijna in de top 50 procent waar ik uiteindelijk geëindigd was. En het enige wat ik gedaan had was een simpele kernel kopiëren die de data in gooide XGBoost zonder enige analyse of feature engineering. Vervolgens ben ik WEKEN bezig geweest met het proberen van allerlei technieken om mijn score te verbeteren, zonder enige verbetering van mijn score.

Waren deze weken verspilde tijd? Nee, dat zeker niet. Ik heb mijn score wellicht niet verbeterd, maar ik heb een hele hoop geleerd. Ook had ik een gevonden om het model sneller te laten uitrekenen. Deze zaken kwamen echter niet tot uiting op het Leaderboard.

Uiteindelijk behaalde ik mijn eerste verbetering in mijn score gewoon door domweg wat andere hyperparameters in te voeren in het bare bones model. Daarna pas begon het geleerde te klikken en verbeterde ik mijn score nog verder met Feature Engineering.

Ik had mijn score misschien nog sneller kunnen verbeteren als ik een beetje rond gekeken had voor kernels met betere scores en deze gewoon gekopieerd had.

Maar dan had ik natuurlijk niets geleerd.

5. Kaggle is een geweldige leerbron, maar…

Er valt ECHT een hele hoop te leren over machine learning op Kaggle, daar ben ik inmiddels wel achter. Maar deze kennis is niet allemaal direct toe te passen in de echte wereld.

Voor de beginnende Data Scientist die nog weinig ervaring met het trainen van modellen heeft en zijn PCA nog moet leren onderscheiden van zijn EDA is Kaggle geweldig. Zelfs voor de verder gevorderde Data Scientist is er nog een hoop te leren. Maar, er zijn grenzen aan wat je kan bereiken met het doen van Kaggle wedstrijden.

Want, een Kaggle probleem is niet een bedrijfsprobleem, en een Kaggle score is geen complete representatie van de kwaliteit van een machine learning oplossing.

Een model dat 20 verschillende algoritmes combineert om met behulp van honderden uren rekentijd de hoogst mogelijke accuraatheid te behalen is misschien geweldig voor Kaggle. Maar, niet zo geweldig voor een bedrijf dat voorspellingen wil maken over de vraag naar hun product voor morgen en inzicht wil krijgen in de belangrijkste factoren die deze vraag bepalen.

En hoe denk je dat die data die jouw Kaggle model gebruikt in de eerste instantie bij elkaar verzameld is? Denk je misschien dat die data zomaar uit de lucht is komen vallen? Of dat er uren aan research, brainstormen en verzamelwerk aan vooraf is gegaan?

Kortom, Kaggle is een geweldige leerbron, maar perfecte Kaggle skills maken nog geen perfecte Data Scientist.

Natuurlijk is dit lang niet het enige wat ik geleerd heb tijdens deze wedstrijd. Ik wou dat het mogelijk was om dit allemaal in een bericht van 5 minuten aan jullie te leren. Als dat namelijk het geval was dan had ik zelf zo’n bericht gelezen en had dit bericht 5 minuten Kaggle leeservaring in 5 minuten kunnen heten.

Helaas.

Wees niet getreurd. Er komen nog meer berichten. Maar, dat is alles voor nu.

Tot de volgende keer!

Relevante links

De 7 stappen van Machine Learning

Wat komt er allemaal kijken bij het maken en implementeren van een machine learning model?

Nou, het is meer dan alleen een databestandje laden en er een machine learning algoritme op los laten!

In dit artikel zal ik een kort overzicht schetsen van de stappen van het machine learning proces.

Bij elke stap zou een hele bibliotheek aan verdere uitleg geschreven kunnen worden, maar ik zal het zo kort mogelijk houden.

Stap 0: Voorbereiden

Voordat je kan beginnen moet je eerst weten wat het probleem is dat je met je machine learning model hoopt op te lossen!

Dit is de minst technische maar meest cruciale stap en vereist vooral inzicht in het probleem en communicatie met belanghebbenden.

Vervolgens is het de zaak om de benodigde data te identificeren en verzamelen. Dit gaat hand in hand met de definitie van het probleem, want zonder data heeft het weinig zin om na te denken over een machine learning oplossing.

Stap 1: Verkennen (Exploratory Analysis)

Je hebt het probleem gedefinieerd en de data verzameld. Tijd om te beginnen!

Maar, voordat je in het diepe springt is het de zaak om de data kort te verkennen en overzicht te krijgen. Hierbij gaat het vooral om het vinden van informatie die nuttig is voor de volgende stappen van het maken van het model.

Misschien dat je er zelfs achter komt dat je terug een stap terug moet doen en wat meer data moet verzamelen of het probleem moet herdefiniëren.

Stap 2: Schoonmaken (Data Cleaning)

Een machine learning model is nooit beter dan de informatie waar het op gebaseerd is.

Daarom is het van belang om te zorgen dat de data die erin gaat van goede kwaliteit is en geen fouten bevat. Missende observaties, ongewenste observaties, foute observaties. Geen van deze dingen helpen de prestatie van ons model.

Stap 3: Knutselen (Feature Engineering)

Nogmaals is het de zaak om te benadrukken dat een machine learning model nooit beter is dan de informatie waarop het gebaseerd is.

Niet alleen is het van belang data de data foutloos is. Het is ook van belang dat hij relevant is en op de juiste manier aan de algoritmes wordt gepresenteerd.

Denk bijvoorbeeld aan het toevoegen van een nieuwe variabele die het verschil geeft tussen twee jaartallen. Dit kan nuttiger zijn voor het algoritme dan de jaartallen zelf.

Dit is de stap die het meeste inzicht vereist in het probleem wat gemodelleerd wordt.

Stap 4: Selecteren (Algorithm Selection)

Oké, de data is klaar voor het model. Maar welk algoritme gebruiken we?

Dit is meestal vrij voor de hand liggend op basis van de machine learning taak (classificatie, regressie, clustering), maar er moet toch even over nagedacht worden. Het is belangrijk om een veelzijdig scala aan algoritmes te kiezen zodanig dat er goede resultaten te halen zijn met tenminste een aantal ervan.

Stap 5: Trainen (Model Training)

Eindelijk! De stap waar het allemaal om draait.

Het maken van het model.

Hierbij gaat het erom om de juiste hyper-parameters te vinden voor onze algoritmes, deze op de data los te laten, de resultaten op de juiste manier te evalueren en het winnende (meest nauwkeurige) model uit te kiezen.

Stap 6: Implementeren

We zijn echter nog niet klaar!

Nu het model af is moet het nog in gebruik genomen worden. Dit kan bijvoorbeeld betekenen dat het model moet worden opgenomen in een selfservice tool met een gebruiksvriendelijke interface. Ook zullen we het model misschien regelmatig moeten updaten door het nieuwe data te voeren.

En wie weet wat er allemaal nog meer gedaan moet worden om het model in gebruik te brengen en te houden?!

Pfoe!

Het is niet makkelijk om een machine learning model te implementeren.

Gelukkig hoef je deze stappen niet per se allemaal alleen te doen. Maar, het is wel van belang dat je je er van bewust bent wat er allemaal bij komt kijken zodat je jouw deel goed uit kunt voeren en effectief met je team kunt samenwerken.

Dat is alles voor nu,

Tot de volgende keer!

Bronnen

Machine Learning

Gegroet Dataridder,

In een eerder bericht had ik je al uitgelegd wat Datamining is. Dit keer ga ik het hebben over Machine Learning.

Misschien dat je je nu afvraagt wat het verschil is. Zelf was ik namelijk ook even in de war. Datamining en Machine Learning gaan toch immers allebei om het vinden van patronen in data? Om het omzetten van ruwe data naar nuttige informatie?

En dat is ook zo, maar bij Machine Learning gaat het erom om COMPUTERS te leren om nuttige informatie uit data te halen. Datamining zelf is een algemenere term, en hierbij kan het dus bijvoorbeeld ook gaan om het maken van grafieken en het interpreteren daarvan.

Maar, bij Machine Learning programmeer je de computer om zelf data om te zetten in nuttige informatie. Hierbij wordt dan gebruik gemaakt van de zogenaamde machine learning algoritmes (zoals bijvoorbeeld het random forest algoritme). Met behulp van deze algoritmes kan de computer leren van data, en op basis van het geleerde beslissingen en voorspellingen leren te maken.

Dit is een krachtig concept. Het stelt ons in staat om beslissingen en voorspellingen te automatiseren. Dat konden wij al eerder natuurlijk, dankzij computers over het algemeen, maar die moesten wij daarvoor expliciet programmeren. Maar met machine learning hoeft dat dus niet meer. De computer leert zelf om data gedreven beslissingen te maken.

Het is de techniek die centraal staat in de vierde industriële revolutie. Dankzij de eerste drie leven we nu in een tijd waarin we van de luxe kunnen genieten van geautomatiseerde spierkracht. Ook hebben we toegang tot een hele hoop informatie dankzij het internet. Maar nu gaan we dus een stap verder met geautomatiseerde denkkracht. Het is misschien wel het begin van de laatste uitvinding die we ooit hoeven te maken.

Hoe dan ook, de computer leert bij machine learning in principe om zelf een model te vormen. Een representatie/simplificatie van de werkelijkheid die gebruikt kan worden voor het maken van beslissingen en voorspellingen.

Er zijn nu al een heleboel nuttige toepassingen van machine learning. In onder andere dit artikel had ik er al een aantal genoemd. Maar, om er nog een paar te herhalen, denk bijvoorbeeld aan gepersonaliseerde reclames, spraakherkenning en zelfrijdende auto’s. Dit is echter slechts het begin, wie weet wat er nog meer mogelijk is?

Machine learning algoritmes kunnen vrij moeilijk zijn om te begrijpen. Mijn missie om mijn random forest algoritme te programmeren bleek een heel karwei, en dat was misschien nog een van de simpelere algoritmes. En bij de werking van neurale netwerken komt ook heel wat wiskunde kijken. Maar, natuurlijk is het erg belangrijk om deze algoritmes te begrijpen. Als je er een proefwerk over krijgt.

Grapje.

Deze algoritmes komen natuurlijk niet uit de lucht vallen en iemand moet ze bedenken en verbeteren. Leren hoe ze werken is dus zeker nuttig. Maar, wil je leren om zelf machine learning toe te passen dan is het vooral belangrijk dat je leert hoe je ze moet gebruiken. Moet je weten hoe een computer werkt om een blog artikel te lezen?

Natuurlijk niet.

Je moet alleen weten wat alle knoppen doen. En zo is het ook met machine learning. Je moet leren werken met de tools. Leer gewoon programmeren met de machine learning libraries en je kunt aan de slag. Je hoeft ze niet helemaal van binnen en buiten te kennen om ze te gebruiken, en waarschijnlijk heb je daar ook de tijd niet voor want er zijn er een hele boel en er komt een hele boel wiskunde bij kijken.

Maar, het mag wel.

Persoonlijk vindt ik het heel leuk om te weten hoe dingen werken en ze zelf na te maken. Daarom heb ik ook mijn eigen versies gemaakt van een random forest en neuraal netwerk. En als jij dat ook leuk vindt, laat je dan zeker niet tegen houden om hetzelfde te doen. Op deze manier leer je jezelf tegelijkertijd programmeren aan en leer je wat over de werking van machine learning algoritmes. Een veel leukere manier van leren dan neuzen door een stapel stoffige tekstboeken, als je het mij vraagt.

Wil je echter leren machine learning modellen en applicaties te maken dan zul je toch echt aan de slag moeten gaan met de bestaande tools. Zelf ben ik inmiddels weer ver gevorderd met de Machine Learning Accelerator van EliteDataScience. Een prima keuze om machine learning met Python te leren, ben ik nog steeds van mening. Er zijn echter meer dan genoeg cursussen beschikbaar dus kijk ook zeker verder.

Maar ja, dat is alles voor nu.

Tot de volgende keer!

Categorie archief: Informatie

De magische papegaai

De wijze vogel

De hongerige magiër

De hoopvolle ridder

Het ondeugende kind

Wat heeft dit nou met AI te maken?

Model van de werkelijkheid

Model van taal

Maar begrijpt AI ons nou of niet?

Stap 1: Een onbeleefd model

Stap 2: Feedback verzamelen

Stap 3: Een beloningsmodel bouwen

Stap 4: Zelfverbetering

Redeneermodellen

Beperkingen

Tot slot

🔹Wat is een agent eigenlijk?

🔹Drie niveaus van AI-systemen

Niveau 1: LLM (reactief systeem)

Niveau 2: AI-Workflow (compound systeem)

Niveau 3: AI Agent (agentisch systeem)

🔹Hoe werkt dat dan?

🔹Voor- en nadelen

🔹De toekomst

🔹Conclusie

Stel je een simpele schildknaap voor

Wat is context rot nou precies?

Waarom gaat het fout?

De kunst van context engineering

Waar liggen de grenzen?

Waarom is dit nuttig om te weten?

Conclusie?

Wat doet een LLM eigenlijk?

Hoe leert zo’n model?

Transformatoren: de kracht van context.

Invuloefening

Het geheim achter de intelligentie

Menselijke bijsturing: RLHF

Beperkingen

Slimmer redeneren met Chain-of-Thought

Waar kom je ze tegen?

Meer weten?

Tot slot

Inleiding

AI en de verspreiding van desinformatie

AI en polarisatie

Maatregelen tegen AI problemen in Nederland

1. Technologische oplossingen

2. Beleidsmaatregelen

3. Educatie en bewustwording

Conclusie

Bronnen

Wat en waarom?

Hoe werkt het?

Complicaties

Bronnen

1. Het is niet zo makkelijk als het lijkt

2. Het is ook niet zo moeilijk als het leek

3. Een EDA lijkt misschien nutteloos maar is dat zeker niet

4. Leren vs resultaten vs gewerkte uren

5. Kaggle is een geweldige leerbron, maar…

Relevante links

Stap 0: Voorbereiden

Stap 1: Verkennen (Exploratory Analysis)

Stap 2: Schoonmaken (Data Cleaning)

Stap 3: Knutselen (Feature Engineering)

Stap 4: Selecteren (Algorithm Selection)

Stap 5: Trainen (Model Training)

Stap 6: Implementeren

Bronnen