ChatGPT, psychobiologie en psychogeschiedenis

ChatGPT, gelanceerd in november 2023, heeft kunstmatige intelligentie in het brandpunt van de publieke aandacht gebracht. Hoe problematisch het product van OpenAI ook is en hoe hard we ook moeten werken om deze technologie op een verantwoorde manier bruikbaar te maken, als ontwikkelaar van dit soort data-gedreven taalmodellen zie ik mijn eigen wetenschappelijke fantasieën wel een stuk reëler worden. Gaat AI de mensheid naar een hoger plan helpen? Ik denk dat dat kan lukken als AI dicht bij de psyche van de mens blijft – als het een hulpbrein wordt voor het echte brein.

ChatGPT blijft daadwerkelijk dicht bij de mensen waarop het getraind is; het heeft teksten van tientallen miljoenen schrijvers in het neurale geheugen opgeslagen. ChatGPT emuleert daarmee ideeën uit het midden van de vorige eeuw over menselijk gedrag en menselijke taal: de psychobiologische principes van de Amerikaanse statisticus George Zipf zijn er in te herkennen, en ook het concept psychogeschiedenis van de Amerikaanse sciencefictionschrijver en biochemicus Isaac Asimov.

Het midden van de 20e eeuw was een scharnierpunt in de geschiedenis van de mensheid. Geblakerd door een uiterst verwoestende oorlog startte vanuit het militair-wetenschappelijke complex de race naar de ruimte en zag de computer het licht. Aanvankelijk was het de sciencefiction van de jaren ’50 en ’60 die deze ontwikkelingen destilleerden tot fantastische extrapolaties, die ons collectieve bewustzijn mee hebben gevormd. In de in dit verband essentiële film 2001: A space odyssey van Stanley Kubrick combineert gevaarlijke fantasieën over kunstmatige intelligentie met de claustrofobie van de ruimte.

In het fictieve Foundation-universum van Isaac Asimov, een van de grootste sciencefictionschrijvers uit die tijd, voert hij psychohistory op als een door de overheid gebruikte technologie die een mix is van toegepaste geschiedenis, sociologie en statistiek die draait op een soort computer, en die voorspellingen doet over het doen en laten van een immense populatie op galactische schaal. Toen het Cambridge Analytica-schandaal in 2018 losbarstte, werd al snel de relatie gelegd tussen Asimovs psychohistory en Cambridge Analytica’s psychographics, waarmee ze gericht inhoud konden koppelen aan gebruikers van Facebook. Als ook maar een klein percentage van de bereikte individuen zijn of haar gedrag liet beïnvloeden door deze boodschappen, dan kon dat in absolute getallen een verschil maken. Cambridge Analytica verleende zijn diensten in de Brexit-campagne en de verkiezingscampagne van Donald Trump in 2016.

Het prefix psycho- duidt op een relatie met de menselijke psyche; dat kan een gevaarlijke zijn zoals bij Cambridge Analytica, maar kan ook een leidend principe zijn om de mens en de evolutie van de menssoort beter te begrijpen. Nog voor de Tweede Wereldoorlog formuleerde de Amerikaanse statisticus George K. Zipf een aantal gedragsprincipes die hij onder de noemer psycho-biology schaarde. Op basis van het Principle of least effort, dat stelt dat de handelende mens neigt naar het kiezen van het pad van de minste inspanning, onderzocht hij bestaande grote systemen als demografische dynamiek, en ook het taalsysteem. Hij zag in taal een sterk economisch gevormd handelssysteem, waarin korte, hoogfrequente functiewoorden de boodschap een voorspelbare vorm geven, en waarin langere, lager frequente inhoudswoorden de drager van de communicatieve boodschap zijn.

Zipfs inzichten verklaren een groot deel van het succes van de huidige grote taalmodellen zoals ChatGPT. In het hart van dit model zit een foundation model, op dit moment GPT 4.0, dat heel goed is in het voorspellen van het volgende woord gegeven een context van voorafgaande woorden. In 2008 illustreerde ik in mijn eerste publieke lezing als hoogleraar, getiteld Het volgende woord, dat een taalmodel dat het volgende woord voorspelt alsmaar beter wordt naarmate het getraind wordt op meer data, en dat die relatie log-lineair is als Zipfs ideeën worden doorgerekend: met iedere verdubbeling van het trainingsmateriaal wordt het systeem bij benadering een constant percentage beter in het daadwerkelijk goed raden van het volgende woord. Van OpenAI’s GPT 3.5 weten we dat die is getraind op circa 500 miljard woorden. Daarmee beschikt ChatGPT over de beste woordvoorspeller die ooit werd gebouwd.

Met een positieve bril kun je ook zeggen dat ChatGPT Asimovs psychogeschiedenis implementeert op planetair niveau. Het systeem kan bevraagd worden om analyses en toekomstvoorspellingen te doen op basis van alle menselijke kennis die ooit aan het internet is toevertrouwd. Een realistische blik leert ons echter dat we nog lang niet een representatieve verzameling hebben van alle kennis wereldwijd. ChatGPT blijft een gevaarlijk cirkeltje draaien in kennis die hoofdzakelijk Engels, westers, mannelijk, en digitaal geïnformeerd is. Als het ook nog dreigt getraind te gaan worden op de door ChatGPT zelf gegenereerde teksten die langzaam het internet beginnen te vullen, dan wordt het een nieuwe Ouroboros; de slang die zijn eigen staart opeet.

Het zijn spannende tijden. Veel van het technologisch positivisme van de jaren ’50 en ’60 is werkelijkheid geworden, waar we daadwerkelijk iets aan hebben gehad. Trekt die opwaartse  lijn net zo onverbiddelijk door als Zipfs wet? Het antwoord is niet meer op technologische gronden te geven. We zullen ons moeten wenden tot Zipfs huidige opvolgers: filosofen, ethici, taalkundigen, sociaal demografen en gedragswetenschappers om nog een beetje grip te houden op wat ons als mensheid aan het overkomen is.