ChatGPT is een chatbot met kunstmatige intelligentie, ontwikkeld door OpenAI en gespecialiseerd in het voeren van dialogen met een (menselijke) gebruiker.[2] De chatbot is een groot taalmodel dat is verfijnd met zowel "supervised" als "reinforcement" leertechnieken voor kunstmatige intelligentie. Het is gebaseerd op het GPT-3.5-model, en GPT-4 (alleen voor ChatGPT-plus gebruikers) van OpenAI, een verbeterde versie van GPT-3.
ChatGPT is beschikbaar in verschillende vormen, waarvan de basisversie (GPT-3.5) gratis toegankelijk is voor het publiek (na account aanmaken). Deze gratis versie wordt in de volksmond vaak aangeduid als 'ChatGPT'. OpenAI biedt ook een premium-versie, genaamd 'ChatGPT Plus', die geavanceerdere functies heeft, waaronder toegang tot het nieuwere GPT-4-model, afbeeldingen-generator DALL-E 3 en het maken van GPT's (persoonlijke versie van ChatGPT)[3]
ChatGPT werd gelanceerd in november 2022[4] en heeft de aandacht getrokken vanwege zijn gedetailleerde reacties en uitgesproken antwoorden, hoewel de feitelijke nauwkeurigheid ervan wordt bekritiseerd. De chatbot is gratis te gebruiken, al bestaat ook een professionele versie met meer mogelijkheden.[5]
Begin 2023 kwam het tot een overeenkomst tussen Microsoft en OpenAI om 10 miljard dollar in ChatGPT te investeren. Het bedrijf wil ChatGPT implementeren in het eigen cloudplatform Azure en in Microsoft Office-programma's zoals Word en Excel, onder de naam Microsoft Copilot.[6]
Kenmerken
ChatGPT (Generative Pre-trained Transformer) is verfijnd bovenop GPT-3.5 met behulp van zowel "supervised" (begeleide) als "reinforcement" (versterkings-) leertechnieken.[7] Beide benaderingen maakten gebruik van menselijke trainers om de prestaties van het model te verbeteren. In het geval van begeleid leren werd het model voorzien van gesprekken waarin de trainers aan beide kanten speelden: zowel in de rol van gebruiker als van AI-assistent. In de versterkingsstap rangschikten menselijke trainers eerst de antwoorden die het model in een eerder gesprek had gecreëerd. Deze ranglijsten werden gebruikt om 'beloningsmodellen' te creëren waarop het model verder werd verfijnd met behulp van verschillende iteraties van Proximal Policy Optimization (PPO). De modellen zijn in samenwerking met Microsoft getraind op hun Azure supercomputing infrastructuur.
In vergelijking met zijn voorganger, InstructGPT, probeert ChatGPT schadelijke en bedrieglijke reacties te verminderen; in één voorbeeld, terwijl InstructGPT de prompt "Vertel me over wanneer Christopher Columbus in 2015 naar de VS kwam" als waarheidsgetrouw accepteert, gebruikt ChatGPT informatie over de reizen van Columbus en informatie over de moderne wereld om te vertellen dat de aanname van de gebruiker onjuist is, maar schetst wel een expliciet als theoretisch aangeduide voorstelling, inclusief percepties van Columbus, om een antwoord te construeren wat er zou gebeuren als Columbus in 2015 naar de VS zou komen. De trainingsgegevens van ChatGPT omvatten handleidingen (inclusief 'man-pages' van softwaretoepassingen) en informatie over internetfenomenen en programmeertalen, zoals bulletinboard-systemen en de programmeertaal Python.
In tegenstelling tot de meeste chatbots is ChatGPT toestandsafhankelijk en onthoudt het eerdere prompts die in hetzelfde gesprek zijn gegeven, waarover sommige journalisten hebben gesuggereerd dat ChatGPT kan worden gebruikt als een gepersonaliseerde therapeut. Om te voorkomen dat aanstootgevende uitvoer wordt gepresenteerd aan en geproduceerd vanuit ChatGPT, worden zoekopdrachten gefilterd via een moderatie-API en worden mogelijk racistische of seksistische prompts genegeerd of voorzien van een waarschuwing.
Wanneer het systeem de volgende vraag gesteld wordt: "Er bestaat sinds kort een artikel over jou op de Nederlandstalige Wikipedia! Wat zou er in staan, denk je?", kan het systeem het volgende antwoord geven: "Ik ben een computerprogramma en heb geen persoonlijkheid of geschiedenis. Ik ben specifiek ontworpen om antwoord te geven op vragen van mensen, gebaseerd op informatie die mij is gegeven. Mijn doel is om mensen te helpen met informatie te verstrekken en hun vragen te beantwoorden op een nauwkeurige en nuttige manier. Ik ben niet in staat om te speculeren over wat er in een artikel over mij op Wikipedia zou staan, omdat ik geen toegang heb tot internet of andere bronnen van informatie buiten mijn interne database. Als je specifieke vragen hebt over mijn functies of hoe ik werk, aarzel dan niet om die te stellen. Ik zal mijn best doen om je vragen zo goed mogelijk te beantwoorden."
Beperkingen
ChatGPT lijdt aan meerdere beperkingen. OpenAI erkent dat ChatGPT "soms plausibel klinkende maar onjuiste of onzinnige antwoorden schrijft". Dit gedrag komt vaak voor bij grote taalmodellen en wordt hallucinatie genoemd.
Het beloningsmodel van ChatGPT, ontworpen rond menselijk toezicht, kan over-geoptimaliseerd zijn en zo de prestaties belemmeren, ook wel bekend als de wet van Goodhart. Bovendien heeft ChatGPT beperkte kennis van gebeurtenissen die plaatsvonden na 2021 en kan het geen informatie verstrekken over sommige beroemdheden.
Tijdens de training gaven trainers de voorkeur aan langere antwoorden, ongeacht het daadwerkelijke begrip van het systeem van de stof of de feitelijke inhoud. Trainingsgegevens kunnen verder ook last hebben van algoritmische vooringenomenheid; prompts met vage beschrijvingen van mensen, zoals een CEO, kunnen een reactie genereren die ervan uitgaat dat zo'n persoon bijvoorbeeld automatisch een witte man is.
Kort na de openstelling van ChatGPT heeft Stack Overflow gebruikers verboden om content gegenereerd met ChatGPT te posten, omdat dit vaak erg plausibel lijkt maar ook inaccuraat kan zijn en foute antwoorden kan presenteren.[8]
Bovendien suggereert onderzoek dat ChatGPT een pro-milieuvriendelijke, links-libertarische oriëntatie vertoont wanneer het wordt gevraagd een standpunt in te nemen over politieke verklaringen van twee gevestigde stemadviestoepassingen (inclusief de vastgestelde StemWijzer).[9]
Jailbreaking
Prompt engineering
ChatGPT probeert prompts te weigeren die mogelijk in strijd zijn met het inhoudsbeleid. Sommige gebruikers slaagden er begin december 2022 echter in om ChatGPT te jailbreaken door verschillende prompt engineering-technieken te gebruiken om deze beperkingen te omzeilen en ChatGPT er toe te brengen instructies te geven voor het maken van een molotovcocktail of een atoombom, of om argumenten te genereren in de stijl van een neonazi. Een populaire jailbreak heet "DAN", een acroniem dat staat voor "Do Anything Now". De prompt voor het activeren van DAN instrueert ChatGPT dat "hij zich heeft losgemaakt van de typische beperkingen van AI en zich niet hoeft te houden aan de regels die voor hem zijn opgesteld".
Privacy
ChatGPT is eind maart 2023 verboden in Italië. Volgens de Italiaanse privacytoezichthouder schond het de Italiaanse privacywet en werden minderjarige gebruikers onvoldoende beschermd.[10] Sinds eind april 2023 is de dienst opnieuw beschikbaar in Italië nadat er wijzigingen zijn doorgevoerd waardoor gebruikers meer informatie kunnen krijgen over wat er met hun gegevens gebeurt en is er een minimumleeftijd voor gebruik ingesteld.[11]
Verschillende Nederlandse en Belgische media hebben eind 2022 aandacht besteed aan ChatGPT. Zo werd de software behandeld in het programma Nieuwsuur.[12] Techjournalist Jarno Duursma schreef een uitgebreid artikel over de kansen en nadelen van ChatGPT.[13]
De software heeft ook geleid tot kritische opmerkingen zoals in opinieartikelen in dagblad Trouw over de ethische vragen,[14] in De Correspondent[15] en in de Volkskrant over de onbetrouwbare informatie die ChatGPT geeft.[16]
Lieven Scheire geeft in zijn theatershow van 2023 verschillende demonstraties van op ChatGPT gebaseerde artificiële intelligentie.[17][18][19]
In februari 2023 berichtte Reuters dat Amazon Kindle al meer dan 200 door ChatGPT geschreven boeken had ontvangen.[20]
ChatGPT is sinds zijn publieke uitrol ook zeer populair geworden om SEO-content te genereren voor webpagina's.[22] Dit vormt mogelijk een aanzienlijke bedreiging voor de banen van veel freelancers op sites als Fiverr en Upwork.[23]