ChatGPT je predstavljen kao prototip 30. novembra 2022. i brzo je dostigao popularnost zbog svojih detaljnih i artikulisanih odgovora u raznim domenama znanja. Njegova neujednačena činjenična preciznost je ipak označena kao značajna mana.[3] Nakon predstavljanja ChatGPT-a, OpenAI je dostigao vrijednost od 29 milijardi američkih dolara.[4]
Jedna od glavnih karakteristika je davanje prirodnih odgovora na postavljenja pitanje i generiranje programskog koda, članaka, pjesama, priča ili otklanjanje grešaka u kodu.[5]
Izvorna verzija ChatGPT-a bazirana je na verziji GPT-3.5. Verzija bazirana na GPT-4, najnovijem OpenAI modelu, objavljena je 14. marta 2023. i dostupna je za plaćene pretplatnike.
Treniranje
ChatGPT je član porodice jezičnih modela generativno predtreniranih transformatora (engleski: Generative pre-trained transformer - GPT). Prilagođen je nad poboljšanom verzijom OpenAI GPT-3, poznatom kao GPT 3.5, putem procesa finog podešavanja.[6]
Proces finog podešavanja koristio je i nadzirano učenje i podržano učenje u procesu nazvanom podržano učenje uz ljudske povratne informacije (engleski: reinforcement learning from human feedback - RLHF).[7][8] Oba pristupa koriste ljudske trenere kako bi poboljšali performanse modela. U slučaju nadziranog učenja, modelu su dostavljeni razgovori u kojima su treneri imali ulogu korisnika i asistenta. U podržanom učenju, ljudski treneri su prvo rangirali odgovore koje je model stvorio u prethodnom razgovoru.[9] Ti su rangovi korišteni za stvaranje "modela nagrade" kojim se model dodatno fino podešavao korištenjem nekoliko iteracija PPO-a (engleski: Proximal Policy Optimization).[10][11]
ChatGPT je u početku koristio superkompjutersku infrastrukturu Microsoft Azure, pokretanu pomoću NVIDIAgrafičkih procesora, koju je Microsoft izgradio posebno za OpenAI, a koja je navodno koštala "stotine miliona dolara". Nakon uspjeha ChatGPT-a, Microsoft je 2023. značajno nadogradio OpenAI infrastrukturu.[12]
OpenAI prikuplja podatke od korisnika ChatGPT-a kako bi dalje trenirao i prilagođavao uslugu. Korisnici mogu glasati za ili protiv odgovora koje dobiju od ChatGPT-a i popuniti tekstualno polje s dodatnim povratnim informacijama.[13]
^Roose, Kevin (5. 12. 2022). "The Brilliance and Weirdness of ChatGPT"(HTML). New York Times (jezik: engleski). Pristupljeno 26. 12. 2022. Like those tools, ChatGPT — which stands for “generative pre-trained transformer” — landed with a splash.