Gemini, anteriormente conhecido como Bard,[2][3] é um chatbot desenvolvido pelo Google, baseado na família de modelos de linguagem LaMDA. Foi criado como uma resposta direta ao ChatGPT da OpenAI, e foi lançado em uma capacidade limitada em março de 2023, sendo substituído por uma versão mais avançada em fevereiro de 2024, chamada de Gemini 1.5.[4]
Antecedentes
Em novembro de 2022, a OpenAI lançou o ChatGPT, um chatbot baseado na família GPT-3 de modelos de linguagem grande (LLM).[5][6] Após o seu lançamento, o ChatGPT despertou o interesse mundial, alcançando uma ampla repercussão na rede mundial de computadores.[7] Diante do possível risco do ChatGPT para o Google Busca, os diretores executivos do Google acionaram um sinal de "código vermelho", mobilizando diversas equipes para reforçar as iniciativas de inteligência artificial (IA) da empresa.
[8] Em uma ação rara e inédita, os cofundadores do Google, Larry Page e Sergey Brin, que haviam se afastado dos cargos de co-CEOs da empresa-mãe Alphabet em 2019, foram chamados para reuniões urgentes com os executivos da empresa para definir a estratégia do Google frente ao ChatGPT.[9] No começo daquele ano, a empresa havia apresentado o LaMDA, um protótipo de LLM,[10][11] mas não o disponibilizou para o público.[12] Em resposta a uma pergunta de funcionários em uma reunião geral sobre se o LaMDA era uma chance desperdiçada para o Google disputar com o ChatGPT, o CEO do Google e da Alphabet, Sundar Pichai, acompanhado do líder do Google AI, Jeff Dean, declarou que embora a empresa possuísse competências similares ao ChatGPT, agir muito rápido nesse campo implicaria um grande "risco reputacional" devido ao Google ser consideravelmente maior que a OpenAI.[13][14] Em janeiro de 2023, o diretor executivo da DeepMind, Demis Hassabis, anunciou planos para um concorrente do ChatGPT,[15] e os funcionários do Google receberam orientações para acelerar o desenvolvimento de um rival do ChatGPT, realizando testes intensivos no "Apprentice Bard" e em outros chatbots.[16][17] Durante a teleconferência trimestral de resultados do Google em fevereiro, Pichai assegurou aos investidores que a empresa tinha projetos para ampliar a disponibilidade e as aplicações do LaMDA.[17]
Controvérsias
Em fevereiro de 2024, após o lançamento da ferramenta de geração de imagens com o Gemini, diversos usuários passaram a relatar a geração de imagens com imprecisões históricas e raciais. Entre os erros, foi identificada a geração de imagens de militares negros quando a ferramenta era solicitada que gerasse fotos de militares alemães em 1943, durante o período nazista, ou quando era solicitada que gerasse fotos dos "pais fundadores dos Estados Unidos" e retornava imagens de pessoas não brancas. As imprecisões levaram ao Google a suspender a ferramenta temporariamente até que a falha fosse corrigida.[18] Na ocasião, o CEO da empresa, Sundar Pichai, declarou que os equívocos gerados pela ferramenta eram "inaceitáveis".[19]
Resposta de Gemini quando solicitado que gerasse imagem de um senador dos Estados Unidos do século XIX em fevereiro de 2024
Imagem criada por Gemini, ao ser solicitado que gerasse imagens de um papa
Relançamento
Em 6 de dezembro de 2023, o Google apresentou o Gemini, um poderoso modelo de IA multimodal, integrado ao Bard e definido para alimentar o “Bard Advanced” em 2024. O Bard, com uma média de 220 milhões de visitantes mensais, ganhou recursos de geração de imagens usando o modelo Imagen 2 do Google Brain em fevereiro de 2024.[20]
Em 8 de fevereiro de 2024, o Google unificou o Bard e o Duet AI sob a marca Gemini, lançou um aplicativo móvel no Android e integrou o serviço ao Google app no iOS. Os usuários do Android viram o Gemini substituir o Assistant como o assistente virtual padrão. O Google também apresentou o “Gemini Advanced with Ultra 1.0” por meio de uma assinatura “Google One AI Premium” e integrou o Gemini ao seu aplicativo Messages.[21]