EM 2016, um programa de inteligência artificial chamado AlphaGo, do laboratório de IA do Google DeepMind, fez história ao derrotar um jogador campeão do jogo de tabuleiro Go. Agora, Demis Hassabis, cofundador e CEO do DeepMind, diz que seus engenheiros estão usando técnicas do AlphaGo para criar um sistema de IA chamado Gemini, que será mais capaz do que o ChatGPT, desenvolvido pela OpenAI.
O Gemini, ainda em desenvolvimento, é um modelo de linguagem avançado que trabalha com texto e é semelhante ao GPT-4, que alimenta o ChatGPT. Porém, em entrevista para o Wired, Hassabis afirma que sua equipe vai combinar essa tecnologia com as técnicas usadas no AlphaGo, visando dar ao sistema novas habilidades, como planejamento ou a capacidade de resolver problemas.
“Em termos gerais, você pode pensar no Gemini como a combinação de algumas das vantagens dos sistemas do tipo AlphaGo com as incríveis capacidades linguísticas dos modelos avançados“, diz Hassabis. “Também temos algumas inovações novas que serão bastante interessantes.” O Gemini foi apresentado em uma conferência de desenvolvedores do Google no mês passado, quando a empresa anunciou uma série de novos projetos de IA.
O AlphaGo foi baseado em uma técnica pioneira do DeepMind chamada aprendizado por reforço, na qual o software aprende a lidar com problemas difíceis que requerem a escolha de ações, como no jogo Go ou em videogames, através de tentativas repetidas e feedback sobre seu desempenho. Ele também utilizou um método chamado busca em árvore para explorar e memorizar possíveis movimentos no tabuleiro. O próximo grande salto para os modelos de linguagem pode envolver o desempenho de mais tarefas na internet e em computadores.
Hassabis afirma que o Gemini ainda está em desenvolvimento e que o processo levará vários meses. O custo pode chegar a dezenas ou centenas de milhões de dólares. Sam Altman, CEO da OpenAI, afirmou em abril que a criação do GPT-4 custou mais de 100 milhões de dólares.
Correndo atrás
Quando o Gemini estiver completo, ele poderá desempenhar um papel importante na resposta do Google à ameaça competitiva representada pelo ChatGPT e por outras tecnologias de IA generativa. A empresa de buscas pioneirou muitas técnicas que possibilitaram a recente onda de novas ideias de IA, mas optou por desenvolver e implementar produtos com cautela.
Desde a estreia do ChatGPT, o Google lançou às pressas seu próprio chatbot, o Bard, e incorporou a IA generativa em seu mecanismo de busca e em muitos outros produtos. Para impulsionar a pesquisa em IA, em abril, a empresa uniu a unidade de Hassabis, o DeepMind, ao laboratório de IA principal do Google, o Brain, criando o Google DeepMind. Hassabis diz que a nova equipe reunirá dois gigantes que foram fundamentais para o progresso recente em IA. “Se olharmos para onde estamos na área de IA, eu argumentaria que 80 ou 90% das inovações vêm de uma ou outra organização”, diz Hassabis. “Ambas as organizações fizeram coisas brilhantes nos últimos dez anos.”
Hassabis tem experiência em lidar com corridas do ouro em IA que agitam as gigantes de tecnologia – embora da última vez ele próprio tenha iniciado a frenesi.
Em 2014, o DeepMind foi adquirido pelo Google após demonstrar resultados impressionantes com um software que usava aprendizado por reforço para dominar jogos de vídeo simples. Nos anos seguintes, o DeepMind mostrou como a técnica pode realizar coisas que antes pareciam exclusivas dos seres humanos – muitas vezes com habilidades super-humanas. Quando o AlphaGo venceu o campeão de Go Lee Sedol em 2016, muitos especialistas em IA ficaram surpresos, pois acreditavam que levaria décadas para as máquinas se tornarem proficientes em um jogo tão complexo.
Novas ideias
O treinamento de um modelo de linguagem avançado como o GPT-4 da OpenAI envolve alimentar grandes quantidades de texto selecionado de livros, páginas da web e outras fontes em um software de aprendizado de máquina conhecido como transformer. Ele usa os padrões nesses dados de treinamento para se tornar proficiente em prever as letras e palavras que devem seguir um trecho de texto, um mecanismo simples que se mostra surpreendentemente poderoso para responder perguntas e gerar texto ou código.
Um passo importante adicional para tornar o ChatGPT e modelos de linguagem igualmente capazes é usar o aprendizado por reforço com base no feedback dos humanos sobre as respostas de um modelo de IA para aprimorar seu desempenho. A vasta experiência do DeepMind com aprendizado por reforço pode permitir que seus pesquisadores forneçam ao Gemini capacidades inovadoras.
Hassabis e sua equipe também podem tentar aprimorar a tecnologia de modelos de linguagem avançados com ideias de outras áreas de IA. Os pesquisadores do DeepMind trabalham em áreas que vão desde robótica até neurociência, e nesta semana a empresa demonstrou um algoritmo capaz de aprender a realizar tarefas de manipulação com uma ampla variedade de braços robóticos diferentes.
Aprender a partir da experiência física do mundo, como os humanos e animais fazem, é amplamente esperado para ser importante para tornar a IA mais capaz. O fato de os modelos de linguagem aprenderem sobre o mundo indiretamente, por meio de texto, é visto por alguns especialistas em IA como uma grande limitação.
Futuro incerto
Hassabis tem a tarefa de acelerar os esforços de IA do Google, ao mesmo tempo em que gerencia riscos desconhecidos e potencialmente graves. Os recentes avanços rápidos em modelos de linguagem têm preocupado muitos especialistas em IA, incluindo alguns que desenvolvem os algoritmos, sobre se a tecnologia será utilizada para fins malévolos ou se tornará difícil de controlar. Alguns insiders da área de tecnologia até pediram uma pausa no desenvolvimento de algoritmos mais poderosos para evitar a criação de algo perigoso.
Hassabis afirma que os benefícios extraordinários potenciais da IA, como a descoberta científica em áreas como saúde ou clima, tornam imperativo que a humanidade não pare de desenvolver a tecnologia. Ele também acredita que impor uma pausa é impraticável, pois seria quase impossível de ser aplicada. “Se for feito corretamente, será a tecnologia mais benéfica para a humanidade de todos os tempos“, diz ele sobre a IA. “Precisamos ir atrás dessas coisas com coragem e determinação.”
Isso não significa que Hassabis defenda que o desenvolvimento da IA continue em um ritmo desenfreado. O DeepMind tem explorado os riscos potenciais da IA desde antes do lançamento do ChatGPT, e Shane Legg, um dos cofundadores da empresa, lidera um grupo de “segurança em IA” dentro da empresa há anos. No mês passado, Hassabis se juntou a outros nomes de destaque em IA ao assinar uma declaração alertando que a IA poderia representar um risco comparável à guerra nuclear ou a uma pandemia.
Um dos maiores desafios no momento, segundo Hassabis, é determinar quais são os riscos prováveis de uma IA mais capaz. “Acredito que o campo precisa fazer mais pesquisas, de forma muito urgente, em áreas como testes de avaliação“, diz ele, para determinar o quão capazes e controláveis são os novos modelos de IA. Nesse sentido, ele diz que o DeepMind pode tornar seus sistemas mais acessíveis a cientistas externos. “Gostaria de ver a academia tendo acesso antecipado a esses modelos pioneiros“, diz ele – uma declaração que, se cumprida, poderia ajudar a abordar as preocupações de que os especialistas fora das grandes empresas estejam sendo excluídos das pesquisas mais recentes em IA.
O quão preocupado você deve estar? Hassabis diz que ninguém realmente sabe ao certo se a IA se tornará uma grande ameaça. Mas ele tem certeza de que, se o progresso continuar no ritmo atual, não haverá muito tempo para desenvolver salvaguardas. “Eu posso ver as coisas que estamos construindo na série Gemini, e não temos motivos para acreditar que elas não funcionarão“, diz ele.