SIMA 2: agente da DeepMind domina mundos 3D em jogos
SIMA 2, novo agente de inteligência artificial do Google DeepMind, foi apresentado como evolução direta do protótipo mostrado em 2024 e já demonstra habilidade para navegar, conversar e resolver problemas em diferentes ambientes virtuais 3D.
Construído sobre o Gemini, com foco em tarefas complexas
A equipe do Google integrou o SIMA 2 ao Gemini, modelo de IA multimodal da companhia. A combinação permite que o agente interprete texto, voz e até desenhos feitos na tela do jogo para seguir instruções detalhadas. Segundo a MIT Technology Review, o objetivo final é criar sistemas capazes de executar ações complexas que extrapolem o navegador, preparando terreno para robôs no mundo físico.
No estágio atual, o SIMA 2 examina quadro a quadro os pixels do jogo, relaciona comandos de mouse e teclado a movimentos e decide, sozinho, o melhor caminho para cumprir a missão. A capacidade de “perguntar” ao usuário em caso de dúvida e de fornecer atualizações em tempo real também foi ampliada.
Treinamento em oito jogos e cenários gerados por IA
Para acelerar o aprendizado, pesquisadores alimentaram o agente com gravações de humanos jogando oito títulos comerciais, entre eles Goat Simulator 3 e No Man’s Sky. Além disso, três mundos exclusivos foram criados pelo Genie 3, outro modelo da casa especializado em gerar cenários 3D do zero.
Durante os testes, o Gemini foi acionado para sugerir novas tarefas quando o agente falhava; o SIMA 2 tentava novamente até atingir a meta, refinando suas estratégias a cada ciclo. O resultado é um agente capaz de usar ferramentas, explorar ambientes desconhecidos e colaborar com jogadores humanos – pré-requisitos apontados pelo Google para futuros “companheiros robóticos”.
Limitações e próximos passos
Apesar do avanço, o SIMA 2 ainda é considerado experimental. Os pesquisadores apontam memória limitada e dificuldade em executar sequências longas de ações como problemas a resolver. A precisão no uso de teclado e mouse também precisa evoluir antes que o sistema seja aplicado fora dos laboratórios.
Mesmo assim, a iniciativa reforça a busca do Google por agentes multimundo instruíveis, capazes de aprender em jogos e migrar para aplicações no mundo real. Para acompanhar outras inovações em IA, visite nossa editoria de Conteúdo com Inteligência Artificial e fique por dentro das tendências.
Crédito da imagem: Olhardigital
Fonte: Olhardigital