NVIDIA Vera Rubin estreia na GTC 2026 com um pacote de sete chips que promete transformar como empresas constroem “fábricas de IA”, aumentando desempenho, reduzindo custo por token e, de quebra, sendo transmitida ao vivo pela Band para o público brasileiro.
Sete peças que funcionam como um supercomputador de IA
A plataforma combina CPU Vera, GPU Rubin, switch NVLink 6, SuperNIC ConnectX-9, DPU BlueField-4, switch Ethernet Spectrum-6 e a recém-integrada LPU Groq 3. Juntas, essas peças formam um sistema full-stack pensado para pré-treinar, pós-treinar e fazer inferência de agentes em tempo real.
No rack NVL72, por exemplo, 72 GPUs Rubin e 36 CPUs Vera interligadas por NVLink 6 treinam modelos de mistura de especialistas usando apenas um quarto das GPUs necessárias na geração Blackwell, alcançando até 10 vezes mais throughput de inferência por watt e custo dez vezes menor por token.
Por que isso importa para quem escala IA
Empresas como Anthropic, OpenAI e Mistral AI já declararam interesse em migrar cargas de trabalho para o Vera Rubin, citando a necessidade de raciocínio mais complexo, contexto longo e decisões críticas em tempo quase real. Segundo análise do The Verge, a combinação de GPU e LPU poderá entregar até 35 vezes mais inferência por megawatt em modelos com trilhões de parâmetros, uma economia de energia vital diante de contas de data center cada vez mais altas.
Outro ponto relevante é o rack BlueField-4 STX, que cria uma camada de memória contextual para grandes modelos de linguagem. Com a biblioteca DOCA Memos, o cache key-value passa a ser processado cinco vezes mais rápido, mantendo latência baixa mesmo em interações multietapa de agentes.
Eficiência energética e expansão em nuvem
A NVIDIA também anunciou o software DSX Max-Q, capaz de provisionar dinamicamente energia em toda a fábrica de IA e permitir até 30 % mais infraestrutura no mesmo limite elétrico. Para provedores de nuvem, isso significa ampliar oferta de instâncias de alto desempenho sem reformar data centers.
Os primeiros servidores Vera Rubin chegam no segundo semestre via AWS, Google Cloud, Azure, Oracle Cloud e parceiros especializados como CoreWeave e Lambda. Fabricantes como Dell, HPE, Lenovo e Supermicro já trabalham em linhas baseadas na arquitetura.
Em resumo, a plataforma coloca a NVIDIA um passo à frente na corrida por hardware otimizado para agentes inteligentes, entregando mais performance por watt e viabilizando modelos cada vez maiores. Para acompanhar outras leituras sobre impacto tecnológico e tendências, visite nossa editoria de análise de tecnologia.
Crédito da imagem: Overbr Fonte: Overbr