Por que a combinação Xeon 6 + Arc Pro mexe com o mercado de IA
Intel – Na última edição do MLPerf Inference v6.0, a companhia exibiu ganhos substanciais de desempenho e eficiência ao unir CPUs Xeon 6 e GPUs Arc Pro B70/B65, rodando modelos com até 120 bilhões de parâmetros em 128 GB de VRAM.
- Em resumo: Arc Pro B70 entrega até 1,8× mais performance que a geração anterior e mantém custo competitivo.
Stack aberta desafia ecossistemas fechados
A gigante aposta em uma arquitetura containerizada para Linux que escala de um único nó a clusters corporativos. Recursos como PCIe P2P, ECC e SR-IOV tornam as placas mais flexíveis, enquanto telemetria avançada facilita manutenção. Dados publicados nos benchmarks de referência do MLPerf mostram que o setup multi-GPU da Intel manteve alta simultaneidade sem depender de soluções proprietárias.
“A proposta é simplificar a adoção de IA em empresas, reduzindo custos e evitando dependência de soluções proprietárias.” – Intel
Mais desempenho, menos custo para IA generativa
Além de acelerar LLMs, a Arc Pro B70 oferece até 1,6× mais cache KV em ambientes multi-GPU, crucial para janelas de contexto maiores em chatbots e ferramentas de criação de código. Os Xeon 6, equipados com instruções AMX e AVX-512, continuam responsáveis por orquestração de tarefas, segurança e balanceamento de memória, liberando as GPUs para a inferência pesada.
O resultado é uma plataforma que, segundo comparações internas, entrega capacidade semelhante a rivais mais caros, mas em um pacote de menor consumo energético e base totalmente aberta – ponto estratégico para setores que precisam manter dados sensíveis on-premise.
O que você acha? Os avanços da Intel são suficientes para quebrar o domínio das soluções fechadas em IA? Para mais análises de hardware, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Intel