GPU ganha novos atalhos para neural rendering e menos gargalos
Microsoft — A empresa liberou recentemente a versão prévia do AgilitySDK 1.720, inaugurando o Shader Model 6.10 e um pacote de otimizações que promete elevar o patamar de inteligência artificial, ray tracing e paralelismo no DirectX 12.
- Em resumo: novos intrínsecos de ray tracing, memória compartilhada variável e comandos assíncronos eliminam gargalos históricos da GPU.
Mais largura de banda para IA graças ao LinAlg::Matrix
Entre as estreias do SM 6.10, a API LinAlg traz instruções vetoriais específicas para operações de álgebra linear, base de qualquer modelo de aprendizado de máquina. Segundo dados da NVIDIA, cálculos MMA acelerados podem reduzir em até 40% o tempo de inferência em GPUs RTX quando comparados ao Shader Model 6.9.
“Os intrínsecos funcionam como atalhos de alta velocidade para a GPU, substituindo cálculos lentos por comandos diretos ao chip.” — documentação da Microsoft
Memória flexível: adeus ao teto fixo de 32 KB
O antigo limite de 32 KB de group shared memory cai por terra. Agora o compilador consulta MaxGroupSharedMemoryPerGroup em tempo real, permitindo ao desenvolvedor reservar exatamente o que o hardware suporta. Na prática, algoritmos de tile culling ou rasterização por software podem manipular blocos maiores sem recorrer a múltiplos passes, economizando ciclos preciosos.
Compatibilidade inicial e próximos passos
De saída, todo o hardware NVIDIA RTX é compatível, assim como as linhas AMD Radeon RX 7000/9000 e Intel Arc B-Series para a maioria dos novos recursos. Funções avançadas de matriz ainda aguardam driver da Intel, previsto para o 2º semestre de 2024. A transição deve ser suave nos consoles Xbox Series, já baseados em DirectX 12 Ultimate, e pode influenciar inclusive o ecossistema Windows on Arm que, segundo a The Verge, ganhará CPUs focadas em NPU ainda este ano.
Por que os desenvolvedores devem se importar?
Além do ganho bruto de performance, o Group Wave Index padroniza a forma como as waves são numeradas, evitando suposições perigosas no shader e garantindo portabilidade entre arquiteturas. A nova lista de comandos assíncronos em lote também libera cópias de buffer e limpezas para rodar em paralelo, algo que até APIs concorrentes como Vulkan já faziam. Resultado: cenas mais complexas, carregamentos mais curtos e maior taxa de quadros sem alterar o código de jogo.
O que você acha? As novidades do Shader Model 6.10 vão acelerar o próximo grande lançamento AAA? Para acompanhar outras análises de hardware e APIs gráficas, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Microsoft