Aceleradora PCIe de 240 W roda LLM de 700B e ameaça Nvidia

Placa da Skymizer prova que hardware “antigo” ainda tem muito fôlego na IA

Skymizer – a companhia taiwanesa apresentou recentemente uma aceleradora PCIe que executa modelos de linguagem com até 700 bilhões de parâmetros localmente, consumindo apenas 240 W e recorrendo a chips de 28 nm e memória DDR4.

  • Em resumo: solução de US$ 1.500 desafia H100 e MI300 ao unir baixo consumo e suporte a LLMs gigantes.

Velocidade de IA sem depender de litografias de ponta

A placa emprega quatro ASICs de 28 nm, cada um com 16 GB de DDR4-3200, totalizando 64 GB. Segundo a empresa, isso é suficiente para carregar modelos de 700B em modo 4-bit, entregando 150 TFLOPS a 240 W. Para efeito de comparação, a Nvidia H100, referência do mercado, exige cerca de 350 W para atingir 80 FP16 TFLOPS.

“Nosso foco é inferência de grande escala com TCO baixo; não precisamos da litografia de 5 nm para isso”, afirmou o CEO da Skymizer durante a apresentação em Taipei.

Impacto no mercado e possíveis aplicações

A estratégia mira data centers que desejam rodar LLMs localmente, evitando custos de nuvem e latência. Além disso, o uso de DDR4 barateia a produção em até 60 %, pois módulos estão amplamente disponíveis desde 2014. Especialistas lembram que AMD e Nvidia concentram esforços em HBM, encarecendo o GB de memória. Se ganhar escala, a abordagem da Skymizer pode inaugurar uma nova categoria de “IA frugal”, alinhada ao movimento Green AI descrito pela MIT Technology Review.

Qual a diferença entre aceleradora PCIe e GPU?

Aceleradoras são ASICs dedicados à IA; GPUs têm núcleos gráficos e maior versatilidade.

Por que rodar LLM localmente é vantajoso?

Reduz custos recorrentes de nuvem, melhora privacidade e diminui latência na resposta.

O que você acha? A solução da Skymizer tem potencial para democratizar IA avançada? Para mais análises sobre hardware de alto desempenho, acesse nossa editoria especializada.


Crédito da imagem: Divulgação / Skymizer

Sidney Alvez

Compartilhar
Publicado por
Sidney Alvez

Postagens recentes

Remake de Devil May Cry vaza; veja o que esperar da Capcom

Rumor aponta retorno estiloso de Dante após 23 anos de sua estreia Devil May Cry…

1 hora atrás

Zelda: Twilight Princess chega ao Android — veja como instalar no seu Galaxy

Clássico do GameCube agora roda em smartphones Galaxy com ajustes de toque e 60 fps…

4 horas atrás

Google aperta verificação e complica ROMs no Galaxy — entenda impacto no Brasil

Ferramentas de segurança podem limitar ROMs alternativas em celulares Samsung Samsung Galaxy — Em publicação…

7 horas atrás

Mouse Logitech Pro X2 Superstrike promete 120h e clique sem ruído

Sensor cirúrgico e peso pluma desafiam os rivais premium Logitech Pro X2 Superstrike — lançado…

10 horas atrás

Rivals S2 desembarca no Disney+: tensão e erotismo logo nos 3 primeiros episódios

Clássico de Jilly Cooper ganha fôlego extra com reviravoltas políticas e paixão sem filtros Rivals…

11 horas atrás

Combo Maxsun Intel Raptor Lake custa US$200 e sacode PCs

Placa-mãe soldada ao chip oferece economia agressiva para setups compactos Maxsun – A fabricante chinesa…

11 horas atrás