NVIDIA Blackwell Destrói Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

Iris Coleman 05 de mar. de 2026 18:17

O GB200 NVL72 da NVIDIA estabelece novo recorde STAC-AI para inferência LLM em negociação financeira, entregando até 3,2x de desempenho sobre a arquitetura Hopper.

NVIDIA Blackwell Destrói Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

A arquitetura Blackwell da NVIDIA acabou de publicar os resultados mais rápidos de sempre no benchmark STAC-AI para inferência LLM financeira, com o GB200 NVL72 a entregar até 3,2x de melhorias de desempenho de GPU única sobre a geração anterior Hopper. Os resultados de 05 de março de 2026 importam para empresas de negociação que correm para extrair alfa da análise de dados não estruturados.

O Strategic Technology Analysis Center, que tem testado cargas de trabalho de tecnologia financeira há mais de 15 anos, testou o Blackwell contra cenários do mundo real usando registos EDGAR 10-K—os relatórios anuais densos que fundos quantitativos analisam para sinais de investimento. Executando os modelos Llama 3.1 da Meta, o GB200 NVL72 atingiu 37.480 palavras por segundo em prompts financeiros de comprimento médio, comparado a 8.237 WPS para sistemas GH200 duplos.

Os Números Brutos Contam a História

No modelo Llama 3.1 8B com dados EDGAR4, o Blackwell processou 224 pedidos por segundo versus 51,5 RPS para Hopper—uma melhoria de 4,3x ao nível do sistema. A diferença aumentou em tarefas computacionalmente mais pesadas: o modelo de parâmetro 70B em registos EDGAR5 de contexto longo viu o throughput saltar de 41,4 WPS para 150 WPS.

O que torna estes ganhos possíveis? O novo formato de quantização NVFP4 da NVIDIA, exclusivo do Blackwell, comprime modelos em pegadas de memória mais pequenas sem sacrificar precisão. O Hopper executou quantização FP8; o salto arquitetural para precisão de quatro bits no Blackwell desbloqueia o delta de throughput.

O Desempenho Interativo Importa para Negociação

Processamento em lote é uma coisa. Decisões de negociação em tempo real requerem respostas rápidas. Aqui, o Blackwell manteve tempos de reação mais baixos (análogos ao tempo até ao primeiro token) e melhor latência entre palavras mesmo quando levado ao throughput máximo. Em níveis de utilização correspondentes, o GB200 NVL72 superou consistentemente o GH200 em métricas de capacidade de resposta na maioria dos cenários de teste.

Para mesas de negociação a executar análise de sentimento em chamadas de resultados ou a analisar notícias de última hora, essa vantagem de latência traduz-se diretamente em tomada de decisões mais rápida. O benchmark testou explicitamente o pipeline de inferência completo incluindo tokenização—trabalho que implementações reais não podem ignorar.

Contexto de Mercado

As ações da NVIDIA negociaram a $181,41 em 05 de março, subindo 1,1% no dia, com a capitalização de mercado da empresa a situar-se em $4,42 triliões. A arquitetura Blackwell, anunciada no GTC 2024, foi desenhada especificamente para cargas de trabalho de IA generativa. O CEO Jensen Huang posicionou-a como alimentando "uma nova revolução industrial", e estes resultados de benchmark fornecem evidências concretas para essa afirmação no setor financeiro.

O superchip GB200 Grace Blackwell combina duas GPUs B200 com uma CPU Grace, apresentando AI Tensor Cores redesenhados e NVLink de quinta geração para escalar até 576 GPUs. Resultados anteriores do MLPerf mostraram ganhos de treino de 2,2x no Llama 3.1 405B; estes números STAC-AI confirmam que vantagens semelhantes se estendem à inferência.

Hopper Ainda Relevante

Vale notar: a arquitetura Hopper de três anos publicou números respeitáveis. Empresas de negociação com implementações GH200 existentes não ficam obsoletas da noite para o dia. Mas para novas construções ou empresas onde a velocidade de inferência impacta diretamente os retornos, a economia do Blackwell parece convincente—a NVIDIA afirma até 25x de redução nos custos operacionais de inferência LLM versus gerações anteriores.

Os relatórios STAC completos, incluindo métricas detalhadas de modo interativo em várias taxas de chegada, estão disponíveis através dos canais oficiais da STAC. As instituições financeiras que avaliam atualizações de infraestrutura de IA têm agora dados auditados de terceiros para informar decisões de aquisição.

Fonte da imagem: Shutterstock

nvidia
blackwell
inferência de ia
negociação financeira
llm

NVIDIA Blackwell Esmaga Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

NVIDIA Blackwell Destrói Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

Os Números Brutos Contam a História

O Desempenho Interativo Importa para Negociação

Contexto de Mercado

Hopper Ainda Relevante

Você também pode gostar

Trump diz que filho de Khamenei é “inaceitável” para liderar o Irã

Link faz rodada para criar campi nos EUA, Europa e Ásia

Mercado de hidrogênio verde paga R$ 13 mil para especialistas que lideram a energia limpa

Notícias em alta

Trump diz que filho de Khamenei é “inaceitável” para liderar o Irã

Link faz rodada para criar campi nos EUA, Europa e Ásia

Mercado de hidrogênio verde paga R$ 13 mil para especialistas que lideram a energia limpa

Flávio Bolsonaro passa por cirurgias nos olhos em Brasília

Cidade fundada há 255 anos, possui o maior conjunto arquitetônico tombado do estado e mantém vivas as tradições coloniais

Preços das criptomoedas