O GB200 NVL72 da NVIDIA estabelece novo recorde STAC-AI para inferência LLM em negociação financeira, oferecendo até 3,2x de desempenho em relação à arquitetura Hopper. (Ler Mais)O GB200 NVL72 da NVIDIA estabelece novo recorde STAC-AI para inferência LLM em negociação financeira, oferecendo até 3,2x de desempenho em relação à arquitetura Hopper. (Ler Mais)

NVIDIA Blackwell Esmaga Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

2026/03/06 02:17
Leu 4 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

NVIDIA Blackwell Destrói Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

Iris Coleman 05 de mar. de 2026 18:17

O GB200 NVL72 da NVIDIA estabelece novo recorde STAC-AI para inferência LLM em negociação financeira, entregando até 3,2x de desempenho sobre a arquitetura Hopper.

NVIDIA Blackwell Destrói Benchmark de IA Financeira Com Ganhos de Velocidade de 3,2x

A arquitetura Blackwell da NVIDIA acabou de publicar os resultados mais rápidos de sempre no benchmark STAC-AI para inferência LLM financeira, com o GB200 NVL72 a entregar até 3,2x de melhorias de desempenho de GPU única sobre a geração anterior Hopper. Os resultados de 05 de março de 2026 importam para empresas de negociação que correm para extrair alfa da análise de dados não estruturados.

O Strategic Technology Analysis Center, que tem testado cargas de trabalho de tecnologia financeira há mais de 15 anos, testou o Blackwell contra cenários do mundo real usando registos EDGAR 10-K—os relatórios anuais densos que fundos quantitativos analisam para sinais de investimento. Executando os modelos Llama 3.1 da Meta, o GB200 NVL72 atingiu 37.480 palavras por segundo em prompts financeiros de comprimento médio, comparado a 8.237 WPS para sistemas GH200 duplos.

Os Números Brutos Contam a História

No modelo Llama 3.1 8B com dados EDGAR4, o Blackwell processou 224 pedidos por segundo versus 51,5 RPS para Hopper—uma melhoria de 4,3x ao nível do sistema. A diferença aumentou em tarefas computacionalmente mais pesadas: o modelo de parâmetro 70B em registos EDGAR5 de contexto longo viu o throughput saltar de 41,4 WPS para 150 WPS.

O que torna estes ganhos possíveis? O novo formato de quantização NVFP4 da NVIDIA, exclusivo do Blackwell, comprime modelos em pegadas de memória mais pequenas sem sacrificar precisão. O Hopper executou quantização FP8; o salto arquitetural para precisão de quatro bits no Blackwell desbloqueia o delta de throughput.

O Desempenho Interativo Importa para Negociação

Processamento em lote é uma coisa. Decisões de negociação em tempo real requerem respostas rápidas. Aqui, o Blackwell manteve tempos de reação mais baixos (análogos ao tempo até ao primeiro token) e melhor latência entre palavras mesmo quando levado ao throughput máximo. Em níveis de utilização correspondentes, o GB200 NVL72 superou consistentemente o GH200 em métricas de capacidade de resposta na maioria dos cenários de teste.

Para mesas de negociação a executar análise de sentimento em chamadas de resultados ou a analisar notícias de última hora, essa vantagem de latência traduz-se diretamente em tomada de decisões mais rápida. O benchmark testou explicitamente o pipeline de inferência completo incluindo tokenização—trabalho que implementações reais não podem ignorar.

Contexto de Mercado

As ações da NVIDIA negociaram a $181,41 em 05 de março, subindo 1,1% no dia, com a capitalização de mercado da empresa a situar-se em $4,42 triliões. A arquitetura Blackwell, anunciada no GTC 2024, foi desenhada especificamente para cargas de trabalho de IA generativa. O CEO Jensen Huang posicionou-a como alimentando "uma nova revolução industrial", e estes resultados de benchmark fornecem evidências concretas para essa afirmação no setor financeiro.

O superchip GB200 Grace Blackwell combina duas GPUs B200 com uma CPU Grace, apresentando AI Tensor Cores redesenhados e NVLink de quinta geração para escalar até 576 GPUs. Resultados anteriores do MLPerf mostraram ganhos de treino de 2,2x no Llama 3.1 405B; estes números STAC-AI confirmam que vantagens semelhantes se estendem à inferência.

Hopper Ainda Relevante

Vale notar: a arquitetura Hopper de três anos publicou números respeitáveis. Empresas de negociação com implementações GH200 existentes não ficam obsoletas da noite para o dia. Mas para novas construções ou empresas onde a velocidade de inferência impacta diretamente os retornos, a economia do Blackwell parece convincente—a NVIDIA afirma até 25x de redução nos custos operacionais de inferência LLM versus gerações anteriores.

Os relatórios STAC completos, incluindo métricas detalhadas de modo interativo em várias taxas de chegada, estão disponíveis através dos canais oficiais da STAC. As instituições financeiras que avaliam atualizações de infraestrutura de IA têm agora dados auditados de terceiros para informar decisões de aquisição.

Fonte da imagem: Shutterstock
  • nvidia
  • blackwell
  • inferência de ia
  • negociação financeira
  • llm
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.