Os GPU Nvidia Blackwell custam o dobro, mas o custo da inferência por token desce 35x face ao Hopper

De acordo com a análise mais recente no blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam custos de inferência por token 35 vezes mais baixos. Usando o modelo de teste DeepSeek-R1, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas o throughput de um único GPU salta de 90 para 6.000 tokens por segundo. Este ganho de throughput de 65x reduz os custos por milhão de tokens de 4,20 USD para 0,12 USD.

O valor de 0,12 USD assume optimização total de software, incluindo inferência com baixa precisão FP4 e previsão multi-token (MTP). Sem MTP activado, os custos por milhão de tokens atingem aproximadamente 2,35 USD, descendo para 0,11 USD com ele ativo, demonstrando um impacto de optimização de 21x apenas com essa funcionalidade.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A DevDay 2026 da OpenAI vai decorrer a 29/09, em São Francisco

Anúncio oficial da OpenAI de 29 de abril: a conferência anual DevDay 2026 para programadores, do nível mais elevado, terá lugar a 29 de setembro em São Francisco, regressando ao formato de conferência presencial após vários anos. Em simultâneo, foi também divulgada uma iniciativa de submissão: os programadores usam o GPT-5.5 e o Image Gen para criar obras e apresentá-las, sendo que, a cada semana, o Codex seleciona 2-3 submissões criativas entre as entradas, que recebem bilhetes gratuitos para o DevDay (incluindo despesas de passagem interurbana e alojamento). Tema da conferência: ecossistema de programadores centrado no GPT-5.5 + Image Gen A base de aplicações central desta edição do DevDay está claramente alinhada com o GPT-5.5. O GPT-5.5 entrou em funcionamento a 23 de abril e, a 24, foi disponibilizada de forma completa a API; juntamente com o GPT-5.4 no fim de abril

ChainNewsAbmedia41m atrás

BioMysteryBench: Mythos O especialista em desvendar mitos sem solução 29,6%

A Anthropic publicou a 29 de abril, num anúncio oficial de investigação, o BioMysteryBench—um novo referencial de avaliação para capacidades de análise de bioinformática por IA, composto por questões abertas em cenários reais de investigação. Os dados mais dignos de destaque são estes: nos itens que continuaram por resolver após a tentativa de um painel de especialistas humanos, o modelo de topo da Anthropic, Mythos, resolveu 29,6%, enquanto o Opus 27,0% conseguiu resolver 27,0%. Concepção da avaliação: duas vias — questões resolvíveis e questões que os especialistas não conseguem resolver O BioMysteryBench é composto por dois tipos de questões. O primeiro é o das “questões resolvíveis” — tarefas de análise concebidas por investigadores de bioinformática, com respostas de referência para comparação. O segundo é o das “questões que os especialistas não conseguem resolver” — problemas que, após a tentativa de um painel de especialistas humanos, permanecem sem uma resposta credível, para testar se os modelos conseguem ultrapassar os limites do conhecimento disponível na área.

ChainNewsAbmedia43m atrás

A OpenAI anuncia o lançamento do modelo de cibersegurança GPT-5.5-Cyber nos próximos dias

Segundo a Cointelegraph, Sam Altman anunciou que a OpenAI vai lançar o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI a planear estabelecer mecanismos de acesso fiáveis em colaboração com entidades governamentais para

GateNews1h atrás

O CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se prepararem

De acordo com a série de vídeos da Sequoia Capital com Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência artificial geral (AGI) vai chegar até 2030. Hassabis, vencedor do Prémio Nobel de Química em 2024, vê este calendário como uma realidade empresarial estrita que obriga os líderes a repensar o produto de

GateNews1h atrás

OpenAI para operar como uma empresa de lucro perpetuamente baixo, assina um contrato de energia de 20 anos

Segundo a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende tornar-se uma empresa de infraestruturas massiva e de crescimento rápido, com lucros perpetuamente baixos, oferecendo produtos semelhantes a um “contador inteligente” que os utilizadores podem comprar para automatizar as operações de negócio ou incorporar em

GateNews1h atrás

A Forefront Tech conclui a definição de preços do IPO $100M , para cotar na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a fixação do preço de um IPO de 100 milhões de dólares a 30 de abril, com estreia prevista na Nasdaq sob o símbolo FTHAU. Os proventos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews1h atrás
Comentar
0/400
Nenhum comentário