O custo das GPUs Nvidia Blackwell dobra, mas a despesa com inferência por token cai 35x em comparação com a Hopper

De acordo com a análise mais recente do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam 35 vezes menos custos de inferência por token. Usando o modelo de teste DeepSeek-R1, Blackwell (GB300 NVL72) é alugado por US$ 2,65 por GPU por hora, enquanto o Hopper custa US$ 1,41. Ainda assim, o throughput de uma única GPU salta de 90 para 6.000 tokens por segundo. Esse ganho de throughput de 65x reduz os custos por milhão de tokens de US$ 4,20 para US$ 0,12.

O valor de US$ 0,12 pressupõe otimização total de software, incluindo inferência com FP4 em baixa precisão e previsão de múltiplos tokens (MTP). Sem MTP habilitado, os custos por milhão de tokens chegam a aproximadamente US$ 2,35, caindo para US$ 0,11 com ele ativo, demonstrando um impacto de otimização de 21x atribuível apenas a esse recurso.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O OpenAI DevDay 2026 será realizado em 29/09 em São Francisco

Anúncio oficial da OpenAI de 29 de abril: a conferência anual de desenvolvedores DevDay 2026, principal encontro para criadores, acontecerá em 29 de setembro em São Francisco, retornando ao formato presencial de conferência após muitos anos. Além disso, foi anunciada uma atividade de submissão: desenvolvedores usarão GPT-5.5 e Image Gen para criar obras, e enviarão suas criações para participar; toda semana, o Codex selecionará 2-3 submissões criativas, e os autores receberão ingressos gratuitos para o DevDay (incluindo passagens entre cidades e custos de hotel). Tema do evento: ecossistema de desenvolvedores em torno de GPT-5.5 + Image Gen A pilha de aplicações principal deste DevDay está claramente centrada no GPT-5.5. O GPT-5.5 foi lançado em 23 de abril e teve a API totalmente aberta em 24; junto ao GPT-5.4 no fim de abril

ChainNewsAbmedia41m atrás

BioMysteryBench: Mythos 解專家无解题 29,6%

A Anthropic publicou em 29 de abril, em seu anúncio oficial de pesquisa, o BioMysteryBench—um novo conjunto de avaliações para habilidades de análise de bioinformática de IA, composto por perguntas abertas em cenários reais de pesquisa. Os dados mais relevantes são: entre os itens que nem especialistas humanos conseguiram resolver após tentativas, o modelo principal Mythos da Anthropic acertou 29,6%, enquanto o Opus 4,7 acertou 27,0%. Design do benchmark: dois trilhos — problemas solucionáveis e problemas insolúveis por especialistas O BioMysteryBench é composto por dois tipos de questões. A primeira é “problemas solucionáveis”—tarefas analíticas criadas por pesquisadores de bioinformática, com respostas padrão para comparação; a segunda é “problemas insolúveis por especialistas”—questões que, mesmo após tentativas de um grupo de especialistas humanos, não conseguiram encontrar respostas confiáveis, para testar se o modelo consegue ultrapassar os limites do conhecimento atual da área.

ChainNewsAbmedia43m atrás

A OpenAI Anuncia o Lançamento do Modelo de Cibersegurança GPT-5.5-Cyber nos Próximos Dias

De acordo com a Cointelegraph, Sam Altman anunciou que a OpenAI lançará o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI planejando estabelecer mecanismos de acesso confiáveis em colaboração com entidades governamentais para

GateNews1h atrás

CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se preparar

Na série de vídeos da Sequoia Capital com a participação de Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência geral artificial (AGI) chegará até 2030. Hassabis, vencedor do Prêmio Nobel de Química de 2024, vê esse cronograma como uma realidade estritamente ligada aos negócios que obriga os líderes a repensar o produto de

GateNews1h atrás

OpenAI para operar como uma empresa perpetuamente de baixa lucratividade, assina acordo de energia de 20 anos

De acordo com a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende se tornar uma empresa de infraestrutura massiva e com crescimento rápido, porém com lucro permanentemente baixo, oferecendo produtos semelhantes a um “medidor inteligente” que os usuários podem comprar para automatizar operações de negócios ou incorporar em

GateNews1h atrás

Forefront Tech conclui a precificação do IPO $100M e planeja abrir listagem na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a precificação de uma IPO de US$ 100 milhões em 30 de abril, com previsão de listagem na Nasdaq sob o ticker FTHAU. Os recursos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews1h atrás
Comentário
0/400
Sem comentários