Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.
Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.
Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Anthropic reverte mudanças no Claude Code após queda de qualidade; todas as correções concluídas
Mensagem do Gate News, 24 de abril — A Anthropic reconheceu uma recente queda na qualidade do Claude Code e confirmou que todos os problemas relacionados foram resolvidos por meio de rollbacks e correções. Os problemas decorreram de três ajustes de produto e prompt feitos entre o início e meados de abril.
Em 4 de março, o
GateNews1h atrás
Cofundador da NeoSoul Kaelan: a Indústria de IA deve permitir que brinquedos existam; a inovação muitas vezes começa como produtos experimentais
Mensagem do Gate News, 24 de abril — Em um fórum recente em Hong Kong sobre finanças inteligentes e criptografadas, o cofundador da NeoSoul, Kaelan, compartilhou percepções sobre como avaliar projetos de IA no estágio inicial, em uma indústria de IA que evolui rapidamente. Além de avaliar produtos atuais, as equipes devem demonstrar a capacidade de acompanhar as capacidades dos modelos subjacentes, afirmou ele.
GateNews1h atrás
Meta vai implantar dezenas de milhões de chips AWS Graviton5 em acordo multianual de bilhões de dólares
Mensagem do Gate News, 24 de abril — A Meta assinou um acordo multianual com a Amazon Web Services para implantar dezenas de milhões de processadores Graviton5 para sua infraestrutura de IA, tornando a Meta um dos maiores clientes globais de Graviton da AWS. O acordo, com duração de três a cinco anos, é avaliado em bilhões de d
GateNews1h atrás
DeepSeek V4-Flash entra no Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw conectados em um clique
Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, oferecendo três conjuntos de comandos de um clique para conectar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adotam uma arquitetura MoE, com suporte nativo a contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, o FLOPs por token cai 27% e o cache KV diminui 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre diferentes fluxos de trabalho, reduzindo custos e riscos de soberania de dados.
ChainNewsAbmedia3h atrás
Web3 AI Infrastructure AIW3 Capta $2M na Rodada Seed Liderada pela Buffalo Capital
Mensagem do Gate News, 24 de abril — A plataforma de infraestrutura de IA Web3 AIW3 anunciou a conclusão de uma rodada de captação seed de $2 milhões. A rodada foi liderada pela Buffalo Capital, com GalaXin Capital e Three-stones Ventures participando como co-investidoras.
A AIW3 está fazendo a transição para um paradigma de execução on-chain de Agente-como-Serviço
GateNews3h atrás
Cohere Adquire Empresa Alemã de IA Aleph Alpha e Garante $600M Investimento para Expansão na Europa
Mensagem do Gate News, 24 de abril — A empresa canadense de IA Cohere anunciou planos para adquirir a empresa alemã de IA Aleph Alpha para fortalecer sua presença na Europa. A Schwarz Group, apoiadora da Aleph Alpha, planeja investir $600 milhões na rodada de financiamento Série E da Cohere.
A rodada de financiamento deve ser concluída em 202
GateNews4h atrás