A Alibaba abre código do módulo de interpretabilidade Qwen-Scope do Qwen, cobrindo 7 modelos, em 30 de abril

De acordo com a PANews, em 30 de abril, a Qwen, do Alibaba, anunciou o open-sourcing do Qwen-Scope, um módulo de interpretabilidade treinado nos modelos das séries Qwen3 e Qwen3.5. O lançamento abrange 7 modelos de linguagem grandes em variantes densas e de mixture-of-experts, com 14 conjuntos de pesos de sparse autoencoder.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

OpenAI revela por que o Codex não pode falar sobre “goblins”: a recompensa por personalidade “nerd” saiu do controle

A OpenAI, no blog oficial, explicou que o Codex não deve falar sobre goblins e outras criaturas, devido a uma preferência por sinais de recompensa em treinamento de personalidade de “nerds”, que usava metáforas com criaturas, causando contaminação entre personalidades e desorientação no RLHF. O episódio veio à tona depois que Barron Roth revelou uma instrução do sistema, e a OpenAI adotou duas estratégias: codificação rígida no curto prazo e eliminação de sinais de recompensa no longo prazo. O caso alerta sobre a fragilidade do design de recompensas, e que auditorias pós-treinamento precisam ser mais detalhadas.

ChainNewsAbmedia31m atrás

Servidores de IA Nvidia B300 batem US$ 1 milhão na China em meio a aperto de oferta

De acordo com a Reuters, os servidores de IA B300 da Nvidia agora são vendidos por aproximadamente 7 milhões de yuans (US$ 1 milhão) na China, impulsionados por uma repressão às redes de contrabando e pela demanda contínua das empresas locais de tecnologia. O preço disparou em relação aos cerca de 4 milhões de yuans (US$ 585.000) no fim de 2025, significativamente

GateNews1h atrás

Lucro operacional da LG CNS sobe 19% no 1T com crescimento de IA e nuvem

De acordo com o Chosun Daily, a LG CNS informou em 30 de abril que o lucro operacional do primeiro trimestre aumentou 19,4% na comparação anual, chegando a 94,2 bilhões de won (US$ 64,1 milhões), impulsionado pela demanda por IA e nuvem. A receita subiu 8,6% para 1,3 trilhão de won (US$ 894 milhões). A unidade de IA e nuvem da empresa gerou 765,4 billi

GateNews2h atrás

OpenAI lança o GPT-5.5-Cyber: confronto com o Anthropic Mythos

A OpenAI anunciou o lançamento do GPT-5.5-Cyber, projetado especificamente para cibersegurança, que será implantado em “nos próximos dias” com um mecanismo confiável de acesso em cooperação com o governo para unidades-chave de defesa, não disponível para venda aberta. Em contraste com a via aberta do Anthropic Mythos, a Casa Branca se opõe a expandir para 70 unidades. O Preparedness Framework avaliou como High (ainda não chegou a critical), enquanto também reforça a proteção de segurança cibernética. Em seguida, vale acompanhar a lista de implantação, se a CISA pode entrar na relação e as diferenças entre os padrões de segurança dos dois lados.

ChainNewsAbmedia3h atrás

Receita do 1T da Schneider Electric atinge € 9,8 bilhões, impulsionada em 11,2% pela demanda de data centers por IA

De acordo com a Reuters, a Schneider Electric reportou receita no primeiro trimestre de 9,8 bilhões de euros (US$ 11,4 bilhões) em 30 de abril, com o crescimento orgânico subindo para 11,2% impulsionado pela demanda por data centers de IA. O fornecedor francês de equipamentos de energia e resfriamento disse que o resultado ficou ligeiramente acima das estimativas de consenso e

GateNews3h atrás

Protum levanta rodada Seed de US$ 2 milhões para plataforma de governança com IA, mirando fechamento em junho de 2026

De acordo com o TechCrunch Startup Spotlight, a Protum, uma startup de governança com IA, está levantando uma rodada seed de US$ 2 milhões com o objetivo de fechar até junho de 2026. Fundada por Sandeep J., que traz 25 anos de experiência em transformação de empresas, a Protum fornece uma plataforma projetada para dar às empresas uma gestão contínua

GateNews3h atrás
Comentário
0/400
Sem comentários