Resultados da pesquisa por "R1"
Hoje
23:59

DeepSeek-R1 comemora um ano de lançamento e revela o novo modelo 「MODEL1」

A DeepSeek, ao lançar o novo modelo 「MODEL1」, atualizou o código FlashMLA, envolvendo 28 de 114 arquivos que mencionam este modelo, ao contrário do V32. O MODEL1 pode ser uma nova arquitetura, com principais diferenças na otimização de memória, layout de cache KV, tratamento de esparsidade e decodificação FP8.
Mais
06:41

DeepSeek-V3.1 lançado oficialmente

A DeepSeek lançou oficialmente a versão V3.1, que inclui uma arquitetura de raciocínio híbrido, maior eficiência de pensamento e capacidades de Agent mais fortes. Os usuários podem alternar livremente entre o modo de pensamento e o modo não pensamento através do botão "Profundidade".
Mais
DEEPSEEK-3,19%
07:36

MiniMax Código aberto primeiro modelo de inferência: comparado ao DeepSeek, o custo de poder de computação é de apenas cerca de 530 mil dólares.

Gate News bot消息,MiniMax6月17日 anunciou que irá lançar atualizações importantes durante cinco dias consecutivos. Hoje, o primeiro lançamento é o modelo de inferência de código aberto MiniMax-M1. De acordo com o relatório oficial, o MiniMax-M1 passou em vários testes de referência, igualando-se a modelos de código aberto como DeepSeek-R1, Qwen3, entre outros, chegando perto dos modelos mais avançados no exterior. O blog oficial também mencionou que, com base em duas inovações tecnológicas, o processo de treinamento do MiniMax-M1 foi tão eficiente que "superou as expectativas", levando apenas 3 semanas e 512 GPUs H800 para completar a fase de treinamento de aprendizado por reforço, com um custo de locação de poder de computação de apenas 53,47 mil dólares.
Mais
DEEPSEEK-3,19%
04:37
1

Pesquisadores da Apple: Modelos de IA mainstream ainda não conseguem atingir o nível de raciocínio esperado para AGI.

Em um artigo publicado em junho intitulado "The Illusion of Thinking", os pesquisadores da Apple apontaram que os principais modelos de IA (AGI) ainda têm dificuldades com o raciocínio e, como resultado, o desenvolvimento de (AGI) gerais de IA é um resultado Ainda há um longo caminho a percorrer. O artigo aponta que as atualizações mais recentes para os principais modelos de linguagem grande de IA (LLM), como o ChatGPT da OpenAI e o Claude da Anthropic, incluíram grandes modelos de inferência (LRM), mas suas características básicas, Os recursos e limitações estendidos "ainda não são totalmente compreendidos". A avaliação atual centra-se principalmente em referências matemáticas e de codificação estabelecidas, "enfatizando a precisão da resposta final". No entanto, os pesquisadores disseram que a avaliação não forneceu informações sobre as capacidades de raciocínio dos modelos de IA, em contraste com a expectativa de que a inteligência geral artificial seria alcançada em apenas alguns anos.
Mais
AGI-3,19%
14:43

Ethereum R1: O projeto Rollup neutro sem Token foi oficialmente lançado.

Bot de notícias Gate.io, a solução de escalonamento Ethereum R1 foi oficialmente anunciada. O projeto opera com um modelo de financiamento 100% baseado em doações, não emite tokens e não há atividade de pré-venda. R1 entrou na segunda fase desde o seu lançamento, apresentando um mecanismo de prova sem necessidade de permissão, um longo período de atraso na atualização e características amplas de múltiplas assinaturas da comunidade. O projeto recebeu apoio financeiro de interesse público até 2030, e todas as taxas geradas após isso serão destruídas. Fonte da mensagem: wublock123
Mais
ETH-3,1%