Hugging Face disponibiliza em código aberto o ml-intern, um agente de IA para investigação autónoma em ML

Mensagem da Gate News, 22 de abril — A Hugging Face disponibilizou em código aberto o ml-intern, um agente de investigação em ML capaz de concluir autonomamente todo o fluxo de trabalho, desde a leitura de artigos, passando pela organização de conjuntos de dados, lançamento de treino em GPU, avaliação de resultados e iteração de melhorias. O projeto é construído sobre o framework smolagents da Hugging Face e oferece tanto interfaces de CLI como baseadas na web, com código disponível no GitHub.

O conjunto de ferramentas do ml-intern foi concebido em torno do ecossistema da Hugging Face. Obtém artigos de arXiv e HF Papers enquanto traça cadeias de citações para uma leitura mais aprofundada; navega por conjuntos de dados no HF Hub, valida a qualidade e reformata os dados para treino; e, quando os recursos de GPU locais não estão disponíveis, recorre a HF Jobs para lançar tarefas de treino na cloud. Após a conclusão do treino, o agente lê automaticamente as saídas de avaliação, diagnostica as causas de falha e volta a executar experiências. Por padrão, utiliza Claude Sonnet 4.5 para conduzir o ciclo de decisão, com um máximo de 300 iterações por execução e compressão automática de contexto quando excede 170k tokens.

A Hugging Face demonstrou três casos de uso. Numa tarefa de raciocínio científico, o agente identificou os conjuntos de dados OpenScience e NemoTron-CrossThink a partir de cadeias de citação, filtrou sete variantes do ARC, SciQ e MMLU por nível de dificuldade e realizou 12 rondas de fine-tuning supervisionado no Qwen3-1.7B, melhorando as pontuações do GPQA de 10% para 32% em menos de 10 horas. Para uma aplicação médica, o agente concluiu que os conjuntos de dados existentes eram insuficientes, escreveu scripts para gerar 1.100 amostras de dados sintéticos e escalou-os 50 vezes para treino, ultrapassando o desempenho do Codex em 60% no HealthBench. Num cenário de matemática competitiva, o agente escreveu um script de treino em GRPO e lançou o treino em GPUs A100 via HF Spaces, e depois conduziu estudos de ablação após observar a colapsagem da recompensa.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Microsoft lança infraestruturas de comércio para agentes de IA: marketplace para publicadores, protocolos para comerciantes e ferramentas de anúncios

Mensagem da Gate News, 22 de abril — Tim Frank, vice-presidente de monetização de IA da Microsoft, anunciou uma série de atualizações de infraestruturas comerciais concebidas para a era do "agentic web", permitindo que publicadores, comerciantes e anunciantes permaneçam descobertos e negociáveis à medida que os agentes de IA tomam decisões de compra em nome dos utilizadores em

GateNews27m atrás

NeoCognition Capta $40M em Financiamento de Seed para Agentes de IA de Aprendizagem no Trabalho

Mensagem do Gate News, 22 de Abril — O laboratório de investigação em IA NeoCognition anunciou a conclusão de uma ronda de seed de $40 milhões, saindo do modo stealth. Fundada pelo Professor Associado da Universidade Estadual de Ohio Yu Su, juntamente com Xiang Deng e Yu Gu, a empresa tem sede em Palo Alto, Califórnia. A ronda w

GateNews44m atrás

PicWe Lança Carteira com Agente de IA com Gestão de Chaves no Dispositivo

PicWe anuncia uma versão beta pública do PicWe Wallet, uma carteira de chaves sem frases de recuperação, com agentes de IA e capaz de funcionar no dispositivo. Suporta ativos multi-cadeia, swaps, automação acessível por IA e tem como objetivo unificar a infraestrutura de RWA. A PicWe lançou a versão beta pública do PicWe Wallet, uma carteira com agentes de IA que armazena as chaves no dispositivo, elimina as frases de recuperação e mantém operações críticas locais. A beta suporta gestão de ativos multi-cadeia, swaps e pagamentos de taxas baseadas em stablecoins, ao mesmo tempo que permite interações programáveis com IA. As iniciativas mais amplas da PicWe posicionam a plataforma como uma infraestrutura unificada para ativos do mundo real, possibilitando emissão, circulação, liquidação, pagamentos transfronteiriços, tokenização e coordenação da cadeia de abastecimento para casos de uso empresariais.

GateNews1h atrás

A Google Research lança o ReasoningBank: agentes de IA aprendem estratégias de raciocínio com sucesso e falha

Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando

GateNews2h atrás

Professor da Tsinghua Dai Jifeng Lança Naive.ai, Angaria ~$300M a $800M Valuation

Mensagem do Gate News, 22 de abril — Dai Jifeng, professor associado no Departamento de Engenharia Eletrónica da Universidade Tsinghua, fundou a Naive.ai, uma empresa focada no pós-treinamento de modelos de código aberto e em agentes de IA. A startup angariou aproximadamente $300 milhões numa valorização estimada de $80

GateNews2h atrás

AWS Expands Multi-Agent AI Workflows, Supports Claude Opus 4.7 on Bedrock

Gate News message, April 22 — Amazon Web Services announced expansion of its agentic AI initiatives through multi-agent workflows, supporting Anthropic's Claude Opus 4.7 on Amazon Bedrock to help customers move beyond generative AI pilots. The company is expanding partner relationships as customers

GateNews3h atrás
Comentar
0/400
Nenhum comentário