De acordo com Beating, a equipe Kaldi do AI Lab da Xiaomi disponibilizou em código aberto o OmniVoice, um modelo de TTS para clonagem de voz zero-shot que oferece suporte a 646 idiomas. O modelo clona características da voz a partir de apenas segundos de áudio de referência e funciona entre idiomas — uma única voz pode sintetizar fala em mandarim, japonês, coreano e outros idiomas. Todo o código, pesos e dados de treinamento são disponibilizados em código aberto sob licença Apache-2.0.
O OmniVoice usa uma arquitetura simplificada com um único Transformer bidirecional que mapeia diretamente texto para tokens acústicos discretos, alcançando inferência 40x mais rápida que o tempo real no PyTorch. Treinado com 580.000 horas de áudio de 50 conjuntos de dados open-source, o OmniVoice superou sistemas comerciais em similaridade de voz e inteligibilidade em 24 idiomas testados e correspondeu ou superou gravações humanas em 102 idiomas.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
O benchmark reafirma recomendação de compra de US$ 27 na Bitdeer enquanto BTDR dispara 21% com a expansão da infraestrutura de IA
De acordo com a Benchmark Equity Research, na quinta-feira a empresa reiterou sua recomendação de compra e sua meta de preço de US$ 27 para a Bitdeer Technologies (BTDR), citando o potencial de reavaliação das ações à medida que a empresa migra para a IA e
GateNews1h atrás
Video Rebirth Lança a Ferramenta BACH AI para Geração de Vídeos com Várias Tomadas de Até 30 Segundos
Video Rebirth lançou o BACH em 7 de maio, uma ferramenta que gera vídeos multi-shot de até 30 segundos a partir de prompts de texto e imagens de referência. A ferramenta mantém a consistência do personagem entre os takes, segue instruções de câmera e produz vídeo nativo em 1080p com efeitos sonoros, narração e
GateNews6h atrás
Tether lança modelo de IA médica MedPsy QVAC e atinge nota 62,62 na versão de 17 bilhões de parâmetros
De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica projetado para rodar localmente em smartphones e dispositivos vestíveis, sem depender de nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando a MedGemma-1.5-4B do Google em 11,42 poi
GateNews7h atrás
TCV lidera a $160M Série B para a startup de seguros para pets Corgi
A startup de seguros empresariais sediada nos EUA, Corgi, anunciou em 6 de maio que levantou US$ 160 milhões em uma rodada de financiamento Série B liderada pela TCV, a uma avaliação de US$ 1,3 bilhão, segundo a TechCrunch. A rodada também contou com a participação da Kindred Ventures, Leblon Capital e First Order Fund. Isso eleva o financiamento total da Corgi para US$ 268
CryptoFrontier15h atrás
B.AI ultrapassa 1,7 milhão de usuários em 7 de maio e lança programa de recompensas
De acordo com a B.AI, a plataforma de infraestrutura de IA ultrapassou 1,7 milhão de usuários em 7 de maio. A plataforma, que se concentra em proteção de privacidade e infraestrutura de economia de agentes, está oferecendo aos novos usuários 500 mil créditos gratuitos ao se cadastrar, preços sem markup em todos os modelos e uma promoção por tempo limitado de 1:1
GateNews16h atrás
Osome corta mais de 70 cargos e melhora o EBITDA em 50% com migração para IA
De acordo com a Tech in Asia, a plataforma de gestão corporativa Osome, com sede em Singapura, cortou mais de 70 funções nos últimos dois anos enquanto implantava IA para lidar com tarefas de conformidade, como registrar transações e processar faturas. O CEO Eugenio Ferrante disse que a empresa abriu mão de um crescimento de receita mais lento i
GateNews19h atrás