Mensagem da Gate News, 17 de abril — A Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto-para-voz com funcionalidades de expressão emocional e controlo melhoradas, a 15 de abril. O novo modelo será lançado progressivamente através de APIs para programadores, do Vertex AI empresarial e de ferramentas de colaboração.
As principais capacidades do modelo incluem etiquetas de áudio baseadas em linguagem natural para afinar a velocidade, a entoação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas vocais mais subtis. Uma funcionalidade de múltiplos locutores permite a geração simultânea de diálogos, possibilitando fluxos de conversa mais naturais adequados para podcasts, conteúdos áudio e assistentes de IA. O modelo suporta mais de 70 línguas e dialetos, refletindo acentos e expressões regionais para experiências de voz localizadas em todo o mundo.
A Google sublinhou o desempenho e a eficiência de custos, obtendo pontuações elevadas em benchmarks de avaliação humana às cegas, ao mesmo tempo que reduz os custos computacionais com a sua arquitetura Flash — concebida para adoção empresarial em grande escala. O áudio gerado inclui marcações de watermark SynthID para identificar conteúdos gerados por IA e combater a desinformação.
A medida reflete a intensificação da concorrência em interfaces de voz. A OpenAI está a combinar funcionalidades de voz em tempo real com IA conversacional para interações mais semelhantes às humanas, enquanto a Meta está a alargar investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria referem que, embora a atuação de alto nível e o trabalho criativo possam continuar, por agora, a ser impulsionados por humanos, os mercados de produção repetitiva e em grande escala poderão assistir a uma adoção gradual da IA na dobragem, na publicidade e nos setores de audiolivros.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Os dados revelam que “Claude fica menos inteligente” não é um mito urbano; o modelo de IA é instável, constituindo um risco empresarial
O artigo aborda o fenómeno de instabilidade do desempenho de LLMs (modelos de linguagem de grande escala) nas aplicações das empresas de IA, chamando-lhe «diminuição de capacidades», e apresenta exemplos para ilustrar o seu impacto real nos fluxos de trabalho das empresas. Os dados mostram que a maioria dos modelos principais se encontra num estado de degradação, afectando a produtividade e a estabilidade das empresas; estas precisam de começar a dar prioridade à estabilidade dos modelos como um novo padrão, caso contrário enfrentarão riscos para a infra-estrutura.
ChainNewsAbmedia19m atrás
A OpenAI Actualiza o Codex para um Agente de IA que Controla o Ambiente de Trabalho, Automatizando os Fluxos de Trabalho de Desenvolvimento
O Codex melhorado da OpenAI evolui de um assistente de programação para um agente autónomo para ambientes de ambiente de trabalho, capaz de gerir aplicações, automatizar fluxos de trabalho e integrar-se com mais de 100 aplicações. Esta mudança melhora a continuidade das tarefas e a automatização dos fluxos de trabalho, reflectindo um cenário competitivo nas ferramentas de programação por IA.
GateNews22m atrás
A Google integra a pesquisa com IA no Chrome, permitindo uma navegação web conversacional
A Google está a reforçar o Chrome com uma pesquisa alimentada por IA, permitindo a navegação por conversa e respostas conscientes do contexto. A nova funcionalidade inclui também a integração com vários separadores, melhorando a experiência do utilizador para diversas tarefas ao consolidar separadores abertos e disponibilizar informação adaptada.
GateNews52m atrás
O Grupo Shinsegae abandona a colaboração com a OpenAI em prol da parceria com a Reflection AI, mudando a estratégia de retalho
O Grupo Shinsegae suspendeu a sua parceria com a OpenAI, optando por uma colaboração alargada com a Reflection AI para melhorar a IA nas operações de retalho. Esta decisão visa agilizar os esforços e dar resposta a preocupações sobre a eficácia do comércio com IA.
GateNews1h atrás
A OpenAI e a Google adicionam suporte para o formato HWP; a Hancom procura uma recuperação da valorização
O ChatGPT da OpenAI passa agora a suportar os formatos de ficheiro HWP e HWPX, permitindo aos utilizadores coreanos carregar documentos directamente para análise sem conversão. Isto melhora a usabilidade para empresas locais e pode impulsionar a recuperação das acções da Hancom num contexto de quedas recentes.
GateNews1h atrás
Google Remove 175,5M de Anúncios na Coreia do Sul com Reforço por IA, Suspende 326K de Contas de Anunciantes
Em 2025, a Google removeu 175,5 milhões de anúncios em violação na Coreia do Sul com recurso a IA, suspendeu 326.000 contas e foi confrontada com uma coima de $50 milhões por violações de privacidade, evidenciando uma tendência de reforço da aplicação e do papel da IA no combate à fraude publicitária.
GateNews1h atrás