Mensaje de Gate News, 17 de abril — Google presentó Gemini 3.1 Flash TTS, un modelo avanzado de texto a voz con funciones de expresión emocional y control mejoradas, el 15 de abril. El nuevo modelo se irá implementando de forma progresiva mediante APIs para desarrolladores, Vertex AI empresarial y herramientas de colaboración.
Las capacidades principales del modelo incluyen etiquetas de audio basadas en lenguaje natural para ajustar la velocidad, la entonación y la emoción, además de un “Modo Director” para especificar escenas y funciones de los personajes y generar salidas de voz más matizadas. Una función de múltiples hablantes permite generar diálogos simultáneos, posibilitando flujos de conversación más naturales adecuados para podcasts, contenido de audio y asistentes de IA. El modelo admite más de 70 idiomas y dialectos, reflejando acentos y expresiones regionales para experiencias de voz localizadas en todo el mundo.
Google enfatizó el rendimiento y la eficiencia en costos, logrando puntuaciones altas en puntos de referencia de evaluación humana a ciegas mientras reducía los costos computacionales mediante su arquitectura Flash, diseñada para la adopción a gran escala en empresas. El audio generado incluye marcas de agua SynthID para identificar contenido generado por IA y combatir la desinformación.
El movimiento refleja una competencia cada vez más intensa en interfaces de voz. OpenAI combina funciones de voz en tiempo real con IA conversacional para interacciones similares a las humanas, mientras que Meta amplía sus inversiones en personajes de IA con experiencias sociales basadas en voz. Los observadores de la industria señalan que, si bien por ahora el alto nivel de actuación y el trabajo creativo pueden seguir estando impulsados por humanos, los mercados de producción repetitiva y a gran escala podrían ver una adopción gradual de IA en doblaje, publicidad y sectores de audiolibros.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Se revela que “Claude pierde capacidad” no es un mito urbano; el modelo de IA es inestable y representa un riesgo empresarial
El artículo analiza el fenómeno de la inestabilidad del desempeño de los LLM (modelos de lenguaje a gran escala) en aplicaciones empresariales de IA, al que se le llama «descenso de capacidad» y se brindan ejemplos para explicar su impacto real en los flujos de trabajo de las empresas. Los datos muestran que la mayoría de los modelos principales se encuentran en un estado degradado, lo que afecta la productividad y la estabilidad de las empresas. Las empresas deben empezar a dar prioridad a la estabilidad del modelo como un nuevo estándar; de lo contrario, se enfrentarán a riesgos de infraestructura.
ChainNewsAbmediaHace20m
OpenAI actualiza Codex a un agente de IA que controla el escritorio, automatizando los flujos de trabajo de desarrollo
El Codex mejorado de OpenAI evoluciona de un asistente de programación a un agente autónomo para entornos de escritorio, capaz de gestionar aplicaciones, automatizar flujos de trabajo e integrarse con más de 100 aplicaciones. Este cambio mejora la continuidad de las tareas y la automatización de flujos de trabajo, reflejando un panorama competitivo en herramientas de codificación con IA.
GateNewsHace22m
Google integra la búsqueda con IA en Chrome, habilitando la navegación web conversacional
Google está mejorando Chrome con una búsqueda impulsada por IA, que permite navegar mediante conversación y recibir respuestas conscientes del contexto. La nueva funcionalidad también incluye una integración de varias pestañas, mejorando la experiencia del usuario para diversas tareas al consolidar las pestañas abiertas y proporcionar información adaptada.
GateNewsHace52m
Shinsegae Group abandona la colaboración con OpenAI por una asociación con Reflection AI y cambia su estrategia minorista
El grupo Shinsegae ha detenido su asociación con OpenAI y ha optado por una colaboración ampliada con Reflection AI para mejorar la IA en las operaciones minoristas. Esta decisión busca agilizar los esfuerzos y abordar las preocupaciones sobre la eficacia del comercio impulsado por IA.
GateNewshace1h
OpenAI y Google Agregan Soporte para el Formato HWP; Hancom Busca un Repunte de Valuación
ChatGPT de OpenAI ahora admite los formatos de archivo HWP y HWPX, lo que permite a los usuarios coreanos subir documentos directamente para su análisis sin necesidad de conversión. Esto mejora la usabilidad para las empresas locales y podría impulsar la recuperación de la cotización de Hancom en medio de las caídas recientes.
GateNewshace1h
Google elimina 175,5M de anuncios en Corea del Sur usando la aplicación con IA y suspende 326K cuentas de anunciantes
En 2025, Google eliminó 175,5 millones de anuncios infractores en Corea del Sur mediante IA, suspendió 326.000 cuentas y se enfrentó a una multa de $50 millones por infracciones de privacidad, lo que pone de manifiesto una tendencia de aumento de la aplicación y el papel de la IA para combatir el fraude publicitario.
GateNewshace1h