Gemini 3.0 en el campo del reconocimiento visual ya está muy por delante, este resultado realmente habla por sí mismo. Especialmente en algunas aplicaciones prácticas, como responder a las preguntas de matemáticas de los niños, manejar el reconocimiento de formas geométricas complejas, ya se ha convertido en la opción preferida.
Desde el punto de vista de la elección tecnológica, después de la fusión de Google Brain y DeepMind, Demis y su equipo no han vacilado en su hoja de ruta tecnológica: seguir firmemente el camino de la multimodalidad nativa. En la era de Gemini 1 y 2, esta ventaja aún no era particularmente evidente, pero en la generación 3.0, la ventaja de la multimodalidad se ha liberado por completo, y esto es el resultado de la acumulación tecnológica y la dirección correcta.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Gemini 3.0 en el campo del reconocimiento visual ya está muy por delante, este resultado realmente habla por sí mismo. Especialmente en algunas aplicaciones prácticas, como responder a las preguntas de matemáticas de los niños, manejar el reconocimiento de formas geométricas complejas, ya se ha convertido en la opción preferida.
Desde el punto de vista de la elección tecnológica, después de la fusión de Google Brain y DeepMind, Demis y su equipo no han vacilado en su hoja de ruta tecnológica: seguir firmemente el camino de la multimodalidad nativa. En la era de Gemini 1 y 2, esta ventaja aún no era particularmente evidente, pero en la generación 3.0, la ventaja de la multimodalidad se ha liberado por completo, y esto es el resultado de la acumulación tecnológica y la dirección correcta.