Discurso de Robin Li en la Conferencia de desarrolladores de IA de Baidu: Después de superar innumerables obstáculos, ¿qué sabía Baidu?

Mientras puedas hablar, podrás convertirte en desarrollador.

Escrito por: Lian Ran

Editor: Zheng Xuan

Fuente: Geek Park

“El lenguaje natural se convertirá en la próxima generación de lenguajes de programación y todos pueden convertirse en desarrolladores”.

El 16 de abril, se celebró en Shenzhen la Conferencia de desarrolladores de IA de Baidu Create 2024. El fundador, presidente y director ejecutivo de Baidu, Robin Li, pronunció un discurso de apertura sobre “Todos son desarrolladores”, que describió un mundo que ya no se limita a las habilidades de codificación. sino una era donde el lenguaje natural se utiliza como medio y todos pueden participar en la creación.

El lanzamiento de la versión de la herramienta Wenxin Large Model 4.0 de Baidu ha acercado la visión descrita por Robin Li a la realidad. Esta herramienta no solo permite a los desarrolladores procesar datos y archivos complejos a través de la interacción del lenguaje natural, sino que también puede generar gráficos o archivos para obtener rápidamente información sobre las características de los datos, analizar tendencias cambiantes y brindar soporte eficiente y preciso para la toma de decisiones posterior. .

Al mismo tiempo, Robin Li lanzó tres herramientas de desarrollo importantes en el discurso de apertura, incluida la herramienta de desarrollo de agentes AgentBuilder, la herramienta de desarrollo de aplicaciones nativas de IA AppBuilder y la herramienta de personalización de modelos ModelBuilder. Estas herramientas han reducido significativamente el umbral de desarrollo, lo que permite a los desarrolladores crear aplicaciones de IA potentes, fáciles de usar y convenientes en tan solo unos sencillos pasos.

Fuente de la imagen: Baidu

Robin Li señaló: "Los agentes inteligentes pueden ser la forma más cercana y generalizada de utilizar modelos grandes para todos en el futuro. Basados en potentes modelos básicos, los agentes inteligentes se pueden generar en lotes y aplicarse en varios escenarios. Baidu acaba de actualizar Wenxin Inteligencia Hasta ahora se han creado más de 30.000 agentes, más de 50.000 desarrolladores y decenas de miles de empresas se han decidido por ella”.

En opinión de Robin Li, desarrollar aplicaciones en el futuro será tan fácil como grabar un vídeo corto. Todos tienen la posibilidad de convertirse en desarrolladores y todos son creadores. "Hoy en día, puedes crear una aplicación sin saber escribir código; puedes crear un agente inteligente sin programación. La IA está desencadenando una revolución en la creatividad. En el futuro, desarrollar aplicaciones será tan fácil como hacer un vídeo corto, y todos pueden. Todos somos desarrolladores, todos somos creadores”.

En su discurso, Robin Li compartió las ideas y herramientas específicas que Baidu implementó el año pasado para desarrollar aplicaciones nativas de IA. Enfatizó: "Los modelos de lenguajes grandes en sí mismos no crean valor directamente. Sólo las aplicaciones de IA desarrolladas en base a modelos grandes pueden satisfacer las necesidades reales del mercado. Lo que quiero compartir con ustedes hoy son algunas ideas y herramientas específicas para desarrollar aplicaciones nativas de IA basadas en grandes “Esto es lo que hemos ganado en Baidu al atravesar innumerables obstáculos y pagar altas tasas de matrícula según nuestra práctica durante el año pasado”.

La siguiente es la transcripción del discurso de apertura de Robin Li sobre “Todos somos desarrolladores”, compilado por Geek Park.

Hola a todos, bienvenidos a la Conferencia de desarrolladores de IA de Baidu Create 2024. Esta es la primera vez que la conferencia Create se lleva a cabo en el área de la Gran Bahía de Guangdong-Hong Kong-Macao. Más de 5.000 desarrolladores y entusiastas de la tecnología asistieron hoy al evento.

El año pasado, me comuniqué con muchos emprendedores y desarrolladores y sentí que todos estaban en un estado de “FOMO”, que es el miedo a perderse algo. De hecho, los modelos grandes y la IA generativa cambiarán por completo la comunidad de desarrolladores.

En el pasado, los desarrolladores usaban código para cambiar el mundo; en el futuro, el lenguaje natural se convertirá en el nuevo lenguaje de programación universal. Mientras puedas hablar, podrás convertirte en desarrollador y usar tu creatividad para cambiar el mundo.

Este día no está lejos. Hemos visto que con el poderoso modelo básico grande y muchas herramientas de desarrollo de umbral bajo o incluso de umbral cero, la productividad de los desarrolladores ha mejorado enormemente.

Por ejemplo, Comate, un asistente de código inteligente basado en el modelo grande de Wenxin, no solo admite más de 100 idiomas y todas las plataformas IDE principales, sino que también puede recomendar códigos, generar comentarios de código, encontrar defectos de código y proporcionar soluciones de optimización. También puede interpretar en profundidad la biblioteca de códigos y correlacionar el conocimiento del dominio privado para generar código nuevo. Después de más de un año de empleo, Comate ha sido utilizado por decenas de miles de empresas como Himalaya, Mitsubishi Elevator, iSoftStone, etc., y la tasa de adopción del código generado ha alcanzado el 46% de los códigos agregados por Baidu cada vez. día, el 27% ha sido generado por Comate de.

Hoy en día, puedes crear una aplicación de IA sin escribir código; puedes crear un agente inteligente sin programación. La IA está desencadenando una revolución en la creatividad. En el futuro, desarrollar aplicaciones será tan fácil como hacer un vídeo corto. Todo el mundo es desarrollador y todo el mundo es creador.

Como empresa de tecnología, el papel de Baidu es proporcionar a todos las herramientas de desarrollo que necesitan tanto como sea posible para mejorar continuamente la creatividad de toda la sociedad. Específicamente, ofrecemos una poderosa serie de modelos básicos, que es la serie de modelos grandes de Wenxin, que incluye las versiones insignia de ERNIE3.5, ERNIE4.0 y las versiones livianas de ERNIE Speed, Lite, Tiny, etc.

También proporcionamos herramientas para desarrollar diversas aplicaciones basadas en modelos grandes, incluida la herramienta de desarrollo de agentes AgentBuilder, la herramienta de desarrollo de aplicaciones nativas de IA AppBuilder y la herramienta de personalización de modelos ModelBuilder de varios tamaños. Estas tres herramientas representan una productividad avanzada. A continuación te los mostraré uno por uno.

Wenxin Yiyan tiene más de 200 millones de usuarios y se lanza la versión de la herramienta Wenxin Big Model 4.0

Primero, hablemos del último progreso de Wen Xin Yi Yan y Wen Xin Big Model:

Ha pasado un año y un mes desde que Wen Xin Yiyan fue liberado el 16 de marzo del año pasado. Nuestro número de usuarios superó los 200 millones, el promedio de llamadas API diarias también superó los 200 millones, el número de clientes a los que atendemos alcanzó los 85 000 y el número de aplicaciones nativas de IA desarrolladas utilizando la plataforma Qianfan superó las 190 000.

Veamos, ¿qué están haciendo todos con Wen Xinyiyan?

Las personas reales que aparecen en el vídeo son sólo la punta del iceberg. Podemos ver que Wen Xinyiyan está cambiando el trabajo y la vida de más personas.

El modelo base que respalda las palabras de Wen Xin es el modelo grande de Wen Xin. El año pasado, evolucionó de la versión 3.0 a la 3.5 y luego a la versión 4.0. Wenxin 4.0 ha alcanzado el nivel líder en la industria en términos de cuatro capacidades principales: comprensión, generación, lógica y memoria.

En los últimos meses, Wenxin Big Model ha logrado mejoras significativas en capacidades generales como generación de código, interpretación de código y optimización de código, alcanzando niveles líderes a nivel internacional.

Hoy lanzamos oficialmente la versión de la herramienta Wenxin Big Model 4.0. Ahora puede experimentar la función de intérprete de código en la versión de la herramienta a través de la interacción del lenguaje natural, puede procesar y analizar datos y archivos complejos, y también puede generar gráficos o. Los archivos pueden obtener rápidamente información sobre las características de los datos, analizar tendencias cambiantes y proporcionar soporte eficiente y preciso para la toma de decisiones posterior.

El modelo grande de Wenxin se ha convertido en el modelo básico de IA más líder y más utilizado de China.

No solo eso, en comparación con hace un año, la eficiencia del entrenamiento del algoritmo del modelo grande de Wenxin ha aumentado a 5,1 veces, la eficiencia del entrenamiento semanal promedio ha alcanzado el 98,8%, el rendimiento de la inferencia ha aumentado 105 veces y el costo de la inferencia ha aumentado. cayó al 1% del original.

En otras palabras, el cliente originalmente llamaba 10.000 veces al día, pero ahora puede llamar 1 millón de veces al mismo costo. Los medios probablemente no estarán entusiasmados con una reducción de costos del 99%. Pero ya sea una empresa o un desarrollador, una vez que se utiliza, lo más importante es el efecto y el costo.

Podemos mejorar el rendimiento y al mismo tiempo reducir los costos de inferencia al 1% precisamente porque Baidu tiene un diseño de pila completa en la arquitectura de cuatro capas de chips, marcos, modelos y aplicaciones. A través de la optimización de un extremo a otro, continuamos reduciendo costos. Esto permitirá que más personas utilicen modelos grandes para crear aplicaciones de IA de manera eficiente y a bajo costo.

No hay duda de que los temas relacionados con los modelos grandes seguirán siendo candentes en 2024 y seguirán surgiendo diversos avances tecnológicos. Los medios seguirán interesados en utilizar títulos como “lanzamiento impactante” y “actualización épica” para presentarlo. Pero lo que quiero enfatizar es que los modelos grandes en sí no crean valor directamente. Sólo las aplicaciones de IA desarrolladas a partir de modelos grandes pueden satisfacer las necesidades reales del mercado.

Comparta ideas y herramientas específicas para desarrollar aplicaciones nativas de IA: “He superado innumerables obstáculos y he pagado matrículas elevadas”.

Lo que quiero compartir con ustedes hoy son algunas ideas y herramientas específicas para desarrollar aplicaciones nativas de IA basadas en modelos grandes. Esto es lo que hemos ganado en Baidu gracias a nuestra práctica durante el año pasado, sorteando innumerables obstáculos y pagando altas tasas de matrícula.

El primero es el Ministerio de Educación. En el futuro, las aplicaciones nativas de IA a gran escala utilizarán básicamente la arquitectura MoE. El MoE mencionado aquí no es un concepto académico general, sino una mezcla de modelos grandes y pequeños, sin depender de un solo modelo para resolver todos los problemas. Pero cuándo llamar a un modelo pequeño, cuándo llamar a un modelo grande y cuándo no llamar a un modelo, todos tienen contenido técnico y deben combinarse de acuerdo con diferentes escenarios de aplicación.

El segundo es el modelo pequeño. Los modelos pequeños tienen costos de inferencia bajos y tiempos de respuesta rápidos. En algunos escenarios específicos, el rendimiento de un modelo pequeño ajustado por SFT puede ser comparable al de un modelo grande. Por eso lanzamos tres modelos livianos: Speed, Lite y Tiny. Comprimimos y destilamos un modelo grande para crear un modelo básico y luego usamos los datos para entrenar. Esto es mucho mejor que entrenar un modelo pequeño desde cero. Es mejor, más rápido y más económico que un modelo entrenado basado en código abierto. modelo. .

El tercero es el agente inteligente. Los agentes inteligentes son un tema candente en este momento. A medida que mejoren las capacidades de los agentes inteligentes, seguirán surgiendo una gran cantidad de nuevas aplicaciones. El mecanismo del agente inteligente incluye comprensión, planificación, reflexión y evolución. Permite que las máquinas piensen y actúen como humanos. Pueden completar tareas complejas de forma autónoma, continuar aprendiendo en el entorno y realizar la autoiteración y la evolución. En algunos sistemas complejos, también podemos permitir que diferentes agentes interactúen y colaboren entre sí para completar tareas con mayor calidad. Hemos desarrollado estas capacidades de agente y estamos completamente abiertos a los desarrolladores.

En las tres direcciones: MoE, modelos pequeños y agentes, Baidu ha proporcionado herramientas “listas para usar” para todos. A continuación, les presentaré tres herramientas diferentes, a saber: la herramienta de desarrollo de agentes AgentBuilder, la herramienta de desarrollo de aplicaciones nativas de IA AppBuilder y la herramienta de personalización de modelos de varios tamaños ModelBuilder.

Herramienta de desarrollo de agentes AgentBuilder

La primera es la herramienta de desarrollo de agentes AgentBuilder. Los agentes pueden ser la forma más cercana y convencional de utilizar modelos grandes para todos en el futuro. Basados en potentes modelos básicos, los agentes se pueden generar en lotes y aplicarse en una variedad de escenarios.

Baidu acaba de actualizar su plataforma de agentes inteligentes Wenxin. Hasta el momento se han creado más de 30.000 agentes, se han instalado más de 50.000 desarrolladores y decenas de miles de empresas. Nuestro objetivo es permitir que todos y todas las organizaciones se conviertan en desarrolladores de agentes inteligentes y creen el ecosistema de agentes inteligentes más completo de China.

Entonces, ¿cómo lograr este objetivo? Su objetivo es proporcionar a todos la herramienta de desarrollo de agentes de umbral cero AgentBuilder.

Primero tomemos la “Junta de Turismo de Singapur” como ejemplo para ver cómo se crea un agente inteligente.

Primero, abrimos la plataforma del agente Wenxin. La página de creación tiene dos modos: código cero y código bajo. Los principiantes pueden elegir directamente el “modo de código cero” y usar lenguaje natural para crear un agente en unas pocas oraciones.

Primero llamamos al agente “Junta de Turismo de Singapur” y luego especificamos en la configuración que necesitamos para crear planes de viaje, responder preguntas y brindar servicios de reserva de boletos de hotel. Estas configuraciones se utilizan para guiar al agente. .

Si solo se necesitan agentes básicos, la plataforma completará automáticamente el llenado. Pero esperamos que la “Junta de Turismo de Singapur” sea un agente inteligente profesional, por lo que se requiere una configuración avanzada. Puedo agregar entradas de la Enciclopedia de Singapur y enlaces a sitios web oficiales a la base de conocimientos y actualizarla todos los días. Luego agregue algunas herramientas, como consultas de hoteles, compra de boletos para atracciones, etc., para mejorar sus capacidades de servicio. En la actualidad, hemos cooperado con Ctrip para proporcionar herramientas de servicios de viajes, como hoteles, atracciones y emisión de boletos. De esta manera, queda listo un agente inteligente de la Junta de Turismo de Singapur, que se puede previsualizar y ajustar en mayor detalle.

Ahora abra la aplicación Baidu y busque “¿Cuándo habrá la menor cantidad de personas visitando Singapur?” porque todos quieren evitar las multitudes cuando viajan. El agente combinará información de múltiples fuentes para generar una respuesta: “Hay la menor cantidad de personas en enero-marzo”. También podemos hacer clic en el agente para interactuar más con él, como consejos para viajar a Singapur, recomendaciones para los tres mejores hoteles de Singapur, y también se puede utilizar para reservar entradas directamente para Universal Studios Singapore, una solución integral. a nuestras necesidades, lo que ahorra mucho dinero al usuario.

Además de Singapur, agentes inteligentes culturales y turísticos como Dalian y Shenyang también están en línea en la plataforma de agentes inteligentes de Wenxin. También hay varios agentes inteligentes para el conocimiento, la creación, el aprendizaje, el entretenimiento, etc., todos ellos utilizados por AgentBuilder. .

Cuando Wen Xinyiyan fue lanzado por primera vez el año pasado, dije que Wenxinyiyan afectaría a todas las empresas. Gracias a sus poderosas capacidades de comprensión, expresión y razonamiento del lenguaje natural, puede acercar a cualquier empresa a sus clientes.

Hoy en día, cada comerciante y cada cliente puede tener un agente inteligente exclusivo en Baidu. Todo el proceso no requiere programación alguna. Al ingresar información similar a palabras clave y ajustar unos simples pasos, se puede generar rápidamente un agente inteligente y convertirse en un vendedor de medalla de oro en línea las 24 horas del día, los 7 días de la semana.

Echemos un vistazo a cómo se forma un agente de inteligencia empresarial.

Kai Tak Education es una empresa educativa reconocida con más de 60 sucursales en todo el país y muchas sucursales en el extranjero. Cubre una amplia gama de países y tiene altos requisitos en cuanto a habilidades de recepción. ¿Cómo podemos responder a las consultas de los clientes las 24 horas del día, mejorar los niveles de recepción y reducir los costos operativos?

Kai Tak Education utiliza AgentBuilder de Baidu para crear su propio agente inteligente.

Echemos un vistazo a cómo crear un agente inteligente con capacidades básicas. Es muy simple: complete el avatar, el nombre, el ámbito comercial y el mensaje de bienvenida del agente en la plataforma, y luego configure cierta información que debe proporcionar el usuario, como la edad y la educación. En 5 minutos y con umbral cero, un agente inteligente está listo.

Kai Tak Education también espera que este agente sea un consultor de estudios en el extranjero que comprenda los negocios y los estudiantes. Puede realizar análisis profesionales y dar respuestas precisas basadas en las diferentes situaciones de los estudiantes, como si quieren ir a los Estados Unidos o Australia, si quieren una maestría o una licenciatura, qué puntajes obtuvieron en IELTS y TOEFL, etc. Podemos crear un agente inteligente más avanzado agregando varios módulos, como conocimientos, roles y herramientas.

En el módulo de conocimiento, cargue conocimientos de dominio privado y deje que la plataforma los analice en tiempo real y genere automáticamente materiales de diálogo. En el módulo de roles, agregue algunos países de estudio en el extranjero que no están dentro del alcance del negocio al esquema de filtrado, lo que puede mejorar; la eficiencia de pistas de usuario en el módulo de herramientas, añadiendo servicios como realizar reservas en la tienda; A través de estas pocas operaciones simples, un agente inteligente educativo Qi Tak con capacidades profesionales está listo.

Ahora, busquemos “Requisitos de solicitud para estudiar en Australia”. Puede ver que el agente proporciona rápidamente siete condiciones necesarias, como la capacidad lingüística requerida y la selección principal. También proporciona las correspondientes soluciones de consultoría de estudios en el extranjero para resolver todos los problemas. serán respondidas y todas las solicitudes serán respondidas.

Kai Tak Educational Intelligence es muy popular En la primera semana de su lanzamiento, se distribuyó con éxito 1,55 millones de veces e interactuó con los usuarios 58.000 veces. El número de conversiones de clientes potenciales aumentó linealmente, el costo de conversión de clientes potenciales efectivos se redujo significativamente y el costo de conversión de clientes potenciales efectivos se redujo significativamente. La eficiencia operativa mejoró enormemente.

A continuación, les presentaré un agente inteligente en la industria doméstica.

Sophia es una marca de muebles para el hogar que se centra en la personalización de toda la casa. Como se acaba de mostrar, también puede crear una inteligencia empresarial básica al completar información extremadamente simple. Pero para la industria de muebles para el hogar, la experiencia de los consumidores fuera de línea es más importante, por lo que Sophia espera crear una medalla de oro en las ventas en línea y restaurar la experiencia de recepción fuera de línea.

Por lo tanto, en otras configuraciones, seleccionó personas digitales como método de visualización en el módulo de roles, luego seleccionó fondos y voces apropiados para las personas digitales y, combinado con las capacidades de análisis inteligente de la plataforma, resumió automáticamente un conjunto de técnicas de ventas. Al final, creamos una vendedora con medalla de oro que es gentil, amable y profesional en sus habilidades para hablar. Puede satisfacer las diversas necesidades de los usuarios las 24 horas del día y brindar una experiencia de servicio de alto nivel.

Cuando un usuario de búsqueda de Baidu tiene una solicitud de decoración, el agente de Sophia utilizará la capacidad del modelo grande de Wenxin para dar la respuesta a la pregunta primero. Además, también confirmará de forma proactiva necesidades específicas con los clientes, como tipo de decoración, presupuesto, etc., y recomendará tiendas offline cercanas.

Desde el lanzamiento de Sophia Merchant Intelligence, los costes efectivos de los leads se han reducido en un 30%. En otras palabras, para conseguir un cliente efectivo, si antes el coste era de 100 yuanes, ahora sólo cuesta 70 yuanes.

Actualmente, más de 10.000 clientes de Baidu cuentan con inteligencia comercial, que cubre más de 30 industrias como educación y capacitación, bienes raíces y muebles, maquinaria y equipo, y servicios comerciales.

Arriba, a través de tres demostraciones, mostré cómo los desarrolladores y comerciantes pueden utilizar AgentBuilder para crear agentes inteligentes para diferentes industrias.

Ahora, crear un agente inteligente realmente sólo lleva unos minutos. ¡Pero aquí viene el problema! Si no hay tráfico, distribución, búsqueda y nadie lo utiliza, entonces los desarrolladores y comerciantes no tendrán ingresos. Sin ingresos, no habrá motivación. ¿Cómo solucionar este problema?

Nuestra plataforma de agentes Wenxin ofrece a los desarrolladores una forma de monetizar el tráfico. Además de Baidu Search, otros productos del ecosistema de Baidu, como Xiaodu, Maps, Tieba, Cheji, etc., se pueden conectar a las capacidades relevantes del agente inteligente, resolviendo las preocupaciones de distribución del tráfico para los desarrolladores y obteniendo información real. beneficios.

Si hay distribución, habrá retroalimentación de datos; con retroalimentación de datos, el volante girará y el agente inteligente podrá iterar de forma independiente, y cuanto más se use, más inteligente se volverá. La plataforma de agentes Wenxin también lanzó el análisis de datos del agente y los módulos de ajuste de preguntas y respuestas, y pronto se lanzarán más capacidades nuevas. La plataforma de agentes inteligentes de Wenxin impulsará a los agentes inteligentes a formar un ciclo positivo de mejor calidad, mejor tráfico y mayores ingresos a través del volante de datos de distribución-diagnóstico-ingresos.

AppBuilder: Puedes desarrollar una aplicación en tres pasos con lenguaje natural

A continuación, les presentaré la segunda herramienta de desarrollo, AppBuilder. Actualmente es la mejor herramienta de desarrollo de aplicaciones nativas de IA. En AppBuilder, hemos encapsulado y preestablecido varios componentes y marcos necesarios para desarrollar aplicaciones nativas de IA por adelantado, lo que reduce significativamente el umbral de desarrollo.

En solo tres pasos como máximo, los desarrolladores pueden desarrollar una aplicación nativa de IA utilizando lenguaje natural, y se puede lanzar e integrar fácilmente en diversos entornos empresariales. Veamos algunos casos:

A principios de este año, llevamos a cabo un desafío de desarrollo de aplicaciones nativas de IA. El tema del concurso era utilizar AppBuilder para crear un “asistente de planificación de colas en el patio de recreo” para ayudar a los turistas a comprender mejor la situación de las colas en el patio de recreo y diseñar rutas de juego personalizadas. la mejor experiencia de juego en un tiempo limitado.

El campeón de este concurso desarrolló una aplicación sin escribir una sola línea de código y ganó el gran premio de 100.000 yuanes proporcionado por Baidu. Si puede escribir código para este tema, no le resultará difícil escribir uno, pero si aún puede hacerlo sin escribir una línea de código, aún depende en gran medida del modelo básico y la capacidad de la herramienta AppBuilder.

Echemos un vistazo a cómo utilizar AppBuilder para crear esta aplicación de IA.

Repasemos primero las preguntas de la competencia. Se asume el tiempo de cola y el índice de estimulación de cada proyecto en “Universal Studios”, por lo que obtener la experiencia con el mayor índice de estimulación en un tiempo limitado es el problema a resolver en este número.

Primero, abra la interfaz de desarrollo de AppBuilder y nombre la aplicación “Playground Queuing Assistant”; segundo, describimos los requisitos específicos en las instrucciones de la función, incluida la llamada al intérprete de código, el cálculo de la mejor combinación dentro de un tiempo fijo, los resultados de salida, etc. ; El tercer paso es ir al componente de la herramienta y agregar el intérprete de código para ayudar con el cálculo.

Ahora, probemos el efecto. Ingrese la pregunta “Tengo 3 horas y media, ¿cuál es la forma más emocionante de jugar?” en el lado derecho. Puede ver que el intérprete de código traduce esta pregunta al código y luego llama. la herramienta de comprensión de datos. Analizar condiciones conocidas. Después de una serie de cálculos, se concluyó que los mejores resultados se lograrían combinando estos cuatro proyectos: “Harry Potter y el viaje prohibido”, “Jurassic Adventures”, “Decepticon Roller Coaster” y “Bumblebee Spinner”. Si no hay ningún problema con la prueba, haga clic en Publicar y se generará una aplicación sin código.

Ahora, AppBuilder se ha actualizado aún más. Durante el proceso de creación, todos pueden usar la función “Configuración optimizada de IA” para ayudar automáticamente a los desarrolladores a optimizar las instrucciones de roles, la configuración de componentes y otros aspectos, mejorando aún más la eficiencia del desarrollo.

Veamos otro ejemplo.

A principios de este año, la Universidad de Energía Eléctrica del Norte de China propuso que espera brindar servicios inteligentes y exclusivos a profesores y estudiantes de toda la escuela. Basado en AppBuilder de Baidu, creamos conjuntamente un Asistente de IA de Huadian. Ahora, déjame mostrarte cómo se crea el Asistente de IA de Huadian:

Paso 1: abra AppBuilder, ingrese a la página de creación y haga clic en AI para generar la configuración automáticamente. Primero, configure información básica como nombre, introducción, avatar, etc. para la aplicación.

Paso 2: Utilice lenguaje natural para describir requisitos específicos en las instrucciones de rol, incluidas tareas, capacidades de componentes, requisitos y limitaciones.

Paso 3: Inserte componentes personalizados, como consulta de préstamo de libros, consulta de horario de clases, consulta de desempeño de los estudiantes, etc., para que el asistente del campus pueda tener capacidades de servicio inteligentes. Luego agregue una declaración de apertura para Campus Assistant y la aplicación estará configurada.

A continuación, depuramos el asistente en la interfaz de vista previa según las preguntas de los usuarios. Por ejemplo, pregunte sobre el tiempo de inscripción para los exámenes CET-4 y CET-6 y pruebe el efecto de la llamada automática de cada componente.

Como puede ver, a través de estas sencillas operaciones, se completa la solicitud. En la actualidad, se ha lanzado en pruebas a pequeña escala y se ha conectado a escenarios de alta frecuencia como verificar el sistema, verificar cursos, recargar tarjetas de comida, pedir prestado libros, etc., y ha servido a la mayoría de profesores y estudiantes. en la escuela. En el futuro, trabajaremos con la Universidad de Energía Eléctrica del Norte de China para profundizar aún más la cooperación en aplicaciones y brindar servicios más abundantes y convenientes.

Baidu también tiene muchos años de acumulación de tecnología en modalidad cruzada. En AppBuilder, también brindamos ciertas capacidades intermodales. Solo necesita proporcionar un párrafo de texto o unas pocas oraciones para crear rápidamente aplicaciones de dibujo, como cómics, libros ilustrados para niños, etc.

El proceso también es muy simple: abra AppBuilder, haga clic para ingresar a “Creación de aplicaciones”, ingrese las instrucciones de la función, seleccione el componente “Agregar imagen de Vincent”, ingrese tres preguntas recomendadas y haga clic para publicar. Una vez completada la aplicación, solo necesitamos ingresar un personaje o trama aproximado, y AppBuilder puede generar automáticamente la historia y generar imágenes.

La última función inteligente de generación de cómics y libros ilustrados de Baidu Wenku utiliza dichos componentes proporcionados en AppBuilder. Echemos un vistazo a cómo la función de generación de cómics de Baidu Wenku permite que cualquiera que tenga ideas creativas produzca buenas obras.

Tomemos como ejemplo el clásico “Zhou Chu elimina tres males”.

Abra la biblioteca de Baidu e ingrese al tema “Zhou Chu elimina tres males”. Esto está escrito en “Libro de Jin” y “Shishuoxinyu”. Después de buscar en la biblioteca, la historia se generará según el texto original. el contenido de la historia. Haz modificaciones; luego haz clic en la barra de herramientas de IA a la derecha para comenzar a crear este cómic.

Ingrese a la interfaz de producción de cómics y Wenku generará automáticamente guiones gráficos de cómics según la historia; luego, elegirá el estilo de cómic que mejor se adapte a la historia entre varios estilos, como luces y sombras, realismo, dibujos animados, etc.; personajes según los personajes, por lo que se completa la generación del cómic.

Una vez generado el cómic, podemos explorar el cómic completo en el editor de cómics inteligente de Baidu Wenku. Al mismo tiempo, la biblioteca admite la edición, modificación y ajuste de cada imagen. Por ejemplo, seleccione la imagen “Zhou Chu y el tigre de frente blanca” a la izquierda, haga clic en Editar y agregue la descripción de la imagen “La cara del personaje es”. claro, la imagen es brillante", y puedes ajustarla. Consulta los cómics que mejor se adapten a tus necesidades. Como puede ver, la función cómica de Baidu Wenku hace un excelente trabajo en términos de coherencia estilística de personajes y escenas.

Las capacidades inteligentes de creación de cómics de Baidu Wenku han mejorado enormemente la eficiencia de la creación de cómics, han reducido el costo y el umbral de la creación de cómics y han permitido que personas más reflexivas y creativas hagan realidad sus sueños de creación de cómics.

Además de generar cómics, Baidu Wenku ahora puede ayudar a los usuarios a crear libros ilustrados con un umbral cero. Quizás no sepas que los niños chinos leen sólo 10 libros ilustrados al año per cápita, mientras que en los países europeos y americanos son unos 50. Ahora, la IA puede permitir a los padres que no tienen capacidad de dibujo crear un libro ilustrado infantil exclusivo para sus hijos. ¡Echemos un vistazo a este audiolibro ilustrado!

Desde el año pasado, hemos utilizado IA para reconstruir Baidu Wenku, convirtiéndolo en el “punto de partida para la producción de contenido” para los usuarios. Ahora, con el apoyo de AppBuilder, los cómics inteligentes y las funciones de libros ilustrados inteligentes recientemente lanzados por Baidu Wenku han extendido la escena a campos de creación intermodal más interesantes.

Solo usé tres casos para mostrar cómo usar AppBuilder de Baidu para crear aplicaciones nativas de IA. Todos deberían poder sentir las dos ventajas obvias de AppBuilder:

Primero, es poderoso. Confiando en la capacidad de Wenxin 4.0 para comprender y seguir instrucciones, nuestro AppBuilder puede garantizar que un arranque en frío pueda alcanzar un buen nivel. Debido al bajo rendimiento, el ajuste no llevará mucho tiempo, lo que reduce considerablemente el umbral de desarrollo. Basándonos en la tecnología de mejora de búsqueda RAG, en escenarios típicos como preguntas y respuestas sobre conocimientos, nuestra tasa de precisión de preguntas y respuestas y nuestro nivel de respuesta amigable han alcanzado más del 95%, superando significativamente a otros productos similares. AppBuilder también proporciona un conjunto rico y completo de herramientas de componentes, que incluyen 55 componentes, como la búsqueda de Baidu y otros componentes de capacidad de inteligencia artificial basados en los años de acumulación de tecnología de Baidu, componentes de capacidad de modelos grandes y componentes comerciales abiertos exclusivos de Baidu. Además de API de terceros para algunos escenarios principales, como consultas de vuelos, consultas en papel, etc. También acabamos de admitir componentes personalizados, para que los clientes puedan conectar directamente cualquiera de sus propias herramientas y datos. Estos ricos componentes respaldan conjuntamente el desarrollo eficiente de aplicaciones nativas de IA.

En segundo lugar, es simple y fácil de usar. Con AppBuilder, puede crear aplicaciones rápidamente en tres pasos y distribuirlas con un solo clic. También admitimos SDK de código abierto para facilitar el desarrollo secundario.

Herramienta de personalización de modelos ModelBuilder: producción de modelos eficiente y de bajo coste

A continuación, presentaré una herramienta que es más adecuada para desarrolladores profesionales, que es ModelBuilder. Puede personalizar modelos de cualquier tamaño según las necesidades de los desarrolladores y ajustar aún más SFT en función de escenarios subdivididos, para que se puedan obtener mejores resultados. Efecto logrado. Para los desarrolladores, una cosa muy importante para hacer un buen uso de los modelos grandes es dominar el método de ajuste fino del modelo.

Tomemos como ejemplo el escenario de corrección de ensayos en la industria de la educación. Porque la corrección de composición tiene estándares de puntuación claros y los diferentes grados tienen diferentes requisitos de composición y estándares de puntuación. Esto requiere un ajuste fino del modelo para que los resultados de salida del modelo grande sean más consistentes con los requisitos específicos.

Echemos un vistazo a cómo ModelBuilder implementa el ajuste de modelos para la corrección de ensayos.

Paso 1: crea un conjunto de datos. La eficacia del ajuste del modelo depende en gran medida de la calidad de nuestros datos. En este caso, los datos originales solo tienen 180 elementos y la calidad no es lo suficientemente alta. Necesitamos utilizar tres funciones: limpieza de datos, anotación de datos y mejora de datos. La limpieza de datos puede eliminar rápidamente lagunas de datos, caracteres confusos y otros problemas. En términos de anotación de datos, hemos agregado más dimensiones a la composición, como profundidad del contenido, técnicas de escritura y otras evaluaciones. La función de mejora de datos puede generar datos similares pero no duplicados para la expansión de datos. Después de la expansión, ModelBuilder generó 920 datos de alta calidad para nosotros.

El segundo paso es entrar en la etapa de ajuste del modelo. Primero, debemos elegir un modelo base para realizar un ajuste fino. Aquí elegimos ERNIE Speed como modelo base. Luego, configuramos los parámetros de acuerdo con los valores recomendados por la plataforma. Esta vez los datos están cerca de 1000 según las rondas de iteración recomendadas, la configuración es de 10 rondas y luego el modelo puede comenzar a entrenar.

Paso 3: implemente el modelo en la plataforma y se completará todo el proceso de ajuste.

Usemos un ensayo de la escuela secundaria para probar el efecto del modelo ajustado. El título del ensayo es “Con ganas de crecer”, no hay límite de tema y no debe tener menos de 800 palabras.

Introducimos los requisitos de formato de corrección y composición de un estudiante en dos modelos antes y después del ajuste. Echemos un vistazo a la comparación entre los dos modelos y los comentarios del profesor. Se puede ver que el modelo grande ajustado tiene un pensamiento de comentario de docente más profesional y un mejor cumplimiento del formato. Las tareas de corrección de ensayos que originalmente tomaban mucho tiempo para que los profesores las completaran ahora se pueden completar rápidamente con la ayuda de modelos grandes en unos pocos segundos, lo que mejora en gran medida la velocidad y la eficiencia de la retroalimentación a los estudiantes. Actualmente, este tipo de modelo perfeccionado se ha utilizado en muchas empresas líderes del sector educativo.

Mencioné anteriormente que las aplicaciones nativas de IA a gran escala generalmente son MoE. Entonces, ¿cómo combinar estos modelos para conseguir la mejor relación calidad-precio? A continuación, utilizaré Xiaodu para mostrar un caso de enrutamiento del modelo MoE. Primero echemos un vistazo a si Xiaodu se ha vuelto más inteligente con la bendición del gran modelo:

Robin: Xiaodu Xiaodu

Xiaodu: aquí estás

Robin: ¿Cuál es la noticia hoy?

Xiaodu: Xiaodu transmite de 3 a 5 noticias de última hora del día

Robin: Xiaodu Xiaodu. ¿Escuché que te has vuelto más capaz recientemente? Xiaodu: No solo puedo chatear contigo, también puedo ser tu asistente de programación de IA.

Robin: Entonces voy a ponerte a prueba. Por favor ayúdenme a organizar mi agenda. Después del evento de hoy, cenaré con el Sr. Zhang y luego habrá una reunión de administración en el hotel, que durará aproximadamente una hora y media. Espero que termine antes de las 10 en punto. 'reloj. Mañana por la mañana saldré a correr y veré cómo está el clima. Luego tengo una reunión a las 8 am. Por favor, ayúdenme a organizar mi horario.

Xiaodu: Según sus necesidades, Xiaodu creará el horario óptimo para usted de la siguiente manera:

Su cena con el Sr. Zhang está programada de 18:00 a 19:30. Después, asistirá a la reunión de gestión a las 20:00 y finalizará alrededor de las 21:30.

El despertador le recordará que se levante a las 6 en punto mañana por la mañana y salga a correr por la mañana. El tiempo de ejecución debe controlarse dentro de 1 hora para asegurarse de que no llegue tarde a la reunión de la mañana a las 8 en punto mañana por la mañana. .

Mañana por la mañana estará soleado con una temperatura de 25 grados. Se recomienda usar manga corta al salir y usar protección solar.

¿Crees que puedo ser tu secretaria? Tengo más habilidades nuevas.

Robin: Muy bien, genial (aprobado por Xiaodu), sincroniza estos horarios con mi teléfono móvil.

Hace un momento le hice varias preguntas a Xiaodu, que van desde simples consultas de noticias hasta complejas necesidades de programación. Parece que nos estamos comunicando con el mismo Xiaodu, pero de hecho, detrás de él se llaman diferentes modelos. Cuando recibió mi pregunta, primero realizó el trabajo de “enrutamiento del modelo” en el modelo pequeño ERNIE Tiny para el problema climático, y llamó al modelo ajustado basado en ERNIE Lite según los resultados de la consulta climática; procesado por ERNIE Lite de SFT, ofrece sugerencias de vestimenta para horarios más complejos, Wenxin 4.0, el modelo grande de mejor rendimiento, se utiliza para calcular varios arreglos desde esta noche hasta mañana por la mañana.

Hoy, cada pregunta que le hagamos a Xiaodu se asignará a diferentes modelos para su ejecución. Al llamar a la interfaz API de la aplicación, se utilizará el modelo de funciones ERNIE. Al explicar las preguntas a los niños, se utilizará Wenxin Big Model 3.5 o 4.0. Inteligente El asistente se creó utilizando el modelo de personaje de ERNIE para mejorar la consistencia del personaje y estimular el deseo de los usuarios de chatear.

A través de este método de programación combinado de modelos grandes y pequeños, Xiaodu no solo completó con éxito la “operación de reemplazo del cerebro” e instaló el nuevo sistema operativo nativo de IA DuerOS X, sino que también formó la combinación óptima de efecto, velocidad y costo en comparación con todos los usos. la versión insignia de Wenxin Large Model, la velocidad de respuesta aumenta 2 veces y el costo se reduce en un 99%. La tableta robot con inteligencia artificial Xiaodu Tiantian con la que estaba hablando salió ayer a la venta en todas las plataformas principales. Los amigos interesados pueden realizar un pedido de inmediato para experimentarlo.

Estos ejemplos de ModelBuilder demuestran la capacidad de Baidu para producir modelos de manera eficiente y a precios bajos. Gracias al modelo básico más potente, Wenxin 4.0, podemos adaptar modelos más pequeños adecuados para diversos escenarios según las necesidades, teniendo en cuenta diversas consideraciones como el efecto, la velocidad de respuesta y el costo de inferencia, y admitir el ajuste fino y el preentrenamiento posterior. De esta manera, el modelo recortado mediante reducción de dimensionalidad es significativamente mejor que el modelo ajustado directamente desde la fuente. Con el mismo tamaño, el efecto es obviamente mejor y el costo es obviamente menor con el mismo efecto. La gente solía usar el código abierto y pensaba que era barato. De hecho, en escenarios de modelos grandes, el código abierto es el más caro. Por lo tanto, el modelo de código abierto se quedará cada vez más atrás.

Para que a todos les resulte más fácil comenzar rápidamente, ModelBuilder ha preestablecido los modelos grandes más completos y completos. Incluye ERNIE3.5 y ERNIE4.0, que son los modelos grandes emblemáticos, que son adecuados para escenas generales complejas y tienen capacidades potentes. También hay tres modelos grandes y livianos, ERNIE Speed, Lite y Tiny, y hay dos más; Como modelo para escenas verticales, ERNIE Character es adecuado para juegos de rol; ERNIE Functions es adecuado para el uso de herramientas externas y llamadas a funciones comerciales en escenarios de diálogo o preguntas y respuestas. Por supuesto, ModelBuilder también admite modelos convencionales de terceros nacionales y extranjeros, con un total de 77, lo que la convierte en la plataforma de desarrollo con la mayor cantidad de modelos grandes en China.

Se lanza oficialmente el segundo concurso de emprendimiento “Copa Wenxin”: se establece un gran premio especial de NT $ 50 millones

Para los desarrolladores, además de proporcionar estas herramientas de desarrollo, también brindamos soporte financiero y de recursos.

En mayo del año pasado, Baidu lanzó el Concurso de Emprendimiento “Copa Wenxin”, con la esperanza de promover la prosperidad del gran ecosistema modelo, crear un ecosistema más dinámico y ayudar a emprendedores y desarrolladores a desarrollar diversas aplicaciones nativas de IA. Para la primera competencia empresarial “Copa Wenxin”, recibimos casi 1000 inscripciones de equipos empresariales. Baidu proporcionó casi 100 millones de yuanes en apoyo de inversión a 15 de los equipos ganadores y continuó brindando tecnología, equipo y recursos integrales.

Hoy anuncio que se lanzó oficialmente el segundo Concurso de Emprendimiento “Copa Wenxin”. Esta vez ampliaremos el alcance de la selección de proyectos, estableceremos subcampos, nos dirigiremos al mercado global y a los estudiantes universitarios, y reclutaremos equipos de innovación empresarial. Siempre que su dirección empresarial sean aplicaciones nativas de IA, puede registrarse en el sitio web oficial de. la competencia. Al mismo tiempo, también hemos aumentado nuestro apoyo a los empresarios, proporcionando fondos de inversión más suficientes y recursos comerciales más ricos. También hemos creado un “Premio Especial” que por primera vez tendrá la oportunidad de recibir hasta 50 proyectos especialmente destacados. millones de yuanes en efectivo y apoyo de recursos.

Los empresarios y desarrolladores chinos son muy buenos utilizando nuevas tecnologías para desarrollar aplicaciones. Creo que Wenxin Big Model se convertirá en la primera opción para los empresarios y desarrolladores de IA chinos, y cada vez se crearán más aplicaciones en Wenxin Big Model. También espero que más emprendedores y desarrolladores se unan a nosotros para construir un ecosistema de IA próspero.

El escenario de aplicación más amplio de grandes modelos visuales es la conducción autónoma.

La mayoría de las herramientas y casos de los que hablamos anteriormente se basan en modelos de lenguaje grandes. De cara al futuro, creo que los grandes modelos multimodales, o la fusión de texto, imágenes, voz, video y otros modos multimodales, son una dirección de desarrollo a largo plazo muy importante para los modelos básicos y el único camino hacia AGI. Baidu tiene inversiones a largo plazo en estas áreas y actualizará el progreso tecnológico de manera oportuna.

Mi opinión es muy diferente: el escenario de aplicación más importante de los grandes modelos visuales es la conducción autónoma. Baidu es el mejor en esta dirección y es el líder mundial en conducción autónoma. No solo entrenamos a la IA para generar videos, sino que también la entrenamos para comprender lo que está sucediendo en el mundo real y predecir el futuro.

Basándose en más de 100 millones de kilómetros de datos de kilometraje de pruebas en carretera en las complejas ciudades de China, Baidu entrenó el gran modelo de percepción visual Apollo. Tiene cuatro capacidades básicas: detección, seguimiento, comprensión y mapeo. Esto le da a Baidu una solución de conducción autónoma más inteligente, adaptable y segura.

Baidu Maps también tomó la iniciativa en la aplicación de modelos de percepción visual a gran escala al campo de la cartografía. Ahora, se han lanzado los datos de mapas a nivel de carril más grandes del mundo en 360 ciudades de todo el país. Mientras la navegación por mapas de Baidu pueda funcionar, la conducción inteligente podrá conducir.

Después del Festival de Primavera de este año, Carrot Run de Baidu completó el “primer tramo” del río Yangtze. Hemos ampliado nuestros servicios desde la orilla norte hasta la orilla sur del río Yangtze. En algunas áreas de Wuhan, hemos logrado servicios 24 horas al día, 7 días a la semana. -Operación climática, y planeamos hacerlo dentro del año en que Wuhan despliegue 1.000 vehículos sin conductor.

Este es un evento histórico para que la conducción autónoma se comercialice verdaderamente. Ya no es solo una demostración regional, sino que ha entrado en una nueva etapa de demostración de aplicaciones a nivel de ciudad. Luobo Kuaipao cubre más de 3.000 kilómetros cuadrados y una población de 7,7 millones en Wuhan, lo que la convierte en el área de operación de conducción autónoma más grande del mundo.

“Empacalo y llévatelo, úsalo cuando quieras”.

Hace un momento les mostré la gran serie de modelos de Baidu Wenxin y tres herramientas de desarrollo: AgentBuilder, AppBuilder y ModelBuilder. Forman una caja de herramientas que puede llevarse inmediatamente y usar en cualquier momento.

En este momento estoy aquí. En realidad soy un desarrollador y un emprendedor, y estoy tan emocionado como todos los demás. Hoy en día, China tiene mil millones de usuarios de Internet, un modelo básico sólido a gran escala, suficientes escenarios de aplicación de IA y el sistema industrial más completo del mundo. El país también está fomentando y apoyando vigorosamente la acción de “inteligencia artificial +”. cada empresa sólo necesita hacer un uso completo de estas herramientas para liberar creatividad y productividad ilimitadas.

Hoy en día, cualquiera puede convertirse en desarrollador. Y el futuro definitivamente será un futuro creado por los desarrolladores juntos.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Gate Fun en tendencia

    Ver más
  • Cap.M.:$3.58KHolders:2
    0.14%
  • Cap.M.:$3.52KHolders:1
    0.00%
  • Cap.M.:$3.52KHolders:1
    0.00%
  • Cap.M.:$3.52KHolders:1
    0.00%
  • Cap.M.:$3.51KHolders:1
    0.00%
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)