Discours de Robin Li à la Baidu AI Developer Conference : Après avoir marché sur d'innombrables pièges, que savait Baidu ?

ForesightNews

2024-04-18 06:56:08

Tant que vous savez parler, vous pouvez devenir développeur.

Écrit par : Lian Ran

Éditeur : Zheng Xuan

Source : Geek Park

“Le langage naturel deviendra la prochaine génération de langage de programmation, et tout le monde peut devenir développeur.”

Le 16 avril, la conférence des développeurs Baidu AI Create 2024 s’est tenue à Shenzhen. Le fondateur, président et PDG de Baidu, Robin Li, a prononcé un discours sur « Tout le monde est un développeur », décrivant un monde qui ne se limite plus au monde du codage. mais une époque où le langage naturel est utilisé comme médium et où chacun peut participer à la création.

La sortie de la version de l’outil Wenxin Large Model 4.0 de Baidu a rapproché la vision décrite par Robin Li de la réalité. Cet outil permet non seulement aux développeurs de traiter des données et des fichiers complexes via une interaction en langage naturel, mais peut également générer des graphiques ou des fichiers pour obtenir rapidement un aperçu des caractéristiques des données, analyser l’évolution des tendances et fournir une assistance efficace et précise pour la prise de décision ultérieure. .

Dans le même temps, Robin Li a publié trois outils de développement majeurs lors du discours d’ouverture, notamment l’outil de développement d’agents AgentBuilder, l’outil de développement d’applications natives d’IA AppBuilder et l’outil de personnalisation de modèles ModelBuilder. Ces outils ont considérablement abaissé le seuil de développement, permettant aux développeurs de créer des applications d’IA puissantes, faciles à utiliser et pratiques en quelques étapes simples.

Source de l’image : Baidu

Robin Li a souligné : « Les agents intelligents pourraient être le moyen le plus proche et le plus courant d’utiliser de grands modèles pour tout le monde à l’avenir. Basés sur des modèles de base puissants, les agents intelligents peuvent être générés par lots et appliqués dans divers scénarios. Baidu vient de mettre à niveau Wenxin. Intelligence Jusqu’à présent, plus de 30 000 agents ont été créés, plus de 50 000 développeurs et des dizaines de milliers d’entreprises y ont opté.

Selon Robin Li, développer des applications à l’avenir sera aussi simple que de tourner une courte vidéo. Tout le monde a la possibilité de devenir développeur et tout le monde est créateur. "Aujourd’hui, vous pouvez créer une application sans savoir écrire du code ; vous pouvez créer un agent intelligent sans programmation. L’IA déclenche une révolution dans la créativité. À l’avenir, développer des applications sera aussi simple que de réaliser une courte vidéo, et tout le monde peut. Nous sommes tous des développeurs, tout le monde est un créateur.

Dans son discours, Robin Li a partagé les idées et les outils spécifiques que Baidu a mis en œuvre au cours de l’année écoulée pour développer des applications natives d’IA. Il a souligné : « Les grands modèles de langage en eux-mêmes ne créent pas directement de valeur. Seules les applications d’IA développées sur la base de grands modèles peuvent répondre aux besoins réels du marché. Ce que je souhaite partager avec vous aujourd’hui, ce sont quelques idées et outils spécifiques pour développer des applications natives d’IA basées sur de grands modèles. C’est ce que nous, chez Baidu, avons gagné en traversant d’innombrables pièges et en payant des frais de scolarité élevés en fonction de notre pratique au cours de l’année écoulée.

Ce qui suit est la transcription du discours d’ouverture de Robin Li sur “Tout le monde est un développeur”, compilé par Geek Park.

Bonjour à tous, bienvenue à la conférence des développeurs Baidu AI Create 2024. C’est la première fois que la conférence Create se tient dans la région de la Grande Baie Guangdong-Hong Kong-Macao. Plus de 5 000 développeurs et passionnés de technologie sont venus à l’événement aujourd’hui.

Au cours de la dernière année, j’ai communiqué avec de nombreux entrepreneurs et développeurs, et j’ai l’impression que tout le monde est dans un état de « FOMO », qui est la peur de rater quelque chose. Ils sont à la fois excités et effrayés de rater quelque chose. En effet, les grands modèles et l’IA générative vont complètement changer la communauté des développeurs.

Dans le passé, les développeurs utilisaient le code pour changer le monde ; à l’avenir, le langage naturel deviendra le nouveau langage de programmation universel. Tant que vous savez parler, vous pouvez devenir développeur et utiliser votre créativité pour changer le monde.

Ce jour n’est pas loin. Nous avons vu qu’avec le puissant grand modèle de base et de nombreux outils de développement à seuil bas, voire zéro, la productivité des développeurs a été grandement améliorée.

Par exemple, Comate, un assistant de code intelligent basé sur le grand modèle Wenxin, prend non seulement en charge plus de 100 langueset toutes les plates-formes IDE traditionnelles, mais peut également recommander des codes, générer des commentaires de code, rechercher des défauts de code et fournir des solutions d’optimisation. .Il peut également interpréter en profondeur la bibliothèque de codes et corréler les connaissances du domaine privé pour générer du nouveau code. Après plus d’un an d’emploi, Comate a été utilisé par des dizaines de milliers d’entreprises telles que Himalaya, Mitsubishi Elevator, iSoftStone, etc., et le taux d’adoption du code généré a atteint 46 % des codes ajoutés par Baidu chaque année. jour, 27% ont été générés par Comate de.

Aujourd’hui, vous pouvez créer une application d’IA sans écrire de code ; vous pouvez créer un agent intelligent sans programmation. L’IA déclenche une révolution dans la créativité. À l’avenir, développer des applications sera aussi simple que de réaliser une courte vidéo. Tout le monde est développeur et tout le monde est créateur.

En tant qu’entreprise technologique, le rôle de Baidu est de fournir à chacun les outils de développement dont il a besoin autant que possible pour améliorer continuellement la créativité de l’ensemble de la société. Plus précisément, nous proposons une puissante série de modèles de base, à savoir la grande série de modèles Wenxin, comprenant les versions phares d’ERNIE3.5, ERNIE4.0 et les versions légères d’ERNIE Speed, Lite, Tiny, etc.

Nous fournissons également des outils pour développer diverses applications basées sur de grands modèles, notamment l’outil de développement d’agents AgentBuilder, l’outil de développement d’applications natives d’IA AppBuilder et l’outil de personnalisation de modèles ModelBuilder de différentes tailles. Ces trois outils représentent tous une productivité avancée. Ci-dessous, je vais vous montrer un par un.

Wenxin Yiyan compte plus de 200 millions d’utilisateurs et la version de l’outil Wenxin Big Model 4.0 est publiée

Parlons d’abord des derniers progrès de Wen Xin Yi Yan et Wen Xin Big Model :

Cela fait un an et un mois depuis que Wen Xin Yiyan a été libéré le 16 mars de l’année dernière. Notre nombre d’utilisateurs a dépassé les 200 millions, le nombre moyen d’appels API quotidiens a également dépassé les 200 millions, le nombre de clients que nous servons a atteint 85 000 et le nombre d’applications natives d’IA développées à l’aide de la plateforme Qianfan a dépassé les 190 000.

Voyons, que fait tout le monde avec Wen Xinyiyan ?

Les vraies personnes dans la vidéo ne sont que la pointe de l’iceberg. Nous pouvons constater que Wen Xinyiyan change le travail et la vie d’un plus grand nombre de personnes.

Le modèle de base qui soutient les propos de Wen Xin est le grand modèle de Wen Xin. Au cours de la dernière année, il a évolué de la version 3.0 à la version 3.5 puis à la version 4.0. Wenxin 4.0 a atteint le niveau de pointe de l’industrie en termes de quatre capacités majeures : compréhension, génération, logique et mémoire.

Au cours des derniers mois, Wenxin Big Model a réalisé d’autres améliorations significatives dans ses capacités générales telles que la génération de code, l’interprétation et l’optimisation du code, atteignant ainsi des niveaux de premier plan au niveau international.

Aujourd’hui, nous avons officiellement publié la version de l’outil de Wenxin Big Model 4.0. Vous pouvez désormais découvrir la fonction d’interpréteur de code sur la version de l’outil, grâce à l’interaction en langage naturel, vous pouvez traiter et analyser des données et des fichiers complexes, et vous pouvez également générer des graphiques ou des graphiques. les fichiers peuvent rapidement obtenir un aperçu des caractéristiques des données, analyser les tendances changeantes et fournir une aide efficace et précise pour la prise de décision ultérieure.

Le grand modèle Wenxin est devenu le modèle de base d’IA le plus important et le plus largement utilisé en Chine.

Non seulement cela, par rapport à il y a un an, l’efficacité de la formation des algorithmes du grand modèle Wenxin a augmenté jusqu’à 5,1 fois, l’efficacité de la formation hebdomadaire moyenne a atteint 98,8 %, les performances d’inférence ont augmenté de 105 fois et le coût de l’inférence a augmenté. est tombé à 1% de l’original.

En d’autres termes, le client appelait initialement 10 000 fois par jour, mais peut désormais appeler 1 million de fois pour le même coût. Les médias ne seront probablement pas enthousiasmés par une réduction des coûts de 99 %. Mais qu’il s’agisse d’une entreprise ou d’un développeur, une fois utilisé, le plus important est l’effet et le coût.

Nous pouvons améliorer les performances tout en réduisant les coûts d’inférence à 1 % précisément parce que Baidu dispose d’une disposition complète dans l’architecture à quatre couches de puces, de frameworks, de modèles et d’applications. Grâce à une optimisation de bout en bout, nous continuons à réduire les coûts. Cela permettra à davantage de personnes d’utiliser de grands modèles pour créer des applications d’IA de manière efficace et à faible coût.

Nul doute que les sujets liés aux grands modèles seront encore d’actualité en 2024, et diverses avancées technologiques continueront d’émerger. Les médias continueront à utiliser des titres tels que « version choc » et « mise à jour épique » pour le rendre. Mais ce que je tiens à souligner, c’est que les grands modèles eux-mêmes ne créent pas directement de valeur. Seules les applications d’IA développées sur la base de grands modèles peuvent répondre aux besoins réels du marché.

Partagez des idées et des outils spécifiques pour développer des applications natives d’IA : “J’ai marché sur d’innombrables pièges et payé des frais de scolarité élevés.”

Ce que je souhaite partager avec vous aujourd’hui, ce sont quelques idées et outils spécifiques pour développer des applications natives d’IA basées sur de grands modèles. C’est ce que nous, chez Baidu, avons acquis grâce à notre pratique au cours de l’année écoulée, en surmontant d’innombrables pièges et en payant des frais de scolarité élevés.

Le premier est le ministère de l’Environnement. À l’avenir, les applications natives d’IA à grande échelle utiliseront essentiellement l’architecture MoE. Le MoE mentionné ici n’est pas un concept académique général, mais un mélange de grands et petits modèles, sans s’appuyer sur un seul modèle pour résoudre tous les problèmes. Mais quand appeler un petit modèle, quand appeler un grand modèle et quand ne pas appeler un modèle, tout cela a un contenu technique et doit être adapté en fonction de différents scénarios d’application.

Le second est le petit modèle. Les petits modèles ont de faibles coûts d’inférence et des temps de réponse rapides. Dans certains scénarios spécifiques, les performances d’un petit modèle affiné par SFT peuvent être comparables à celles d’un grand modèle. C’est pourquoi nous avons lancé trois modèles légers : Speed, Lite et Tiny. Nous compressons et distillons un grand modèle pour créer un modèle de base, puis utilisons les données pour nous entraîner. C’est bien mieux que de former un petit modèle à partir de zéro. C’est mieux, plus rapide et moins cher qu’un modèle formé sur une base open source. modèle. .

Le troisième est l’agent intelligent. Les agents intelligents sont un sujet brûlant à l’heure actuelle. À mesure que leurs capacités s’améliorent, un grand nombre de nouvelles applications continueront d’apparaître. Le mécanisme de l’agent intelligent comprend la compréhension, la planification, la réflexion et l’évolution. Il permet aux machines de penser et d’agir comme des humains. Elles peuvent effectuer des tâches complexes de manière autonome, continuer à apprendre dans l’environnement et réaliser elles-mêmes leur auto-itération et leur évolution. Dans certains systèmes complexes, nous pouvons également laisser différents agents interagir et collaborer les uns avec les autres pour accomplir des tâches avec une meilleure qualité. Nous avons développé ces capacités d’agent et sommes totalement ouverts aux développeurs.

Dans les trois directions du ministère de l’Éducation, des petits modèles et des agents, Baidu a fourni des outils « prêts à l’emploi » pour tous. Ensuite, je vais vous présenter trois outils différents, à savoir : l’outil de développement d’agents AgentBuilder, l’outil de développement d’applications natives d’IA AppBuilder et l’outil de personnalisation de modèles de différentes tailles ModelBuilder.

Outil de développement d’agents AgentBuilder

Le premier est l’outil de développement d’agents AgentBuilder. Les agents pourraient être le moyen le plus proche et le plus courant d’utiliser de grands modèles pour tout le monde à l’avenir. Basés sur de puissants modèles de base, les agents peuvent être générés par lots et appliqués dans une variété de scénarios.

Baidu vient de mettre à niveau sa plateforme d’agents intelligents Wenxin. À ce jour, plus de 30 000 agents ont été créés, plus de 50 000 développeurs et des dizaines de milliers d’entreprises se sont installées. Notre objectif est de permettre à chacun et à chaque organisation de devenir un développeur d’agents intelligents et de créer l’écosystème d’agents intelligents le plus complet de Chine.

Alors comment atteindre cet objectif ? Il s’agit de fournir à chacun l’outil de développement d’agents à seuil zéro AgentBuilder.

Prenons d’abord l’exemple du « Singapore Tourism Board » pour voir comment est créé un agent intelligent.

Tout d’abord, nous ouvrons la plateforme d’agent Wenxin. La page de création comporte deux modes : zéro code et low code. Les novices peuvent directement choisir le « mode zéro code » et utiliser le langage naturel pour créer un agent en quelques phrases.

Nous avons d’abord nommé l’agent « Singapore Tourism Board », puis avons spécifié dans les paramètres que nous devons créer des plans de voyage, répondre aux questions et fournir des services de réservation de billets d’hôtel. Ces paramètres sont utilisés pour guider l’agent. Vous pouvez lui dire quoi faire. .

Si seuls des agents de base sont nécessaires, la plateforme terminera automatiquement le remplissage. Mais nous espérons que le « Singapore Tourism Board » est un agent intelligent professionnel, une configuration avancée est donc requise. Je peux ajouter des entrées de l’Encyclopédie de Singapour et des liens vers des sites Web officiels à la base de connaissances et la mettre à jour quotidiennement. Ajoutez ensuite quelques outils, tels que la demande d’hôtel, l’achat de billets d’attraction, etc., pour améliorer ses capacités de service. À l’heure actuelle, nous avons coopéré avec Ctrip pour fournir des outils de services de voyage tels que des hôtels, des attractions et des billets. De cette façon, un agent intelligent de l’Office du tourisme de Singapour est prêt, qui peut être prévisualisé et réglé davantage.

Ouvrez maintenant l’application Baidu et recherchez « Quand y aura-t-il le moins de personnes visitant Singapour, car tout le monde veut éviter les foules lorsqu’il voyage ? » L’agent combinera des informations provenant de plusieurs sources pour générer une réponse : « Il y a le moins de monde en janvier-mars ». Nous pouvons également cliquer sur l’agent pour interagir davantage avec lui, comme des conseils pour voyager à Singapour, des recommandations pour les trois meilleurs hôtels de Singapour, et il peut également être utilisé pour réserver directement des billets pour Universal Studios Singapore, une solution unique. à nos besoins, ce qui permet à l’utilisateur de gagner beaucoup de temps.

En plus de Singapour, des agents intelligents culturels et touristiques tels que Dalian et Shenyang sont également en ligne sur la plateforme d’agents intelligents Wenxin. Il existe également divers agents intelligents pour la connaissance, la création, l’apprentissage, le divertissement, etc. .

Lorsque Wen Xinyiyan a été libéré pour la première fois l’année dernière, j’ai dit que Wenxinyiyan affecterait toutes les entreprises. Grâce à ses puissantes capacités de compréhension, d’expression et de raisonnement du langage naturel, il peut rapprocher toute entreprise de ses clients.

Aujourd’hui, chaque commerçant et chaque client peut disposer d’un agent intelligent exclusif sur Baidu. L’ensemble du processus ne nécessite aucune programmation. En saisissant des informations similaires à des mots d’invite et en ajustant quelques étapes simples, un agent intelligent peut être rapidement généré et devenir un vendeur médaillé d’or en ligne 24h/24 et 7j/7.

Jetons un coup d’œil à la manière dont est créé un agent de business intelligence.

Kai Tak Education est une entreprise éducative bien connue avec plus de 60 succursales à travers le pays et de nombreuses succursales à l’étranger. Elle couvre un large éventail de pays et a des exigences élevées en matière de compétences d’accueil. Comment répondre aux demandes des clients 24 heures sur 24, améliorer les niveaux d’accueil et réduire les coûts d’exploitation ?

Kai Tak Education utilise AgentBuilder de Baidu pour créer son propre agent intelligent.

Voyons comment créer un agent intelligent doté de fonctionnalités de base. C’est très simple. Remplissez l’avatar, le nom, le champ d’activité et le message de bienvenue de l’agent sur la plateforme, puis définissez certaines informations qui doivent être fournies par l’utilisateur, telles que l’âge et l’éducation. En 5 minutes et avec un seuil nul, un agent intelligent est prêt.

Kai Tak Education espère également que cet agent sera un consultant en études à l’étranger qui comprend les affaires et les étudiants. Il peut effectuer une analyse professionnelle et donner des réponses précises en fonction des différentes situations des étudiants, par exemple s’ils souhaitent aller aux États-Unis ou en Australie, s’ils souhaitent obtenir une maîtrise ou un baccalauréat, quels résultats ils ont obtenus à l’IELTS et au TOEFL, etc. Nous pouvons créer un agent intelligent plus avancé en ajoutant plusieurs modules tels que des connaissances, des rôles et des outils.

Dans le module de connaissances, téléchargez les connaissances du domaine privé et laissez la plateforme les analyser en temps réel et générer automatiquement du matériel de dialogue ; dans le module de rôle, ajoutez au système de filtrage certains pays d’études à l’étranger qui ne font pas partie du champ d’activité, ce qui peut améliorer l’efficacité des indices utilisateur dans le module outil, en ajoutant des services tels que la réservation en magasin. Grâce à ces quelques opérations simples, un agent intelligent d’éducation Qi Tak doté de capacités professionnelles est prêt.

Maintenant, recherchons « Conditions de candidature pour étudier en Australie ». Nous pouvons voir que l’agent fournit rapidement sept conditions nécessaires telles que la compétence linguistique requise et la sélection majeure, et peut également fournir des plans de conseil en matière d’études à l’étranger correspondants pour résoudre diverses questions. recevra une réponse et toutes les demandes seront répondues.

Kai Tak Educational Intelligence est très populaire. Au cours de la première semaine de son lancement, il a été distribué avec succès 1,55 million de fois et a interagi avec les utilisateurs 58 000 fois. Le nombre de conversions de prospects a augmenté de manière linéaire, le coût de conversion des prospects efficaces a été considérablement réduit et le nombre de conversions de prospects a augmenté de manière linéaire. l’efficacité opérationnelle a été grandement améliorée.

Ensuite, je vais vous présenter un agent intelligent dans l’industrie domestique.

Sophia est une marque d’ameublement axée sur la personnalisation de toute la maison. Comme nous venons de le montrer, il peut également créer une business intelligence de base en renseignant des informations extrêmement simples. Mais pour l’industrie de l’ameublement, l’expérience hors ligne des consommateurs est plus importante, c’est pourquoi Sophia espère créer une médaille d’or dans les ventes en ligne et restaurer l’expérience de réception hors ligne.

Par conséquent, dans d’autres contextes, il a sélectionné les personnes numériques comme méthode d’affichage dans le module de rôle, puis a sélectionné les arrière-plans et les voix appropriés pour les personnes numériques et, combiné aux capacités d’analyse intelligente de la plateforme, a automatiquement résumé un ensemble de techniques de vente. En fin de compte, nous avons créé une vendeuse médaillée d’or qui est douce, gentille et professionnelle dans ses compétences orales, elle peut répondre aux différents besoins des utilisateurs 24 heures sur 24 et offrir une expérience de service de haut niveau.

Lorsqu’un utilisateur de recherche Baidu a une demande de décoration, l’agent Sophia utilisera d’abord la capacité du grand modèle Wenxin pour donner la réponse à la question. En outre, elle confirmera également de manière proactive les besoins spécifiques des clients, tels que le type de décoration, le budget, etc., et recommandera les magasins hors ligne à proximité.

Depuis le lancement de Sophia Merchant Intelligence, les coûts effectifs des leads ont baissé de 30 %. En d’autres termes, pour acquérir un client efficace, si le coût était de 100 yuans dans le passé, il ne coûte plus que 70 yuans aujourd’hui.

Actuellement, plus de 10 000 clients de Baidu disposent de renseignements commerciaux couvrant plus de 30 secteurs tels que l’éducation et la formation, l’immobilier et le mobilier, les machines et équipements, ainsi que les services aux entreprises.

Ci-dessus, à travers trois démos, j’ai montré comment les développeurs et les commerçants peuvent utiliser AgentBuilder pour créer des agents intelligents pour différents secteurs.

Désormais, créer un agent intelligent ne prend que quelques minutes. Mais voici le problème ! S’il n’y a pas de trafic, pas de distribution, pas de recherche et que personne ne l’utilise, alors les développeurs et les commerçants n’auront aucun revenu. Sans revenus, il n’y aura pas de motivation. Comment résoudre ce problème ?

Notre plateforme d’agents Wenxin offre aux développeurs un moyen de monétiser le trafic. En plus de Baidu Search, d’autres produits de l’écosystème Baidu, tels que Xiaodu, Maps, Tieba, Cheji, etc., peuvent tous être connectés aux capacités pertinentes de l’agent intelligent, résolvant ainsi les soucis de répartition du trafic pour les développeurs et obtenant de véritables avantages.

S’il y a distribution, il y aura retour de données ; avec retour de données, le volant tournera et l’agent intelligent pourra itérer indépendamment, et plus il sera utilisé, plus il deviendra intelligent. La plate-forme d’agent Wenxin a également lancé les modules d’analyse des données et de réglage des questions et réponses de l’agent, et d’autres nouvelles fonctionnalités seront bientôt lancées. La plate-forme d’agents intelligents Wenxin incitera les agents intelligents à former un cycle positif de meilleure qualité, de meilleur trafic et de revenus plus élevés grâce au volant de données de distribution-diagnostic-revenus.

AppBuilder : Vous pouvez développer une application en trois étapes avec le langage naturel

Ensuite, je vais vous présenter le deuxième outil de développement, AppBuilder. Il s’agit actuellement du meilleur outil de développement d’applications natives d’IA. Sur AppBuilder, nous avons encapsulé et prédéfini divers composants et frameworks nécessaires au développement d’applications natives d’IA à l’avance, réduisant ainsi considérablement le seuil de développement.

En seulement trois étapes au maximum, les développeurs peuvent développer une application native d’IA en utilisant le langage naturel, et elle peut être facilement publiée et intégrée dans divers environnements commerciaux. Regardons quelques cas :

Au début de cette année, nous avons organisé un défi de développement d’applications natives d’IA. Le sujet du concours était d’utiliser AppBuilder pour créer un « assistant de planification des files d’attente sur le terrain de jeu » afin d’aider les touristes à mieux comprendre la situation des files d’attente sur le terrain de jeu et à concevoir des itinéraires de jeu personnalisés. la meilleure expérience de jeu dans un temps limité.

Le champion de ce concours a développé une application sans écrire une seule ligne de code et a remporté le grand prix de 100 000 yuans offert par Baidu. Si vous pouvez écrire du code pour ce sujet, il ne vous est pas difficile d’en écrire un, mais si vous pouvez toujours le faire sans écrire une ligne de code, cela dépend toujours fortement du modèle de base et des capacités de l’outil AppBuilder.

Voyons comment utiliser AppBuilder pour créer cette application d’IA.

Passons d’abord en revue les questions du concours. Il suppose le temps d’attente et l’indice de stimulation de chaque projet dans “Universal Studios”, donc obtenir l’expérience avec l’indice de stimulation le plus élevé dans un temps limité est le problème à résoudre dans ce numéro.

Tout d’abord, ouvrez l’interface de développement d’AppBuilder et nommez l’application « Playground Queuing Assistant » ; deuxièmement, nous décrivons les exigences spécifiques dans les instructions de rôle, notamment l’appel de l’interpréteur de code, le calcul de la meilleure combinaison dans un délai fixe, les résultats de sortie, etc. ; La troisième étape consiste à accéder au composant outil et à ajouter l’interpréteur de code pour faciliter le calcul.

Maintenant, testons l’effet. Entrez la question “J’ai 3 heures et demie, quelle est la façon la plus excitante de jouer ?” sur le côté droit. Vous pouvez voir que l’interpréteur de code traduit cette question en code, puis appelle. l’outil de compréhension des données. Analyser les conditions connues. Après une série de calculs, il a été conclu que les meilleurs résultats seraient obtenus en combinant ces quatre projets : “Harry Potter et le voyage interdit”, “Jurassic Adventures”, “Decepticon Roller Coaster” et “Bumblebee Spinner”. S’il n’y a aucun problème avec le test, cliquez sur Publier et une application sera générée avec zéro code.

Désormais, AppBuilder a été encore mis à niveau. Au cours du processus de création, tous peuvent utiliser la fonction « Configuration optimisée par l’IA » pour aider automatiquement les développeurs à optimiser les instructions de rôle, la configuration des composants et d’autres aspects, améliorant ainsi encore l’efficacité du développement.

Regardons un autre exemple.

Au début de cette année, la North China Electric Power University a proposé d’espérer fournir des services intelligents et exclusifs aux enseignants et aux étudiants de l’ensemble de l’école. Sur la base de l’AppBuilder de Baidu, nous avons créé conjointement un assistant IA Huadian. Maintenant, laissez-moi vous montrer comment est créé l’assistant IA Huadian :

Étape 1 : ouvrez AppBuilder, accédez à la page de création et cliquez sur AI pour générer automatiquement la configuration. Tout d’abord, définissez les informations de base telles que le nom, l’introduction, l’avatar, etc. pour l’application.

Étape 2 : Utilisez un langage naturel pour décrire les exigences spécifiques dans les instructions de rôle, y compris les tâches, les capacités des composants, les exigences et les limitations.

Étape 3 : Insérez des composants personnalisés tels qu’une demande d’emprunt de livres, une demande d’horaire de cours, une demande de performance des étudiants, etc., afin que l’assistant du campus puisse disposer de capacités de service intelligentes. Ajoutez ensuite une déclaration d’ouverture pour Campus Assistant et l’application est configurée.

Ensuite, nous déboguons l’assistant dans l’interface d’aperçu en fonction des questions des utilisateurs. Par exemple, renseignez-vous sur l’heure d’inscription aux examens CET-4 et CET-6 et testez l’effet de l’appel automatique de chaque composant.

Comme vous pouvez le constater, grâce à ces opérations simples, la candidature est complétée. À l’heure actuelle, il a été lancé dans le cadre de tests à petite échelle et a été connecté à des scénarios à haute fréquence tels que la vérification du système, la vérification des cours, le rechargement des cartes de repas, l’emprunt de livres, etc., et a servi la majorité des enseignants et des étudiants. à l’école. À l’avenir, nous travaillerons avec la North China Electric Power University pour approfondir davantage la coopération en matière d’applications et fournir des services plus abondants et plus pratiques.

Baidu compte également de nombreuses années d’accumulation de technologies dans le domaine de la multimodalité. Sur AppBuilder, nous proposons également certaines fonctionnalités multimodales. Il vous suffit de fournir un paragraphe de texte ou quelques phrases pour créer rapidement des applications de dessin, telles que des bandes dessinées, des livres d’images pour enfants, etc.

Le processus est également très simple : ouvrez AppBuilder, cliquez pour entrer « Création d’application », entrez les instructions du rôle, sélectionnez le composant « Ajouter une image de Vincent », entrez trois questions recommandées et cliquez pour publier. Une fois l’application terminée, il nous suffit de saisir un personnage ou une intrigue approximative, et AppBuilder peut générer automatiquement l’histoire et produire des images.

La dernière fonction intelligente de génération de bandes dessinées et de livres d’images de Baidu Wenku utilise ces composants fournis sur AppBuilder. Voyons comment la fonction de génération de bandes dessinées de Baidu Wenku permet à toute personne ayant des idées créatives de produire de bonnes œuvres.

Prenons l’exemple du classique « Zhou Chu élimine les trois maux ».

Ouvrez la bibliothèque Baidu et entrez le sujet “Zhou Chu élimine trois maux”. Ceci est écrit dans “Livre de Jin” et “Shishuoxinyu”. Après une recherche dans la bibliothèque, l’histoire sera générée sur la base du texte original. le contenu de l’histoire. Apportez des modifications, puis cliquez sur la barre d’outils AI à droite pour commencer à créer cette bande dessinée.

Entrez dans l’interface de production de bandes dessinées et Wenku générera automatiquement pour nous des storyboards de bandes dessinées basés sur le scénario ; puis choisirez le style de bande dessinée qui convient le mieux à l’histoire parmi différents styles tels que la lumière et l’ombre, le réalisme, le dessin animé, etc. ; personnages selon les personnages, donc La génération de la bande dessinée est terminée.

Une fois la bande dessinée générée, nous pouvons parcourir la bande dessinée complète dans l’éditeur de bande dessinée intelligent de Baidu Wenku. Dans le même temps, la bibliothèque prend en charge l’édition, la modification et le réglage fin de chaque image. Par exemple, sélectionnez l’image “Zhou Chu et le tigre à front blanc” sur la gauche, cliquez sur Modifier, ajoutez la description de l’image “Le visage du personnage est”. claire, l’image est lumineuse", et vous pouvez l’affiner. Appelez des bandes dessinées qui correspondent mieux à vos besoins. Comme vous pouvez le constater, la fonction bande dessinée de Baidu Wenku fait un excellent travail en termes de cohérence stylistique des personnages et des scènes.

Les capacités de bande dessinée intelligente de Baidu Wenku ont considérablement amélioré l’efficacité de la création de bandes dessinées, réduit le coût et le seuil de création de bandes dessinées et permis à des personnes plus réfléchies et créatives de réaliser leurs rêves de création de bandes dessinées.

En plus de générer des bandes dessinées, Baidu Wenku peut désormais aider les utilisateurs à créer des livres d’images sans seuil. Vous ne savez peut-être pas que les enfants chinois ne lisent que 10 livres d’images par an et par habitant, alors que dans les pays européens et américains, c’est environ 50. Désormais, l’IA peut permettre aux parents qui n’ont aucune capacité de dessin de créer un livre d’images exclusif pour leurs enfants. Jetons un coup d’œil à ce livre audio illustré !

Depuis l’année dernière, nous utilisons l’IA pour reconstruire Baidu Wenku, ce qui en fait le « point de départ de la production de contenu » pour les utilisateurs. Désormais, avec le soutien d’AppBuilder, les nouvelles fonctions de bandes dessinées intelligentes et de livres d’images intelligents de Baidu Wenku ont étendu la scène à des domaines de création multimodaux plus intéressants.

Je viens d’utiliser trois cas pour montrer comment utiliser AppBuilder de Baidu pour créer des applications natives d’IA. Tout le monde devrait pouvoir ressentir les deux avantages évidents d’AppBuilder :

Premièrement, c’est puissant. S’appuyant sur la capacité de Wenxin 4.0 à comprendre et à suivre les instructions, notre AppBuilder peut garantir qu’un démarrage à froid peut atteindre un bon niveau. Le réglage ne prendra pas beaucoup de temps en raison de mauvaises performances, ce qui abaisse considérablement le seuil de développement. En s’appuyant sur la technologie d’amélioration de la recherche RAG, dans des scénarios typiques tels que les questions-réponses de connaissances, notre taux d’exactitude des questions-réponses et notre niveau de réponse amicale ont atteint plus de 95 %, dépassant largement d’autres produits similaires. AppBuilder fournit également un ensemble riche et complet d’outils de composants, comprenant 55 composants tels que la recherche Baidu et d’autres composants de capacités d’IA basés sur les années d’accumulation technologique de Baidu, des composants de capacités de grands modèles et des composants commerciaux ouverts exclusifs de Baidu. Ainsi que des API tierces pour certains scénarios courants, tels que les requêtes de vol, les requêtes papier, etc. Nous venons également de prendre en charge des composants personnalisés, afin que les clients puissent connecter directement n’importe lequel de leurs propres outils et données propriétaires. Ces composants riches soutiennent conjointement le développement efficace d’applications natives d’IA.

Deuxièmement, il est simple et facile à utiliser. Grâce à AppBuilder, vous pouvez créer rapidement des applications en trois étapes et les distribuer en un seul clic. Nous prenons également en charge le SDK open source pour faciliter le développement secondaire.

Outil de personnalisation de modèles ModelBuilder : production de modèles efficace et à faible coût

Ensuite, je présenterai un outil plus adapté aux développeurs professionnels, à savoir ModelBuilder. Il peut personnaliser des modèles de n’importe quelle taille en fonction des besoins des développeurs et affiner davantage SFT en fonction de scénarios subdivisés, afin d’obtenir de meilleurs résultats. Effet obtenu. Pour les développeurs, une chose très importante pour bien utiliser les grands modèles est de maîtriser la méthode de réglage fin du modèle.

Prenons comme exemple le scénario de correction de dissertation dans le secteur de l’éducation. Parce que la correction de composition a des normes de notation claires et que différents niveaux ont des exigences de composition et des normes de notation différentes. Cela nécessite un réglage fin du modèle pour rendre les résultats de sortie du grand modèle plus cohérents avec les exigences spécifiques.

Jetons un coup d’œil à la façon dont ModelBuilder implémente le réglage fin du modèle pour la notation des dissertations.

Étape 1 : Créez un ensemble de données. L’efficacité du réglage fin du modèle dépend fortement de la qualité de nos données. Dans ce cas, les données originales ne contiennent que 180 éléments et la qualité n’est pas suffisamment élevée. Nous devons utiliser trois fonctions : le nettoyage des données, l’annotation des données et l’amélioration des données. Le nettoyage des données peut rapidement éliminer les lacunes dans les données, les caractères tronqués et d’autres problèmes. En termes d’annotation des données, nous avons ajouté davantage de dimensions à la composition, telles que la profondeur du contenu, les techniques d’écriture et d’autres évaluations. La fonction d’amélioration des données peut générer des données similaires mais non dupliquées pour l’expansion des données. Après expansion, ModelBuilder a généré pour nous 920 éléments de données de haute qualité.

La deuxième étape consiste à entrer dans la phase de mise au point du modèle. Tout d’abord, nous devons choisir un modèle de base pour un réglage précis. Ici, nous choisissons ERNIE Speed comme modèle de base. Ensuite, nous configurons les paramètres selon les valeurs recommandées par la plateforme. Cette fois, les données sont proches de 1 000. Selon les tours d’itération recommandés, la configuration est de 10 tours, puis le modèle peut commencer l’entraînement.

Étape 3 : déployez le modèle sur la plateforme et l’ensemble du processus de réglage fin est terminé.

Utilisons un essai de collège pour tester l’effet du modèle affiné. Le titre de l’essai est « Au plaisir de grandir », il n’y a pas de limite au sujet et il ne doit pas contenir moins de 800 mots.

Nous saisissons les exigences de composition et de format de correction d’un étudiant dans deux modèles avant et après la mise au point. Regardons la comparaison entre les deux modèles et les commentaires de l’enseignant. On peut voir que le grand modèle affiné a une réflexion plus professionnelle sur les commentaires de l’enseignant et une meilleure conformité du format. Les tâches de correction de dissertations qui prenaient à l’origine beaucoup de temps aux enseignants peuvent désormais être réalisées rapidement à l’aide de grands modèles en quelques secondes, améliorant considérablement la rapidité et l’efficacité du feedback aux étudiants. Actuellement, ce type de modèle affiné a été utilisé dans de nombreuses entreprises leaders du secteur de l’éducation.

J’ai mentionné plus tôt que les applications natives d’IA à grande échelle relèvent généralement du MoE. Alors, comment combiner ces modèles pour obtenir le meilleur rapport qualité/prix ? Ensuite, j’utiliserai Xiaodu pour montrer un cas de routage de modèle MoE. Voyons d’abord si Xiaodu est devenu plus intelligent avec la bénédiction du grand modèle :

Robin : Xiaodu Xiaodu

Xiaodu : Vous voilà

Robin : Quelles sont les nouvelles aujourd’hui ?

Xiaodu : Xiaodu diffuse 3 à 5 flashs d’information par jour

Robin : Xiaodu Xiaodu. J’ai entendu dire que vous êtes devenu plus capable récemment ? Xiaodu : Non seulement je peux discuter avec vous, mais je peux aussi être votre assistant de planification IA

Robin : Alors je vais te tester. S’il vous plaît, aidez-moi à organiser mon emploi du temps. Après l’événement d’aujourd’hui, je dînerai avec M. Zhang, puis il y aura une réunion de direction à l’hôtel, qui durera environ une heure et demie, j’espère qu’elle se terminera avant 10 heures. 'horloge. Je vais faire une course matinale demain matin et voir quel temps il fait. Ensuite, j’ai une réunion matinale à 8 heures du matin. S’il vous plaît, aidez-moi à organiser mon emploi du temps.

Xiaodu : En fonction de vos besoins, Xiaodu établira le programme optimal pour vous comme suit :

Votre dîner avec M. Zhang est prévu de 18h00 à 19h30. Après cela, vous assisterez à la réunion de direction à 20h00 et terminerez vers 21h30.

Le réveil vous rappellera de vous lever à 6 heures demain matin et d’aller courir le matin. Le temps de course doit être contrôlé dans un délai d’une heure pour vous assurer que vous n’êtes pas en retard pour la réunion du matin à 8 heures demain matin. .

Il fera beau demain matin avec une température de 25 degrés. Il est recommandé de porter des manches courtes pour sortir et de se protéger du soleil.

Pensez-vous que je peux être votre secrétaire ? J’ai plus de nouvelles compétences.

Robin : Très bien, super (bravo à Xiaodu), synchronisez ces horaires sur mon téléphone portable.

Tout à l’heure, j’ai posé plusieurs questions à Xiaodu, allant de simples demandes d’informations à des besoins de planification complexes. Il semble que nous communiquions avec le même Xiaodu, mais en fait, différents modèles sont appelés derrière. Lorsqu’il a reçu ma question, il a d’abord effectué le travail de « routage de modèle » sur le petit modèle ERNIE Tiny ; pour le problème météorologique, il a appelé le modèle affiné basé sur ERNIE Lite sur la base des résultats de la requête météo, qui a également été traité par ERNIE Lite de SFT, donne des suggestions d’habillage ; pour les horaires plus complexes, Wenxin 4.0, le grand modèle le plus performant, est utilisé pour calculer divers arrangements de ce soir à demain matin.

Aujourd’hui, chaque question que nous posons à Xiaodu sera attribuée à différents modèles pour exécution. Lors de l’appel de l’interface API de l’application, le modèle ERNIE Functions sera utilisé. Lors de l’explication des questions aux enfants, Wenxin Big Model 3.5 ou 4.0 sera utilisé. . Intelligent L’assistant a été construit en utilisant le modèle de personnage ERNIE pour améliorer la cohérence du personnage et stimuler le désir des utilisateurs de discuter.

Grâce à cette méthode de planification combinée de grands et petits modèles, Xiaodu a non seulement réussi « l’opération de remplacement du cerveau » et installé le nouveau système d’exploitation natif d’IA DuerOS X, mais a également formé la combinaison optimale d’effet, de vitesse et de coût par rapport à toutes les utilisations. la version phare de Wenxin Large Model, la vitesse de réponse est multipliée par 2 et le coût est réduit de 99 %. La tablette robot Xiaodu Tiantian AI avec laquelle je parlais tout à l’heure a été mise en vente hier sur toutes les principales plateformes. Les amis intéressés peuvent passer une commande immédiatement pour en faire l’expérience.

Ces exemples de ModelBuilder démontrent la capacité de Baidu à produire des modèles de manière efficace et à bas prix. Grâce au modèle de base Wenxin 4.0 le plus puissant, nous pouvons adapter des modèles plus petits adaptés à divers scénarios en fonction des besoins, en tenant compte de diverses considérations telles que l’effet, la vitesse de réponse et le coût d’inférence, et prendre en charge le réglage fin et le post-préentraînement. De cette façon, le modèle découpé par réduction de dimensionnalité est nettement meilleur que le modèle directement ajusté à partir de la source. À même taille, l’effet est évidemment meilleur et le coût est évidemment inférieur pour le même effet. Les gens utilisaient l’open source et pensaient que c’était bon marché. En fait, dans les scénarios de grands modèles, l’open source est le plus cher. Le modèle open source prendra donc de plus en plus de retard.

Afin de permettre à chacun de démarrer rapidement, ModelBuilder a prédéfini les grands modèles les plus complets et les plus riches. Il comprend ERNIE3.5 et ERNIE4.0, qui sont les grands modèles phares, adaptés aux scènes complexes générales et dotés de puissantes capacités ; il existe également trois grands modèles légers, ERNIE Speed, Lite et Tiny, et il y en a deux autres ; En tant que modèle pour les scènes verticales, ERNIE Character convient aux jeux de rôle ; ERNIE Functions convient à l’utilisation d’outils externes et aux appels de fonctions métier dans des scénarios de dialogue ou de questions-réponses. Bien entendu, ModelBuilder prend également en charge les modèles grand public tiers nationaux et étrangers, avec un nombre total de 77, ce qui en fait la plate-forme de développement avec le plus grand nombre de grands modèles en Chine.

Le deuxième concours d’entrepreneuriat « Wenxin Cup » est officiellement lancé : un grand prix spécial de 50 millions de dollars NT est fixé

Pour les développeurs, en plus de fournir ces outils de développement, nous fournissons également un soutien financier et en ressources.

En mai de l’année dernière, Baidu a lancé le concours d’entrepreneuriat « Wenxin Cup », dans l’espoir de promouvoir la prospérité du vaste écosystème de modèles, de créer un écosystème plus dynamique et d’aider les entrepreneurs et les développeurs à développer diverses applications natives d’IA. Pour le premier concours d’entrepreneuriat « Wenxin Cup », nous avons reçu près de 1 000 inscriptions d’équipes entrepreneuriales. Baidu a fourni près de 100 millions de yuans de soutien en investissement à 15 des équipes gagnantes et a continué à fournir un soutien complet en matière de technologie, d’équipe et d’orientation.

Aujourd’hui, j’annonce que le deuxième concours d’entrepreneuriat « Wenxin Cup » a été officiellement lancé. Cette fois, nous élargirons la portée de la sélection des projets, créerons des sous-domaines, ciblerons le marché mondial et les étudiants universitaires et recruterons des équipes d’innovation entrepreneuriale. Tant que votre orientation entrepreneuriale est axée sur les applications natives de l’IA, vous pouvez vous inscrire sur le site officiel de. la compétition. Dans le même temps, nous avons également accru notre soutien aux entrepreneurs, en fournissant des fonds d’investissement plus suffisants et des ressources commerciales plus riches. Nous avons également créé pour la première fois un « Prix spécial ». Les projets particulièrement remarquables auront la possibilité de recevoir jusqu’à 50. millions de yuans en espèces et en ressources.

Les entrepreneurs et développeurs chinois savent très bien utiliser les nouvelles technologies pour développer des applications. Je pense que le Wenxin Big Model deviendra le premier choix des entrepreneurs et des développeurs chinois en IA, et que de plus en plus d’applications seront construites sur le Wenxin Big Model. J’attends également avec impatience que davantage d’entrepreneurs et de développeurs nous rejoignent pour construire un écosystème d’IA prospère.

Le plus grand scénario d’application des grands modèles visuels est la conduite autonome

La plupart des outils et des cas dont nous avons parlé plus tôt sont basés sur de grands modèles de langage. Face à l’avenir, je crois que les grands modèles multimodaux, ou la fusion de texte, d’images, de voix, de vidéo et d’autres modes multimodaux, constituent une direction de développement à long terme très importante pour les modèles de base et la seule voie vers l’AGI. Baidu investit à long terme dans ces domaines et mettra à jour les progrès technologiques en temps opportun.

J’ai un jugement très différent : le plus grand scénario d’application des grands modèles visuels est la conduite autonome. Baidu est le meilleur dans ce domaine et est le leader mondial de la conduite autonome. Nous formons non seulement l’IA à générer des vidéos, mais nous formons également l’IA à comprendre ce qui se passe dans le monde réel et à prédire l’avenir.

Sur la base de plus de 100 millions de kilomètres de données de kilomètres d’essais routiers dans les villes complexes de Chine, Baidu a formé le grand modèle de perception visuelle Apollo. Il possède quatre capacités de base : détection, suivi, compréhension et cartographie. Cela donne à Baidu une solution de conduite autonome plus intelligente, plus adaptable et plus sûre.

Baidu Maps a également pris les devants en appliquant des modèles de perception visuelle à grande échelle au domaine de la cartographie. Aujourd’hui, les plus grandes données cartographiques au monde au niveau des voies ont été lancées dans 360 villes à travers le pays. Tant que la navigation cartographique Baidu peut fonctionner, la conduite intelligente peut conduire.

Après la Fête du Printemps de cette année, la course aux carottes de Baidu a achevé la « première travée » du fleuve Yangtze. Nous avons étendu nos services de la rive nord du fleuve Yangtze à la rive sud. Dans certaines zones de Wuhan, nous avons assuré une permanence 24h/24 et 7j/7. -opération météorologique, et nous prévoyons de le faire d’ici l’année où Wuhan déploiera 1 000 véhicules sans conducteur.

Il s’agit d’un événement marquant pour que la conduite autonome devienne véritablement commercialisée. Il ne s’agit plus seulement d’une démonstration régionale, mais d’une nouvelle étape de démonstration d’application au niveau de la ville. Luobo Kuaipao couvre plus de 3 000 kilomètres carrés et compte 7,7 millions d’habitants à Wuhan, ce qui en fait la plus grande zone d’exploitation de conduite autonome au monde.

“Emballez-le et emportez-le, utilisez-le quand vous le souhaitez.”

Tout à l’heure, je vous ai montré la grande série de modèles Baidu Wenxin et trois outils de développement : AgentBuilder, AppBuilder et ModelBuilder. Ils forment une boîte à outils que vous pouvez emporter immédiatement et utiliser à tout moment.

En ce moment, je suis ici, je suis en fait un développeur et un entrepreneur, et je suis aussi excité que tout le monde. Aujourd’hui, la Chine compte 1 milliard d’utilisateurs Internet, un modèle de base solide à grande échelle, suffisamment de scénarios d’application de l’IA et le système industriel le plus complet au monde. Le pays encourage et soutient également vigoureusement l’action « intelligence artificielle + ». il suffit à chaque entreprise d’utiliser pleinement ces outils pour libérer une créativité et une productivité illimitées.

Aujourd’hui, tout le monde peut devenir développeur. Et l’avenir sera certainement un avenir créé par les développeurs ensemble.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

Aucun commentaire