Tout le monde parle d'IA, je vais faire une petite prédiction


OpenClawd(ex Clawdbot) ce genre d'outils, qui se basent sur le reverse engineering d'API et de CLI pour assembler des solutions, sont en réalité assez instables. À long terme, il est certain que de plus en plus d'applications offriront des interfaces standardisées pour l'appel à l'IA (MCP). Mais un autre problème qui en découle est que confier l'interaction à l'IA risque de diminuer le contrôle de certains types d'applications(, notamment les applications toC), sur l'attention des utilisateurs, les données comportementales, etc. Donc, à court terme, ces applications auront tendance à éviter ou à mettre en place des obstacles. Concernant le développement des agents, voici deux directions possibles :
1. Pour le problème des interfaces standardisées, une solution complémentaire serait de doter l'agent de la capacité de contrôler une interface graphique, similaire au VLA dans le domaine de la robotique, qui mappe l'observation visuelle et les instructions en langage vers une séquence d'actions, permettant à l'agent de cliquer, déplacer la souris, faire des captures d'écran, taper, etc. Par conséquent, je pense qu'en dehors des considérations de coût, faire entrer un robot dans le salon pour des démonstrations grand public reste encore un peu loin, mais la technologie pour le contrôle GUI est beaucoup plus mature.
2. Donner à l'agent la capacité de payer est une autre idée que je peux envisager pour le moment. Quant à la monnaie de paiement, cela pourrait être une monnaie fiat, une stablecoin, voire du BTC, mais quelle que soit la méthode, cela impliquera forcément des questions de KYC, de conformité, etc. En résumé, je pense que des entreprises comme Stripe, spécialisées dans l'infrastructure de paiement, sont un bon levier de croissance (d'ailleurs, ils y travaillent déjà, mais ne sont pas encore cotés en bourse, et ces derniers jours, ils ont parlé de racheter PayPal).
En combinant les tutoriels de déploiement d'OpenClawd qui envahissent le web, et le Mac mini qui se vend comme des petits pains, en laissant de côté la spéculation, ce phénomène reflète en partie l’attente forte des gens pour des agents personnels. Cependant, les solutions en local présentent des barrières matérielles, des coûts de maintenance, des problèmes de stabilité, etc., difficiles à résoudre pour un utilisateur individuel. Je pense donc que la forme finale à grande échelle pour un agent personnel sera probablement en cloud. AWS, Azure, Google Cloud offrent déjà une infrastructure de calcul, ont aussi des produits de cloud desktop, et ajouter une couche d’orchestration d’agents me paraît une évolution naturelle. Les fournisseurs de cloud ont d’ailleurs plusieurs avantages dans ce domaine, car leur infrastructure accumulée sur le long terme leur permet d’offrir un ensemble complet de capacités autour de l’agent, comme l’observabilité, la journalisation, la gestion des permissions, la résilience, etc. En résumé, je pense que ce type de service sera l’un des narratifs futurs des fournisseurs de cloud.
BTC0,23%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler