Le 26 février, heure de Pékin, Anthropic, une entreprise de premier plan en IA aux États-Unis, a annoncé l’acquisition de Vercept, une startup d’IA d’automatisation informatique axée sur la vision, afin de compenser les lacunes visuelles des fonctions d’utilisation informatique. Il s’agit de la deuxième acquisition d’Anthropic après l’acquisition de la start-up full-stack de la chaîne d’outils Bun en décembre 2025.
L’utilisation informatique est la capacité principale du contrôle direct par IA des ordinateurs créée par Anthropic pour son grand modèle Claude, permettant à Claude de « regarder l’écran, déplacer la souris, taper le clavier et utiliser le logiciel » comme un humain, et d’accomplir des tâches complexes en plusieurs étapes et inter-applications, qui seront publiées avec Claude 3.5 Sonnet en octobre 2024.
Cependant, en raison des goulots d’étranglement dans la précision de la compréhension visuelle, de la reconnaissance complexe des interfaces et du traitement dynamique de la scène au stade initial du modèle, le taux de réussite de l’utilisation de l’ordinateur est faible et la tâche est facile à échouer. L’accumulation de Vercept en reconnaissance d’interface utilisateur haute précision, en raisonnement spatial, en suivi dynamique des interfaces et en traitement visuel à faible latence peut compenser ces lacunes.
Selon Anthropic, les développeurs utilisent Claude pour gérer des tâches de plus en plus complexes, notamment l’écriture et l’exécution de code entre dépôts, la synthèse de recherches provenant de dizaines de sources, et la gestion des flux de travail entre plusieurs outils et équipes. L’utilisation de l’ordinateur permet à Claude de travailler en temps réel dans divers logiciels comme s’il était assis devant un ordinateur, accomplissant de nombreuses tâches en plusieurs étapes qui ne peuvent pas être réalisées uniquement par le code. L’acquisition de Vercept aidera l’entreprise à renforcer davantage ces capacités.
Basé à Seattle, aux États-Unis, Vercept a été fondé par des anciens élèves de l’Allen Institute for AI (AI2) et se positionne comme agent IA vision-first, axé sur l’automatisation sans API qui « regarde les écrans et contrôle les ordinateurs comme des humains ». Les membres principaux de l’équipe sont responsables de la robotique, de l’intelligence incarnée, de l’IA Agent et de l’apprentissage par renforcement.
Sur la base de l’accumulation technologique et du parcours de l’équipe fondatrice, Vercept a conclu un tour de financement initial de 16 millions de dollars en janvier 2025, évalué à environ 67 millions de dollars, et la liste des investisseurs comprend l’ancien PDG de Google Eric Schmidt, le scientifique en chef de Google DeepMind Jeff Dean, le fondateur de Cruise Kyle Vogt et d’autres. Le montant total des fonds collectés par Vercept s’élève à environ 50 millions de dollars.
Anthropic estime que l’expertise de Vercept en perception et interaction s’applique directement à certains des problèmes les plus difficiles auxquels Anthropic est confronté. L’application de bureau Vercept, Vy, sera fermée pendant 30 jours et, dans le cadre de cette transition, Vercept encourage les utilisateurs à essayer l’outil Claude d’Anthropic comme alternative à la fin du service.
En parlant des considérations liées à l’acquisition, Luca Weihs, cofondateur de Vercept, a déclaré qu’à l’avenir, la capacité de Claude à réaliser des tâches de travail basées sur la connaissance sera comparable au niveau de code qu’il écrit aujourd’hui, ce qui signifie que la manière dont les gens interagissent avec les ordinateurs pourrait fondamentalement changer pour que cette expérience d’interaction soit aussi importante que le modèle sous-jacent.
Cette acquisition reflète la concurrence croissante dans la filière AI Agent, capable de contrôler des ordinateurs et d’autres appareils et d’accomplir des tâches pour les utilisateurs. En plus d’Anthropic, OpenAI est également activement déployé. À la mi-février, Peter Steinberger, fondateur d’OpenClaw, a annoncé qu’il rejoindrait OpenAI à plein temps pour développer la prochaine génération d’agents personnels d’IA. Le projet OpenClaw n’a pas été acquis par OpenAI ni fusionné avec l’entreprise, mais a été transféré à l’Independent Open Source Foundation, continuant à maintenir le protocole open source du MIT et l’autonomie communautaire. OpenAI fournit financement, technologie et parrainage de ressources de modèles, mais ne possède ni ne contrôle les décisions de projet. Grâce à la méthode « introduction des talents », cela complète la capacité d’OpenAI à intégrer des agents IA personnels et met en valeur l’avant-garde d’Anthropic chez les agents de niveau entreprise.
Bien qu’il existe des différences dans les méthodes d’exploitation, il s’agit essentiellement d’un pari entre les deux entreprises sur la voie des agents IA. Le fondateur d’Anthropic, Dario Amodei, a déclaré dans une interview récente que la forme ultime d’évolution de l’IA n’est pas un générateur de texte, mais un système d’exécution en boucle fermée avec un contrôle informatique universel. Il peut accomplir des tâches de production complexes telles que le montage vidéo et l’ingénierie logicielle en observant des écrans, en consultant l’historique, en comprenant le contexte et en collaborant entre plateformes comme les humains.
Le principal obstacle dans l’industrie actuelle n’est pas l’intelligence, mais la fiabilité de l’interaction – c’est-à-dire que la capacité du modèle est suffisamment forte, mais elle reste insuffisante pour accomplir une tâche de manière stable, précise et sans erreurs. Dans les un à trois ans suivants, l’IA résoudra la plupart des besoins d’emploi nécessitant un « apprentissage sur le terrain » grâce à la combinaison de gestion à long contexte et de contrôle par vision par ordinateur.
(Source de l’article : Yicai)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Anthropic acquiert OpenAI pour attirer des talents : quels sont les plans des « doubles puissances » de la Silicon Valley ?
Le 26 février, heure de Pékin, Anthropic, une entreprise de premier plan en IA aux États-Unis, a annoncé l’acquisition de Vercept, une startup d’IA d’automatisation informatique axée sur la vision, afin de compenser les lacunes visuelles des fonctions d’utilisation informatique. Il s’agit de la deuxième acquisition d’Anthropic après l’acquisition de la start-up full-stack de la chaîne d’outils Bun en décembre 2025.
L’utilisation informatique est la capacité principale du contrôle direct par IA des ordinateurs créée par Anthropic pour son grand modèle Claude, permettant à Claude de « regarder l’écran, déplacer la souris, taper le clavier et utiliser le logiciel » comme un humain, et d’accomplir des tâches complexes en plusieurs étapes et inter-applications, qui seront publiées avec Claude 3.5 Sonnet en octobre 2024.
Cependant, en raison des goulots d’étranglement dans la précision de la compréhension visuelle, de la reconnaissance complexe des interfaces et du traitement dynamique de la scène au stade initial du modèle, le taux de réussite de l’utilisation de l’ordinateur est faible et la tâche est facile à échouer. L’accumulation de Vercept en reconnaissance d’interface utilisateur haute précision, en raisonnement spatial, en suivi dynamique des interfaces et en traitement visuel à faible latence peut compenser ces lacunes.
Selon Anthropic, les développeurs utilisent Claude pour gérer des tâches de plus en plus complexes, notamment l’écriture et l’exécution de code entre dépôts, la synthèse de recherches provenant de dizaines de sources, et la gestion des flux de travail entre plusieurs outils et équipes. L’utilisation de l’ordinateur permet à Claude de travailler en temps réel dans divers logiciels comme s’il était assis devant un ordinateur, accomplissant de nombreuses tâches en plusieurs étapes qui ne peuvent pas être réalisées uniquement par le code. L’acquisition de Vercept aidera l’entreprise à renforcer davantage ces capacités.
Basé à Seattle, aux États-Unis, Vercept a été fondé par des anciens élèves de l’Allen Institute for AI (AI2) et se positionne comme agent IA vision-first, axé sur l’automatisation sans API qui « regarde les écrans et contrôle les ordinateurs comme des humains ». Les membres principaux de l’équipe sont responsables de la robotique, de l’intelligence incarnée, de l’IA Agent et de l’apprentissage par renforcement.
Sur la base de l’accumulation technologique et du parcours de l’équipe fondatrice, Vercept a conclu un tour de financement initial de 16 millions de dollars en janvier 2025, évalué à environ 67 millions de dollars, et la liste des investisseurs comprend l’ancien PDG de Google Eric Schmidt, le scientifique en chef de Google DeepMind Jeff Dean, le fondateur de Cruise Kyle Vogt et d’autres. Le montant total des fonds collectés par Vercept s’élève à environ 50 millions de dollars.
Anthropic estime que l’expertise de Vercept en perception et interaction s’applique directement à certains des problèmes les plus difficiles auxquels Anthropic est confronté. L’application de bureau Vercept, Vy, sera fermée pendant 30 jours et, dans le cadre de cette transition, Vercept encourage les utilisateurs à essayer l’outil Claude d’Anthropic comme alternative à la fin du service.
En parlant des considérations liées à l’acquisition, Luca Weihs, cofondateur de Vercept, a déclaré qu’à l’avenir, la capacité de Claude à réaliser des tâches de travail basées sur la connaissance sera comparable au niveau de code qu’il écrit aujourd’hui, ce qui signifie que la manière dont les gens interagissent avec les ordinateurs pourrait fondamentalement changer pour que cette expérience d’interaction soit aussi importante que le modèle sous-jacent.
Cette acquisition reflète la concurrence croissante dans la filière AI Agent, capable de contrôler des ordinateurs et d’autres appareils et d’accomplir des tâches pour les utilisateurs. En plus d’Anthropic, OpenAI est également activement déployé. À la mi-février, Peter Steinberger, fondateur d’OpenClaw, a annoncé qu’il rejoindrait OpenAI à plein temps pour développer la prochaine génération d’agents personnels d’IA. Le projet OpenClaw n’a pas été acquis par OpenAI ni fusionné avec l’entreprise, mais a été transféré à l’Independent Open Source Foundation, continuant à maintenir le protocole open source du MIT et l’autonomie communautaire. OpenAI fournit financement, technologie et parrainage de ressources de modèles, mais ne possède ni ne contrôle les décisions de projet. Grâce à la méthode « introduction des talents », cela complète la capacité d’OpenAI à intégrer des agents IA personnels et met en valeur l’avant-garde d’Anthropic chez les agents de niveau entreprise.
Bien qu’il existe des différences dans les méthodes d’exploitation, il s’agit essentiellement d’un pari entre les deux entreprises sur la voie des agents IA. Le fondateur d’Anthropic, Dario Amodei, a déclaré dans une interview récente que la forme ultime d’évolution de l’IA n’est pas un générateur de texte, mais un système d’exécution en boucle fermée avec un contrôle informatique universel. Il peut accomplir des tâches de production complexes telles que le montage vidéo et l’ingénierie logicielle en observant des écrans, en consultant l’historique, en comprenant le contexte et en collaborant entre plateformes comme les humains.
Le principal obstacle dans l’industrie actuelle n’est pas l’intelligence, mais la fiabilité de l’interaction – c’est-à-dire que la capacité du modèle est suffisamment forte, mais elle reste insuffisante pour accomplir une tâche de manière stable, précise et sans erreurs. Dans les un à trois ans suivants, l’IA résoudra la plupart des besoins d’emploi nécessitant un « apprentissage sur le terrain » grâce à la combinaison de gestion à long contexte et de contrôle par vision par ordinateur.
(Source de l’article : Yicai)