O Agente de IA, como um ramo importante do campo da inteligência artificial, está gradualmente passando do conceito para a realidade, mostrando um enorme potencial de aplicação em vários setores, incluindo a indústria Web3.
Escrito por: pignard.eth, Equipa ZAN
No dia 6 de março, um produto de agente de IA universal chamado Manus, lançado pela startup chinesa Monica, dominou os meios de comunicação e as redes sociais de tecnologia na China. No primeiro dia de lançamento, o código de convite tornou-se escasso em toda a internet, chegando a valer 50 mil no Xianyu. No entanto, muitos KOLs do setor conseguiram obter códigos de convite antecipadamente, e uma enxurrada de artigos de interpretação de experiências seguiu.
Manus como produto de Agente AI genérico, possui a capacidade de completar tarefas de forma autônoma desde o planejamento até a execução, como redigir relatórios, criar tabelas, entre outros. Ele não apenas gera ideias, mas também pode pensar de forma independente e agir. Com sua poderosa capacidade de pensamento independente, planejamento e execução de tarefas complexas, entrega resultados completos diretamente, demonstrando uma versatilidade e capacidade de execução sem precedentes.
O sucesso explosivo do Manus não só trouxe atenção dentro da indústria, mas também forneceu valiosas ideias de produto e inspiração de design para o desenvolvimento de vários Agentes de IA. Com o rápido desenvolvimento da tecnologia de IA, os Agentes de IA, como uma importante ramificação do campo da inteligência artificial, estão gradualmente passando do conceito para a realidade, e exibindo um enorme potencial de aplicação em diversos setores, incluindo, claro, a indústria Web3.
AI Agent, ou agente de inteligência artificial, é um programa de computador capaz de tomar decisões de forma autônoma e executar tarefas com base no ambiente, nas entradas e nos objetivos predefinidos. Os componentes principais do AI Agent incluem um modelo de linguagem grande (LLM) como seu “cérebro”, permitindo-o processar informações, aprender com interações, tomar decisões e executar ações; mecanismos de observação e percepção, que permitem que ele perceba o ambiente; um processo de raciocínio que envolve analisar resultados de observação e conteúdos de memória, considerando ações possíveis; execução de ações, como uma resposta explícita ao raciocínio e à observação; e memória e recuperação, armazenando experiências passadas para aprendizado.
O modelo de design do AI Agent parte do ReAct e tem duas linhas de desenvolvimento: uma que se concentra mais nas capacidades de planejamento do AI Agent, incluindo REWOO, Plan & Execute, LLM Compiler. A outra se concentra mais nas capacidades de reflexão, incluindo Basic Reflection, Reflexion, Self Discover, LATS.
O modo ReAct é o primeiro padrão de design de agente de IA a aparecer e, atualmente, é o mais amplamente aplicado. Portanto, aqui vamos apresentar principalmente o conceito de ReAct. ReAct refere-se à combinação do raciocínio (Reasoning) e da ação (Acting) no modelo de linguagem para resolver tarefas diversificadas de raciocínio e decisão linguística. Seu fluxo típico é mostrado na figura abaixo e pode ser descrito por um ciclo interessante: Pensar (Thought) → Agir (Action) → Observar (Observation), abreviado como ciclo TAO.
O Agente de IA pode ser classificado em Agente Único e Multi Agente com base no número de agentes. O núcleo do Agente Único está na combinação de LLM e ferramentas, e durante a execução da tarefa, o Agente pode interagir com o usuário em várias rodadas. O Multi Agente atribui diferentes papéis a diferentes Agentes, completando tarefas complexas por meio da colaboração entre os Agentes. No entanto, durante a execução da tarefa, a interação com o usuário será menor em comparação com o Agente Único. Atualmente, a maioria das estruturas foca no cenário do Agente Único.
Modelo de Protocolo de Contexto (MCP) é um protocolo de código aberto lançado pela empresa Anthropic em 25 de novembro de 2024, destinado a resolver problemas de conexão e interação entre LLM e fontes de dados externas. Podemos comparar LLM a um sistema operativo, e MCP a uma interface USB, que suporta a inserção flexível de dados e ferramentas externas, permitindo que os usuários leiam e utilizem esses dados e ferramentas externas.
O MCP oferece três capacidades para expandir LLM: Recursos (expansão do conhecimento), Ferramentas (execução de funções, chamada de sistemas externos), Prompts (modelos de prompts pré-escritos). O protocolo MCP adota uma arquitetura Cliente-Servidor, e a transmissão subjacente utiliza o protocolo JSON-RPC. Qualquer pessoa pode desenvolver e hospedar um MCP Server, e pode desligar o serviço a qualquer momento.
No setor Web3, o clamor em torno dos Agentes de IA caiu drasticamente desde que atingiu o auge em janeiro deste ano, com o valor de mercado geral encolhendo mais de 90%. Atualmente, o clamor e o valor de mercado significativos ainda estão relacionados a explorações Web3 em torno do framework de Agentes de IA, que são representados pelo “modelo de plataforma de lançamento, com o Virtuals Protocol”, pelo “modelo DAO, com o ElizaOS” e pelo “modelo de empresa comercial, com o Swarms”.
A plataforma de lançamento é um espaço que permite aos usuários criar, implantar e monetizar agentes de IA, semelhante ao pump.fun em memes, mas focada em agentes de IA. O Virtuals Protocol é atualmente a maior plataforma de lançamento, com mais de cem mil agentes emitidos, e o popular “KOL do mundo cripto” AIXBT foi criado com base no Virtuals. O Virtuals Protocol inclui uma estrutura de agentes modular, chamada G.A.M.E, cujo objetivo central é fornecer aos desenvolvedores um framework eficiente e aberto, tornando o desenvolvimento e o lançamento de agentes de IA tão simples quanto criar um site no WordPress.
DAO representa Organização Autônoma Descentralizada. ElizaOS (anteriormente ai16z) foi fundada por @shawmakesmagic na plataforma daos.fun, com a ideia inicial de utilizar modelos de IA para simular as decisões de investimento da famosa firma de capital de risco a16z e seu cofundador Marc Andreessen, combinando-as com as sugestões dos membros do DAO para realizar investimentos. Posteriormente, evoluiu para um DAO de desenvolvedores de Agentes de IA com o framework Eliza como núcleo. O framework Eliza é construído em TypeScript, fornecendo uma plataforma flexível e escalável para o desenvolvimento de Agentes de IA, que podem interagir em várias plataformas, mantendo uma personalidade e conhecimento consistentes.
Swarms, iniciado pelo atual @KyeGomezB de 20 anos em 2022, é uma estrutura Multi Agent de nível empresarial. Através de orquestração inteligente e colaboração eficiente, Swarms permite que múltiplos Agentes de IA trabalhem juntos como uma equipe, resolvendo assim demandas complexas de operações comerciais. Inicialmente, Swarms era apenas um projeto de Agente de IA Web2, e de acordo com o fundador, Swarms tem mais de 45 milhões de agentes em operação em ambientes de produção, servindo algumas das maiores instituições financeiras, de seguros e de saúde do mundo. Somente após o lançamento do token $SWARMS em dezembro de 2024, ocorreu a transição oficial do Web2 para o Web3.
Do ponto de vista do modelo económico, só a plataforma de lançamento pode alcançar um circuito fechado económico autossuficiente. Tomemos o Virtuals como exemplo:
Além de cobrar uma taxa de lançamento do AI Agent, cada transação de token de agente também terá uma taxa de transação, e o AI Agent, ao acessar o LLM através da API do Virtuals, também incurra em taxas de inferência. Atualmente, ElizaOS e Swarms estão a planear construir a sua própria plataforma de lançamento.
Claro que a plataforma de lançamento também tem problemas, esse tipo de emissão de ativos requer que os próprios ativos emitidos tenham “atratividade” para formar um ciclo positivo. Atualmente, a grande maioria dos AI Agents lançados são essencialmente memes, sem suporte de valor intrínseco, e uma vez que perdem a atenção do mercado, rapidamente voltam a zero. No atual ambiente de mercado calmo, a plataforma de lançamento nem consegue atrair criadores, portanto, o modelo econômico, na prática, também não consegue funcionar.
A introdução do MCP trouxe novas direções de exploração para os Agentes de IA do Web3 atual, sendo as mais intuitivas duas direções:
A primeira direção apresenta exigências muito altas para os sistemas de armazenamento de blockchain subjacentes, capacidades de gerenciamento de dados e capacidades de computação assíncrona, podendo-se escolher blockchains como a 0G. A 0G é uma blockchain modular de IA, com uma camada DA escalável e programável adequada para dapps de IA. Sua tecnologia modular permitirá a interoperabilidade sem atritos entre as cadeias, garantindo a segurança, eliminando a fragmentação e maximizando a conectividade, criando um ecossistema de IA descentralizado.
A segunda direção é semelhante a uma variante do DeFAI, mas atualmente o back-end do DeFAI consiste em uma série de funções encapsuladas em ferramentas. A UnifAI criou um servidor DeFAI MCP unificado, evitando a duplicação de esforços. A UnifAI é uma plataforma que permite que agentes de IA autônomos executem tarefas tanto na blockchain quanto fora dela dentro do ecossistema Web3. Ela possui o UniQ para automação de tarefas, um mercado de serviços de agentes e infraestrutura para descoberta de ferramentas.
Além das duas direções acima, o fundador da LXDAO e ETHPanda @brucexu_eth propôs um plano para construir uma rede de incentivo para criadores OpenMCP.Network baseada em Ethereum. O servidor MCP precisa ser hospedado e fornecer serviços estáveis, os usuários pagam aos provedores de LLM, e os provedores de LLM distribuem os incentivos reais através da rede para os servidores MCP chamados, a fim de manter a sustentabilidade e estabilidade de toda a rede, estimulando os criadores do MCP a continuar criando e fornecendo conteúdo de alta qualidade. Este conjunto de rede precisará usar contratos inteligentes para realizar a automação, transparência, confiabilidade e resistência à censura dos incentivos. A assinatura, verificação de permissões e proteção de privacidade durante o processo de operação podem ser implementadas usando carteiras Ethereum, ZK e outras tecnologias.
Embora, em teoria, a combinação de MCP com Web3 possa injetar um mecanismo de confiança descentralizada e uma camada de incentivos econômicos nas aplicações de Agentes de IA, a tecnologia atual de provas de conhecimento zero (ZKP) ainda enfrenta dificuldades em verificar a autenticidade do comportamento dos Agentes, e as redes descentralizadas ainda apresentam problemas de eficiência, o que não constitui uma solução que possa ter sucesso a curto prazo.
O lançamento do Manus marca um importante marco para o produto de Agente de IA Genérica, sendo necessário um produto emblemático no mundo Web3 para quebrar as dúvidas externas sobre a falta de utilidade do Web3, que é visto apenas como uma especulação.
A chegada do MCP trouxe novas direções de exploração para o Agente de IA do Web3, incluindo a implementação do Servidor MCP na rede blockchain, bem como a capacidade do Servidor MCP de interagir com a blockchain, ou ainda a construção de uma rede de incentivos para criadores do Servidor MCP.
A IA é a narrativa mais grandiosa da história, e para o Web3, a fusão com a IA é inevitável. Precisamos continuar a manter paciência e confiança, e explorar continuamente.