O quadro do Agente de IA é a última peça do quebra-cabeça? Como interpretar a 'dualidade onda-partícula' do quadro?

DeepFlowTech

2025-01-03 07:35:35

Escrito por Kevin, o Pesquisador da BlockBooster

A estrutura do Agente de IA, como peça chave para o desenvolvimento da indústria, pode ter o potencial duplo de impulsionar a implementação da tecnologia e a maturidade do ecossistema. As estruturas discutidas no mercado incluem: Eliza, Rig, Swarms, ZerePy, etc. Estas estruturas atraem desenvolvedores através do repositório do Github, estabelecendo assim a sua reputação. Ao emitirem moedas através de ‘repositórios’, estas estruturas possuem simultaneamente as características de ondas e partículas, ao mesmo tempo que possuem as características de um Agente sério e de uma Memecoin. Este texto irá focar-se na ‘dualidade onda-partícula’ das estruturas e por que a estrutura do Agente pode vir a ser a peça final.

Os efeitos externos trazidos pelo framework do Agente podem deixar brotos de primavera depois que a espuma desaparecer.

Desde o nascimento da GOAT, a força do impacto narrativo do Agente no mercado tem aumentado constantemente, como um mestre de kung fu, com o punho esquerdo ‘Memecoin’ e a palma da mão direita ‘esperança da indústria’, você sempre acabará sendo derrotado em um desses movimentos. Na verdade, os cenários de aplicação do Agente de IA não são estritamente distintos, as fronteiras entre plataforma, estrutura e aplicação específica são borradas, mas ainda podem ser classificadas aproximadamente de acordo com as preferências de token ou protocolo. No entanto, de acordo com as preferências de desenvolvimento de token ou protocolo, ainda podem ser divididos em algumas categorias seguintes:

Launchpad: plataforma de lançamento de ativos. Protocolo Virtuals on-chain e clanker da Base, Dasha da cadeia Solana.

Aplicação de Agente de IA: Combinando Agent e Memecoin, há lugares notáveis em termos de configuração de memória de armazenamento, como GOAT, aixbt, etc. Essas aplicações geralmente têm saída unidirecional e condições de entrada muito limitadas.

Motor de AI Agent: griffain da cadeia Solana e Spectre AI da cadeia base. griffain pode evoluir do modo de leitura/escrita para o modo de leitura/escrita/ação; Spectre AI é um motor RAG para pesquisa na cadeia.

Estrutura do Agente de IA: Para a plataforma de estrutura, o Agente em si é um ativo, portanto, a estrutura do Agente é a plataforma de emissão de ativos do Agente, é o Launchpad do Agente. Os projetos representativos atualmente incluem ai16, Zerebro, ARC e o recentemente discutido Swarms.

Outras direções menores: Simmi agente de tipo composto; Modo de protocolo AgentFi; Seraph agente de falsificação de tipo; Criador.Bid agente API em tempo real.

Ao discutir ainda mais o framework do Agente, pode-se ver que ele possui uma externidade suficiente. Ao contrário dos desenvolvedores de grandes blockchains e protocolos, que só podem escolher entre diferentes ambientes de desenvolvimento de linguagens, o tamanho total de desenvolvedores na indústria não aumentou proporcionalmente ao aumento do valor de mercado. O Github Repo é onde os desenvolvedores Web2 e Web3 estabelecem consenso, construindo comunidades de desenvolvedores e tendo um impacto mais forte e atraente para os desenvolvedores Web2 do que qualquer pacote desenvolvido separadamente por um protocolo que seja “plug and play”.

As 4 frameworks mentioned in this article have been open-sourced: ai16z’s Eliza framework has received 6200 stars; Zerebro’s ZerePy framework has received 191 stars; ARC’s RIG framework has received 1700 stars; Swarms’s Swarms framework has received 2100 stars. Currently, the Eliza framework is widely used in various Agent applications and has the widest coverage. The development level of ZerePy is not high, and the development direction is mainly focused on X, and it does not yet support local LLM and integrated memory. RIG has the highest relative development difficulty, but it provides developers with the greatest freedom to achieve performance optimization. Besides launching mcs, Swarms doesn’t have any other use cases yet, but Swarms can integrate different frameworks and has a lot of imagination space.

Além disso, na classificação acima, a separação entre o mecanismo e o framework do Agente pode causar confusão. Mas acredito que exista uma diferença entre os dois. Primeiro, por que é um mecanismo? Comparar com um mecanismo de busca da vida real é relativamente apropriado. Ao contrário de aplicativos de Agente homogêneos, o desempenho do mecanismo do Agente está acima deles, mas ao mesmo tempo é totalmente encapsulado, um ‘caixa-preta’ que pode ser ajustado por meio de interfaces de API. Os usuários podem experimentar o desempenho do mecanismo do Agente através de um fork, mas não podem ter uma visão completa e personalização total como no framework básico. Cada mecanismo do usuário é como um espelho gerado em um Agente bem treinado, sendo uma interação com o espelho. Já o framework é essencialmente para se adaptar à cadeia, pois tanto o mecanismo do Agente quanto o framework do Agente têm como objetivo final integrar-se à cadeia correspondente. Como definir a forma de interação de dados, como definir a forma de validação de dados, como definir o tamanho do bloco, como equilibrar o consenso e o desempenho, essas são as coisas que o framework precisa considerar. E o mecanismo? Apenas precisa fazer ajustes precisos no modelo e nas configurações de interação de dados e memória em uma determinada direção, o desempenho é o único critério de avaliação, enquanto o framework não é.

Avaliar o framework do Agente com a perspectiva da ‘dualidade onda-partícula’ pode ser o pressuposto para garantir que estamos no caminho certo

Durante o ciclo de vida de uma única entrada e saída, o Agente requer três componentes. Primeiro, o modelo de base determina a profundidade e o método de pensamento. Em seguida, a memória é personalizada e ajustada com base na saída do modelo de base. Por fim, a operação de saída é concluída em diferentes clientes.

Fonte: @SuhailKakar

Para confirmar a natureza dual de partícula-onda do framework Agent, a ‘onda’ representa as características do ‘Memecoin’, representando a cultura da comunidade e a atividade dos desenvolvedores, enfatizando a atratividade e a capacidade de disseminação do Agent; a ‘partícula’ representa as características das ‘expectativas do setor’, representando o desempenho fundamental, casos de uso reais e profundidade técnica. Vou ilustrar isso usando tutoriais de desenvolvimento dos três frameworks em dois aspectos diferentes.

Estrutura Eliza de montagem rápida

Configurar o ambiente

Fonte: @SuhailKakar

Instalar Eliza

Fonte: @SuhailKakar

Arquivo de configuração

Fonte: @SuhailKakar

Definir o caráter do agente

Fonte: @SuhailKakar

A estrutura do Eliza é relativamente fácil de usar. É baseado em TypeScript, uma linguagem familiar para a maioria dos desenvolvedores da Web e Web3. A estrutura é concisa, sem abstração excessiva, permitindo que os desenvolvedores adicionem facilmente as funcionalidades desejadas. No passo 3, é possível integrar o Eliza em vários clientes, o que pode ser entendido como um montador de integração de vários clientes. O Eliza suporta plataformas como DC, TG e X, além de suportar vários modelos de linguagem grandes. Pode-se inserir através das mídias sociais mencionadas e obter saídas usando o modelo LLM. Também oferece suporte à gestão de memória incorporada, permitindo que os desenvolvedores implantem rapidamente um Agente de IA de acordo com suas preferências.

Devido à simplicidade da estrutura e à riqueza da interface, Eliza reduziu significativamente a barreira de entrada e alcançou um padrão de interface relativamente unificado.

Um framework ZerePy de uso simplificado

Bifurcar o repositório do ZerePy

Fonte:

Configurar X e GPT

Fonte:

Definir a personalidade do Agente

Fonte:

Estrutura de Rig otimizada para desempenho

Tomando a construção do Agente RAG (Recuperação Aprimorada e Geração) como exemplo:

Configurar o ambiente e a chave do OpenAI

Source:

Configurar o cliente OpenAI e usar o Chunking para processar PDF

Source:

Definir a estrutura do documento e incorporar

Fonte:

Criar armazenamento de vetor e agente RAG

Fonte:

Rig (ARC) é um framework de construção de sistemas de IA baseado em Rust, direcionado para o mecanismo de fluxo de trabalho LLM, que visa resolver problemas de otimização de desempenho de nível mais baixo. Em outras palavras, o ARC é uma ‘caixa de ferramentas’ de mecanismo de IA que oferece serviços de suporte em segundo plano, como chamadas de IA, otimização de desempenho, armazenamento de dados e tratamento de exceções.

O Rig visa resolver o problema da ‘chamada’ para ajudar os desenvolvedores a escolherem melhor o LLM, otimizar as sugestões de palavras-chave, gerenciar tokens de forma mais eficiente e lidar com questões de processamento paralelo, gerenciamento de recursos e redução de latência. O foco está em como ‘usá-lo’ durante a colaboração entre o modelo AI LLM e o sistema AI Agent.

Rig é uma biblioteca open source em Rust que visa simplificar o desenvolvimento de aplicativos orientados por driver LLM (incluindo o RAG Agent). Devido à maior abertura do Rig, exige-se mais dos desenvolvedores, bem como um maior entendimento de Rust e do Agent. Este tutorial aqui descreve o processo básico de configuração do RAG Agent, que aprimora o LLM combinando-o com recuperação de conhecimento externo. Em outros DEMOs no site oficial, é possível ver as seguintes características do Rig:

LLM Interface Unificada: suporta APIs consistentes de provedores LLM diferentes, simplificando a integração.

Fluxo de trabalho abstrato: componentes pré-construídos e modulares permitem que o Rig assuma a tarefa de projetar sistemas de IA complexos.

Armazenamento de vetor integrado: suporte embutido para armazenamento de fragmento, fornecendo desempenho eficiente em agentes de pesquisa semelhantes a RAG.

Incorporação flexível: oferece uma API fácil de usar para lidar com a incorporação, reduzindo a dificuldade de compreensão semântica ao desenvolver Agentes de busca similares, como RAG Agent.

Pode-se ver que em comparação com Eliza, Rig oferece espaço adicional de otimização de desempenho para desenvolvedores, ajudando-os a depurar melhor as chamadas e otimizações de colaboração do LLM e do Agente. Rig tem um desempenho impulsionado por Rust, aproveitando as vantagens de abstração de custo zero e segurança de memória do Rust, operações de LLM de alta performance e baixa latência. Ele pode fornecer maior liberdade em um nível mais baixo.

Estrutura de enxames de decomposição composta do Swarms

Swarms tem como objetivo fornecer um framework de orquestração de vários agentes de nível empresarial e de produção. O site oficial oferece dezenas de fluxos de trabalho e arquiteturas de agentes paralelos e sequenciais, aqui estão algumas delas.

Fluxo de trabalho sequencial

Source:

A arquitetura Swarm em sequência processa tarefas em ordem linear. Cada agente conclui sua tarefa antes de passar o resultado para o próximo agente na cadeia. Essa arquitetura garante processamento ordenado e é especialmente útil quando as tarefas têm dependências.

Exemplo:

Cada etapa do processo depende da etapa anterior, como uma linha de montagem ou processamento de dados sequencial.

Cenário que requer uma estrita sequência de operações.

Arquitetura em camadas:

Fonte:

Implementar o controle de cima para baixo, com o agente superior coordenando as tarefas entre os agentes subordinados. Os agentes executam as tarefas simultaneamente e depois retroalimentam os resultados de volta ao ciclo para agregação final. Isso é muito útil para tarefas altamente paralelizáveis.

Arquitetura de formato de tabela eletrônica:

Fonte:

Arquitetura de grupo em grande escala para gerenciar simultaneamente vários agentes em funcionamento. Pode gerenciar milhares de agentes ao mesmo tempo, cada um executando em sua própria thread. É uma escolha ideal para supervisionar a saída de agentes em grande escala.

Swarms não é apenas um framework de Agente, mas também é compatível com os frameworks Eliza, ZerePy e Rig mencionados acima, para maximizar o desempenho do Agente em diferentes fluxos de trabalho e arquiteturas, a fim de resolver problemas correspondentes. A concepção de Swarms e o progresso da comunidade de desenvolvedores estão bem.

Eliza: A mais fácil de usar, adequada para iniciantes e desenvolvimento rápido de protótipos, especialmente adequada para interação de IA em plataformas de mídia social. A estrutura é simples, facilitando a integração e modificação rápida, adequada para cenários que não requerem otimização excessiva de desempenho.

ZerePy: Implantação com um clique, adequada para desenvolvimento rápido de aplicativos de agente de IA Web3 e plataformas sociais. Adequado para aplicativos de IA leves, estrutura simples, configuração flexível, adequado para construção e iteração rápidas.

Rig: foco na otimização de desempenho, especialmente excelente em tarefas de alta concorrência e alto desempenho, adequado para desenvolvedores que necessitam de controle e otimização detalhados. A estrutura é mais complexa e requer conhecimento de Rust, sendo mais adequada para desenvolvedores mais experientes.

Swarms: adequado para aplicações empresariais, suporta a colaboração de vários agentes e gestão de tarefas complexas. A estrutura é flexível, suporta processamento em paralelo em grande escala e oferece várias configurações de arquitetura, mas devido à sua complexidade, pode exigir um conhecimento técnico mais forte para aplicação eficaz.

Em geral, Eliza e ZerePy têm vantagens em termos de usabilidade e desenvolvimento rápido, enquanto Rig e Swarms são mais adequados para desenvolvedores profissionais ou aplicativos corporativos que exigem alta performance e processamento em grande escala.

Esta é a razão pela qual a estrutura do Agente possui a característica de ‘esperança da indústria’, a referida estrutura ainda está em estágios iniciais, a prioridade imediata é estabelecer uma vantagem inicial e construir uma comunidade de desenvolvedores ativa. O desempenho da estrutura em si e se está ou não atrasada em relação às aplicações populares do Web2 não são as principais contradições. Apenas uma constante entrada de desenvolvedores na estrutura pode levar à vitória final, porque a indústria Web3 sempre precisa atrair a atenção do mercado, por mais forte que seja o desempenho da estrutura e por mais sólidos que sejam os fundamentos, se a dificuldade de uso levar à falta de interesse, então a ordem de importância estará invertida. Sob a premissa de que a estrutura em si pode atrair desenvolvedores, uma estrutura com um modelo econômico de tokens mais maduro e completo se destacará.

A estrutura do Agente tem a característica ‘Memecoin’, o que é muito compreensível. As moedas da estrutura acima não têm um design econômico razoável, as moedas não têm casos de uso ou têm casos de uso muito singulares, não têm um modelo de negócios validado e não têm uma roda de moedas eficaz. A estrutura é apenas uma estrutura e não está organicamente ligada às moedas. O crescimento do preço das moedas, além do FOMO, é difícil de obter suporte fundamental, e não há proteção suficiente para garantir um crescimento de valor estável e duradouro. Além disso, a própria estrutura acima parece bastante rudimentar, e seu valor real não corresponde ao valor de mercado atual, portanto, tem uma forte característica de ‘Memecoin’.

É importante notar que o ‘comportamento ondulatório-partícula’ do quadro do Agente não é uma desvantagem e não deve ser grosseiramente interpretado como uma meia-água que não é puramente Memecoin nem tem casos de uso de token. Como eu mencionei em meu último artigo, o quadro do Agente leve cobre uma máscara ambígua de Memecoin, e a cultura da comunidade e os fundamentos não serão mais contraditórios. Um novo caminho de desenvolvimento de ativos está gradualmente emergindo. Embora existam bolhas e incertezas no estágio inicial do quadro do Agente, seu potencial para atrair desenvolvedores e impulsionar a aplicação do mercado não pode ser ignorado. No futuro, o quadro com um modelo econômico de token completo e um forte ecossistema de desenvolvedores pode se tornar o pilar chave desta corrida.

Ver original

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Comentário

0/400

Sem comentários