Lição 1

Dados on-chain no universo Web3

Web3 representa a nova geração da Internet, caracterizada por uma abordagem descentralizada e voltada para o usuário em relação à propriedade dos dados. A tecnologia blockchain serve como alicerce para diversas aplicações Web3 já existentes. Neste capítulo, são apresentadas a definição e a classificação dos dados on-chain, analisado seu valor e oferecidas recomendações práticas.

O que são dados on-chain?

Dados on-chain são informações registradas diretamente em uma blockchain. Como a blockchain funciona como um banco de dados distribuído, esses dados são públicos e acessíveis para qualquer pessoa.

Web3 e web2 representam diferentes gerações da World Wide Web, sendo que a web3 é a mais recente e avançada. As principais diferenças entre elas incluem:

  1. A web3 é descentralizada, enquanto a web2 é centralizada. Na web3, dados e serviços são fornecidos por uma rede distribuída de nós, e não por uma única organização. Isso torna a web3 mais resiliente e menos vulnerável à censura ou falhas, embora também seja mais complexa e difícil de controlar.

  2. A web3 é baseada em tecnologia blockchain, já a web2 utiliza arquitetura tradicional cliente-servidor. Na web3, os dados são armazenados e transferidos por meio de algoritmos criptográficos, em vez de servidores centrais. Isso garante mais segurança e transparência, mas pode resultar em maior lentidão e custos.

  3. A web3 busca habilitar novos tipos de aplicações e serviços, enquanto a web2 foca no aprimoramento de soluções já existentes. Por isso, a web3 é mais experimental e inovadora, e a web2 é mais madura e consolidada.

Essas diferenças influenciam diretamente o modo de análise de dados em cada ambiente. Na web3, a análise é voltada para o comportamento das redes descentralizadas e da tecnologia blockchain. Frequentemente, são utilizadas técnicas avançadas, como aprendizado de máquina e análise de redes, para detectar padrões e tendências. Na web2, o foco está no comportamento dos usuários e das aplicações utilizadas, com métodos tradicionais como análise estatística e visualização de dados para identificar tendências e insights.

Para realizar análise de dados on-chain, é necessário coletar e organizar os dados relevantes e utilizar ferramentas como visualização de dados e análise estatística para identificar padrões e tendências. Isso permite entender melhor o funcionamento da rede blockchain e de seus usuários, além de prever possíveis movimentos do mercado. Em algumas situações, técnicas de aprendizado de máquina podem automatizar a análise e revelar padrões mais sofisticados.

Categorias de dados on-chain

Existem duas categorias de dados on-chain:

  1. Dados brutos

  2. Abstrações

Essas categorias são destacadas porque todas as métricas calculadas são, na verdade, abstrações sobre os dados brutos. Os dados brutos on-chain são informações não processadas registradas na blockchain, incluindo detalhes de transações individuais, como remetente, destinatário e valor transferido em criptomoeda. Por outro lado, os dados econômicos são derivados dos dados brutos e incluem informações sobre oferta, demanda, capitalização de mercado e volume de negociação de determinada criptomoeda.

Os dados econômicos não são apenas abstrações dos dados brutos, mas são calculados por meio de diversas técnicas e métricas. Por exemplo, a capitalização de mercado é obtida multiplicando o fornecimento total de uma criptomoeda pelo seu preço atual, e o volume de negociação é calculado somando o número total de transações em determinado período. Outras métricas, como velocidade do dinheiro e razão entre valor de rede e volume de transações, podem ser calculadas utilizando fórmulas mais complexas, considerando fatores como número de transações e atividade geral da rede.

No geral, os dados econômicos oferecem uma visão mais ampla do mercado de criptomoedas e são úteis para entender tendências e tomar decisões de investimento. No entanto, é fundamental lembrar que esses dados nem sempre refletem de forma precisa ou completa o mercado real e devem ser utilizados com cautela.

Soluções analíticas diferentes

Centralização vs descentralização

Há diversas soluções para indexação de dados on-chain, tanto centralizadas quanto descentralizadas. Soluções centralizadas envolvem uma única entidade responsável por coletar e organizar os dados, enquanto as descentralizadas utilizam uma rede distribuída de nós para indexar as informações. Exemplos incluem exploradores de blocos, que permitem pesquisar e navegar pela blockchain, e serviços de indexação que oferecem APIs e ferramentas para desenvolvedores acessarem e analisarem dados on-chain.

É possível criar uma solução analítica descentralizada utilizando blockchain, dependendo dos requisitos e restrições do sistema. Um dos principais benefícios dessa abordagem é garantir a integridade e segurança dos dados analisados. Contudo, sistemas descentralizados podem ser mais complexos de implementar e demandar mais recursos computacionais e de armazenamento. Quanto ao desempenho, sistemas descentralizados podem ser mais lentos que soluções centralizadas em alguns casos, dependendo dos algoritmos, estruturas de dados e arquitetura do sistema. No final, a escolha entre abordagem descentralizada ou centralizada depende das necessidades e objetivos da solução analítica.

O que pode ser feito com dados de blockchain?

Há várias metodologias que podem ser aplicadas na análise de dados on-chain. Exemplos comuns incluem:

Análise descritiva

Análise descritiva, que resume e descreve os dados, incluindo cálculos estatísticos básicos e geração de visualizações. Esse tipo de análise fornece uma visão geral dos dados e ajuda a identificar tendências e padrões.


Análise exploratória

Análise exploratória, que investiga os dados de forma mais aprofundada, aplicando técnicas como agrupamento e redução de dimensionalidade. Esse tipo de análise revela padrões ocultos e relacionamentos nos dados, além de gerar hipóteses e ideias para novas pesquisas.


Análise inferencial

Análise inferencial, que utiliza técnicas estatísticas para fazer inferências sobre uma população a partir de uma amostra dos dados. São aplicados métodos para calcular média, mediana, moda, desvio padrão, além de ferramentas para testar hipóteses e realizar análise de regressão. Esse tipo de análise é útil para fazer previsões e generalizações, identificando tendências e padrões menos evidentes.


Análise preditiva

Análise preditiva, que emprega algoritmos de aprendizado de máquina para prever eventos ou resultados futuros com base nos dados. Essa abordagem identifica tendências e padrões e pode gerar previsões ou recomendações. Normalmente, técnicas como agrupamento, classificação e regressão são usadas para detectar padrões e relações nos dados.

A metodologia escolhida para análise de dados on-chain depende dos objetivos, requisitos e da natureza dos dados.

A visualização de dados é uma ferramenta analítica essencial para representar dados complexos de forma visual, utilizando gráficos, diagramas e mapas que facilitam a identificação de tendências e padrões. Por exemplo, um gráfico de linha pode mostrar a evolução do preço de uma criptomoeda, enquanto um gráfico de barras pode comparar capitalizações de mercado. Ferramentas de visualização também permitem criar visualizações interativas, possibilitando que usuários explorem e interajam com os dados em tempo real, identificando relações e padrões não evidentes nos dados brutos.

Você pode se perguntar: por que usar ferramentas de visualização se exploradores de blocos já apresentam informações detalhadas? Ferramentas de visualização e exploradores de blocos são recursos distintos para análise de dados on-chain, com propósitos e tipos de informação diferentes.

Ferramentas de visualização de dados facilitam a compreensão e identificação de tendências e padrões por meio de representações visuais. Exploradores de blocos, por outro lado, são plataformas online que permitem navegar pela blockchain e visualizar dados sobre blocos, transações e endereços. Eles oferecem uma interface intuitiva para acessar e interagir com os dados, mas geralmente não incluem recursos avançados de análise ou visualização. Em geral, as ferramentas de visualização podem ser usadas em conjunto com exploradores de blocos para uma análise mais completa dos dados da blockchain.

Web3; ciência de dados; oportunidades profissionais

Ao debater o futuro da Web3 e da ciência de dados, considere quatro pontos principais:

A Web3 abrirá novas oportunidades profissionais para cientistas de dados e outros especialistas em dados. Empresas que pretendem adotar Web3 precisarão de profissionais experientes em análise, interpretação e desenvolvimento de produtos e serviços baseados em dados, integrando inteligência artificial (IA) e aprendizado de máquina (ML).

Usuários e cientistas de dados terão ganhos financeiros com a Web3. Empresas poderão comprar dados diretamente dos usuários (permitindo que proprietários vendam suas informações para quem quiserem), combinar novos conjuntos de dados com bases existentes para aprimorar modelos de aprendizado e comercializar novos insights no mercado aberto.

Cientistas de dados poderão aplicar IA para entender melhor as necessidades dos clientes na Web3. Empresas de dados podem criar modelos de linguagem que oferecem “entendimento semântico”, já que a Web3 é focada no usuário e os dados estão ligados à interação individual. Assim, soluções personalizadas podem ser desenvolvidas para cada usuário. Além disso, insights extraídos dos dados brutos podem ser transformados em recomendações de produtos que aprimoram a experiência do cliente conforme suas expectativas.

Na era da Web3, cientistas de dados terão papel decisivo na economia global. Eles serão os novos “neurônios”, capazes de criar conteúdo ou modelos de IA que interagem com outros modelos e resolvem problemas complexos ou riscos para empresas e organizações.

Isenção de responsabilidade
* O investimento em criptomoedas envolve grandes riscos. Prossiga com cautela. O curso não se destina a servir de orientação para investimentos.
* O curso foi criado pelo autor que entrou para o Gate Learn. As opiniões compartilhadas pelo autor não representam o Gate Learn.