2026 anos de inteligência artificial, a batalha pelos "dados corretos" começa... O design baseado em semântica determinará o vencedor

robot
Geração do resumo em andamento

2025年 é o ano em que a inteligência artificial generativa(AI) se torna o tema central da indústria, iniciando a “Renascença dos Dados”. Mas até 2026, a sua importância já ultrapassa a mera aquisição de dados de alta qualidade, e a questão de como fazer com que os modelos de AI realmente compreendam e utilizem a semântica dos “dados corretos” em camadas(semantic layers) de significado torna-se uma questão crucial. Isso marca o início da era do design de dados semânticos, que inclui grafos de conhecimento e ontologias, capazes de esclarecer o contexto, o significado semântico e a identidade comercial dos dados.

No ano passado, a febre da “agente inteligente” AI varreu toda a indústria, com muitas empresas esperando alcançar automação de negócios e otimização de decisões por meio dela. Mas a maioria das inteligências artificiais não atingiu as expectativas, e a qualidade dos dados utilizados e a adequação do contexto começaram a ser vistas como causas fundamentais. Pesquisas da Carnegie Mellon University indicam que, atualmente, os agentes ainda não receberam treinamento suficiente para lidar com tarefas complexas, e erros de raciocínio causados pelo contexto dos dados reduzem o desempenho geral.

Nesse contexto, a precisão dos dados(Data Quality) e o sistema de governança(Data Governance) tornaram-se tópicos importantes para o desenvolvimento de um nível maduro. Embora fornecedores principais de nuvem como a Amazon Web Services(AWS) ainda ofereçam ecossistemas de dados extensos, suas novas tecnologias e inovações de plataforma relacionadas a dados têm sido limitadas em comparação ao ano anterior. Em contrapartida, aquisições como a da Confluent pela IBM e o lançamento do HorizonDB pela Microsoft, baseado no PostgreSQL, simbolizam uma tendência de reconstrução da pilha tecnológica de dados.

Arquiteturas zeroETL e tecnologias de compartilhamento de dados já se tornaram padrão em 2025. Trata-se de tentativas de simplificar pipelines de dados complexos e frágeis, como plataformas Snowflake e Databricks, que, ao suportar integrações com SAP ou Salesforce, aumentaram significativamente a acessibilidade aos dados de negócios.

Outra tendência é a popularização do processamento de dados vetoriais. A maioria das plataformas de dados principais aprimorou suas funções de busca e análise vetorial, com a Oracle lançando recursos de consulta que integram dados estruturados e não estruturados, e a AWS também introduziu uma camada de armazenamento S3 otimizada para vetores. Isso estabelece uma base para o uso abrangente de documentos, imagens e até dados dispersos dentro das empresas por IA.

A mudança mais notável é a reavaliação do valor da camada semântica. Originalmente usada em ferramentas de BI ou sistemas ERP, essa camada, centrada em conceitos como “indicadores”, “dimensões” e “detalhes”, padronizou o significado e a interpretação dos dados. Empresas como Tableau, Databricks, Snowflake e Microsoft estão acelerando a introdução de camadas semânticas, sendo que o Microsoft Fabric IQ integra conceitos de ontologia empresarial na camada semântica existente, buscando garantir a precisão do contexto para análises de IA em tempo real.

Dentro dessa tendência, a iniciativa de troca aberta de semântica liderada pelo Snowflake visa estabelecer um padrão universal que assegure a interoperabilidade das camadas semânticas entre plataformas de IA e dados. Essa arquitetura, baseada no MetricFlow do dbt Labs, define indicadores e dimensões por meio de arquivos de configuração YAML. Contudo, a capacidade de projetos de código aberto de lidar com ativos semânticos de alto valor, especialmente a disposição dos fornecedores de aplicações em compartilhar esses ativos, ainda é uma incógnita.

Além disso, tecnologias como grafos de conhecimento independentes e GraphRAG estão ganhando atenção como infraestrutura fundamental para uma compreensão precisa do contexto por IA. Neo4J, o motor RAG do Google Vertex AI, e o LazyGraphRAG da Microsoft estão empenhados em construir a base tecnológica que ativa esses padrões, com casos de uso práticos crescendo progressivamente. Empresas como Deloitte e AdaptX já promovem aplicações de IA alimentadas por grafos de conhecimento em áreas complexas como saúde e segurança.

No entanto, o maior desafio continua sendo a escassez de talentos em modelagem de ontologias. Na ausência de uma capacidade de projetar estruturas semânticas de forma autônoma, a demanda por engenheiros de conhecimento e arquitetos semânticos aumenta. Isso remete às dificuldades enfrentadas na prática de “gestão do conhecimento” há décadas. Na tendência atual, uma interpretação semântica precisa e uma conexão com os negócios são mais críticas do que a simples coleta de dados.

Em última análise, o núcleo da era da IA não é apenas acumular dados, mas compreender com precisão o significado e o contexto desses dados. Espera-se que 2026 seja um ponto de inflexão na formação de uma esfera de influência semântica, onde plataformas e aplicações competirão pelo domínio. Modelos de colaboração e compartilhamento de dados de empresas como Snowflake, Databricks e SAP estão moldando uma competição baseada em padrões e ecossistemas, indicando que as empresas capazes de fornecer os “dados corretos” para IA terão o controle final.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt