Искусственный интеллект 2026 года: битва за «правильные данные» началась... Семантический дизайн определит исход

robot
Генерация тезисов в процессе

2025 год станет годом, когда генеративный искусственный интеллект(AI) станет ключевой темой индустрии и откроет “эпоху данных и искусства”. Но к 2026 году его значение выйдет за рамки простого получения качественных данных, и полностью проявится проблема понимания и использования семантических слоёв данных(semantic layers). Это ознаменует начало эпохи семантического проектирования данных, включающего графы знаний, онтологии, способных явно учитывать контекст данных, семантику и бизнес-идентичность.

В прошлом году волна “умных агентов” AI охватила всю индустрию, многие компании надеялись с её помощью автоматизировать бизнес и оптимизировать решения. Но большинство таких AI-агентов не оправдали ожиданий, и качество используемых данных и их контекстуальная релевантность начали рассматриваться как основные причины. Исследование Карнеги-Меллонского университета показало, что современные агенты ещё не прошли достаточную подготовку для выполнения сложных задач, а ошибки в логике, вызванные неправильным пониманием контекста данных, снижают их общую производительность.

На этом фоне важными вопросами стали развитие(Data Quality) и системы управления(Data Governance) данных. Основные облачные провайдеры, такие как Amazon Web Services(AWS), хотя и продолжают предоставлять крупную экосистему данных, выпустили новые технологии и платформы в области данных, но их инновации по сравнению с прошлым годом ограничены. В то же время, такие события, как покупка IBM Confluent и выпуск Microsoft HorizonDB на базе PostgreSQL, символизируют тенденцию к перестройке технологического стека данных.

Архитектура без ETL и технологии обмена данными уже стали мейнстримом в 2025 году. Это попытки упростить сложные и уязвимые каналы передачи данных, например, платформы Snowflake, Databricks и другие значительно повысили доступность бизнес-данных, поддерживая интеграцию с SAP или Salesforce.

Другой тренд — распространение технологий обработки векторных данных. Большинство ведущих платформ данных усилили возможности поиска и анализа по векторам, Oracle выпустила функциональность запросов, объединяющую структурированные и неструктурированные данные, а AWS запустила оптимизированный для векторов слой хранения S3. Всё это создает основу для полного использования AI в документах, изображениях и даже разбросанных внутри предприятий данных.

Самое важное изменение — переоценка ценности семантического слоя. Изначально предназначенный для BI-инструментов или ERP-систем, этот уровень стандартизировал смысл и интерпретацию данных вокруг таких понятий, как “метрики”, “измерения” и “детали”. Компании Tableau, Databricks, Snowflake, Microsoft активно внедряют семантические слои, а Microsoft Fabric IQ ещё больше интегрирует концепцию корпоративных онтологий в существующие семантические слои, чтобы обеспечить точность контекста при реальном времени AI-анализе.

В рамках этого тренда инициатива открытого обмена семантикой, основанная на Snowflake, направлена на создание универсальных стандартов для обеспечения совместимости семантических слоёв между различными AI и платформами данных. Эта архитектура основана на MetricFlow от dbt Labs и использует YAML-конфигурации для определения метрик и измерений. Но сможет ли открытый проект обрабатывать ценные семантические активы, особенно учитывая готовность поставщиков данных делиться ими, — вопрос открытый.

Дальше — технологии независимых графов знаний и GraphRAG, которые рассматриваются как инфраструктура для точного понимания контекста AI. Neo4J, Google Vertex AI RAG и Microsoft LazyGraphRAG работают над созданием технической базы для активации таких моделей, и практические кейсы постепенно растут. Компании, такие как Deloitte и AdaptX, уже внедряют графы знаний для AI в сложных областях, таких как медицина и безопасность.

Но самая большая проблема — нехватка специалистов по моделированию онтологий. В условиях, когда AI не способен самостоятельно проектировать семантические структуры, растёт спрос на инженеров знаний и архитекторов семантики. Это напоминает практики “управления знаниями” десятилетней давности. В текущих трендах точное понимание семантики и её связь с бизнесом важнее простого сбора данных.

В конечном итоге, ядро эпохи AI — это не просто накопление данных, а их способность точно понимать смысл и контекст. Ожидается, что к 2026 году это станет переломным моментом формирования круга влияния семантики, когда платформы и приложения начнут бороться за лидерство. Модели совместного использования Snowflake, Databricks, SAP и других компаний формируют конкуренцию вокруг стандартов и экосистем, что в конечном итоге даст возможность компаниям, предоставляющим “правильные” данные для AI, завоевать доминирующее положение.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить