Luma представляет Uni-1, свою первую модель, объединяющую рассуждение и генерацию изображений

robot
Генерация тезисов в процессе

Кратко

Luma представила Uni-1 — свою первую модель, объединяющую рассуждение и генерацию изображений в одной архитектуре — что является значительным сдвигом от первоначальной направленности стартапа на видео.

Luma Rolls Out Uni-1, Its First Model Integrating Reasoning And Image Generation

AI-стартап по генерации видео Luma представила Uni-1 — свою первую модель, которая интегрирует рассуждение и генерацию изображений в единую архитектуру, что отражает стратегический сдвиг от предыдущего фокуса компании на видеоконтент.

По словам компании, за последние три года работа Luma эволюционировала от реконструкции сцен до 3D-генерации и масштабирования диффузии видео, однако визуальные медиа сами по себе имеют ограничения без интегрированного понимания. Uni-1 позиционируется как первая объединённая модель компании, предназначенная для сочетания рассуждения и генеративных возможностей, с целью развития мультимодального общего интеллекта.

Luma описывает общий интеллект как способность рассуждать, воображать, манипулировать символами и моделировать окружение. В то время как существующие системы ИИ могут выполнять эти функции отдельно, Uni-1 стремится объединить их в единую структуру, моделируя время, пространство и логику вместе, чтобы решать задачи, которые традиционные сегментированные системы не могут решить.

Модель построена как декодер-only автогрессивный трансформер, представляющий текст и изображения в единой чередующейся последовательности, которая служит как входом, так и выходом. Uni-1 способен выполнять структурированное внутреннее рассуждение, разбирать инструкции, решать ограничения, планировать композицию и рендерить изображения соответствующим образом.

Uni-1 демонстрирует способность «думать на языке и воображать и отображать в пикселях», что Luma описывает как «интеллект в пикселях». В следующих релизах ожидается добавление таких функций, как генерация аудио и видео. Модель предназначена не только как инструмент, но и как платформа, которая меняет подход бизнеса, интегрируя рассуждение прямо в творческие рабочие процессы.

Агентства Luma расширяют объединённый интеллект

На базе Uni-1 Luma недавно запустила Luma Agents — набор инструментов на базе ИИ, предназначенных для полного цикла творческого производства в текстах, изображениях, видео и аудио. Агентства работают с помощью семейства моделей Luma’s Unified Intelligence, обученных на единой мультимодальной системе рассуждения. Luma позиционирует агенты как решение для рекламных агентств, маркетинговых команд, дизайн-студий и корпоративных клиентов, предлагая скоординированное создание контента по нескольким модальностям.

Luma Agents совместимы с другими моделями ИИ, включая Ray 3.14 от Luma, Veo 3 и Nano Banana Pro от Google, Seedream от ByteDance и голосовые инструменты ElevenLabs. По словам Аміта Джейна, CEO и соучредителя Luma, агенты используют встроенную архитектуру Uni-1, которая обучена на аудио, видео, изображениях, языке и пространственном рассуждении, что позволяет им планировать, выполнять и генерировать контент в скоординированном, интеллектуальном рабочем процессе.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$0.1Держатели:1
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.41KДержатели:1
    0.00%
  • РК:$2.46KДержатели:2
    0.23%
  • Закрепить