Luma випускає Uni-1, свою першу модель, яка інтегрує логіку та генерацію зображень

robot
Генерація анотацій у процесі

Коротко

Luma представила Uni-1 — свою першу модель, яка поєднує логіку та генерацію зображень в одній архітектурі — значний крок від відеоорієнтованих коренів стартапу.

Luma Rolls Out Uni-1, Its First Model Integrating Reasoning And Image Generation

Інноваційна компанія з генерації відео на основі ШІ Luma представила Uni-1 — свою першу модель, яка інтегрує логіку та генерацію зображень у єдину архітектуру, що є стратегічним зсувом від попереднього фокусу компанії на відеоконтент.

За словами компанії, за останні три роки робота Luma еволюціонувала від реконструкції сцен до 3D-генерації та масштабування відеодифузії, але візуальні медіа самі по собі мають обмеження без інтегрованого розуміння. Uni-1 позиціонується як перша єдина модель компанії, створена для поєднання логіки та генеративних можливостей, щоб просувати мультимодальний загальний інтелект.

Luma описує загальний інтелект як здатність до логіки, уяви, маніпуляцій символами та імітації середовищ. Хоча існуючі системи ШІ можуть виконувати ці функції окремо, Uni-1 прагне об’єднати їх у єдиній рамці, моделюючи час, простір і логіку разом, щоб забезпечити розв’язання проблем, яких не можуть досягти традиційні сегментовані процеси.

Модель побудована як декодерна автогресивна трансформерна модель, яка представляє текст і зображення у єдиній черговій послідовності, що функціонує як і для введення, і для виведення. Uni-1 здатна виконувати структуроване внутрішнє логічне мислення, розбивати інструкції, вирішувати обмеження, планувати композицію та відповідно рендерити зображення.

Uni-1 демонструє здатність «мислити мовою, уявляти та відтворювати у пікселях», що Luma описує як «інтелект у пікселях». Очікується, що у наступних релізах з’являться додаткові можливості, включаючи генерацію аудіо та відео. Модель розроблена не лише як інструмент, а й як платформа, яка змінює спосіб роботи бізнесу, інтегруючи логіку безпосередньо у творчі процеси.

Агент Luma розширює єдиний інтелект

На основі Uni-1 Luma нещодавно запустила Luma Agents — набір інструментів на базі ШІ, створених для повного циклу творчого виробництва у тексті, зображеннях, відео та аудіо. Агенти працюють за допомогою сімейства моделей Luma’s Unified Intelligence, які тренуються на євій мультимодальній системі логіки. Luma позиціонує агентів як рішення для рекламних агентств, маркетингових команд, дизайн-студій та корпоративних клієнтів, пропонуючи скоординоване створення контенту у кількох модальностях.

Luma Agents сумісні з іншими моделями ШІ, включаючи Luma’s Ray 3.14, Google’s Veo 3 та Nano Banana Pro, ByteDance’s Seedream та голосовими інструментами ElevenLabs. За словами Аміта Джейна, CEO та співзасновника Luma, агенти використовують інтегровану архітектуру Uni-1, яка навчена на аудіо, відео, зображеннях, мові та просторовому логіці, що дозволяє їм планувати, виконувати та генерувати контент у скоординованому, інтелектуальному робочому процесі.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити