Luma ra mắt Uni-1, mẫu đầu tiên tích hợp khả năng suy luận và tạo hình ảnh

robot
Đang tạo bản tóm tắt

Tóm tắt

Luma giới thiệu Uni-1, mẫu đầu tiên của họ kết hợp lý luận và tạo hình trong một kiến trúc — đánh dấu bước chuyển lớn từ nguồn gốc startup tập trung vào video.

Luma Rolls Out Uni-1, Its First Model Integrating Reasoning And Image Generation

Startup sản xuất video AI Luma giới thiệu Uni-1, mẫu đầu tiên tích hợp lý luận và tạo hình trong một kiến trúc duy nhất, đánh dấu bước chuyển chiến lược từ trọng tâm trước đây là nội dung video của công ty.

Theo công ty, trong ba năm qua, công việc của Luma đã phát triển từ tái tạo cảnh thành tạo hình 3D và mở rộng phân tán video, nhưng phương tiện hình ảnh đơn thuần có giới hạn nếu không có hiểu biết tích hợp. Uni-1 được định vị là mẫu thống nhất đầu tiên của công ty nhằm kết hợp khả năng lý luận và sáng tạo, hướng tới nâng cao trí thông minh đa phương thức tổng quát.

Luma mô tả trí thông minh tổng quát là khả năng lý luận, tưởng tượng, thao tác ký hiệu và mô phỏng môi trường. Trong khi các hệ thống AI hiện tại có thể thực hiện các chức năng này riêng lẻ, Uni-1 mong muốn kết hợp chúng trong một khung duy nhất, mô hình hóa thời gian, không gian và logic cùng lúc để giải quyết vấn đề mà các quy trình phân đoạn truyền thống không thể đạt được.

Mẫu này được xây dựng như một bộ giải mã tự hồi quy, đại diện cho văn bản và hình ảnh trong một chuỗi xen kẽ, vừa làm đầu vào vừa làm đầu ra. Uni-1 có khả năng thực hiện lý luận nội bộ có cấu trúc, phân tích hướng dẫn, giải quyết ràng buộc, lập kế hoạch sáng tác và tạo hình ảnh phù hợp.

Uni-1 thể hiện khả năng “nghĩ bằng ngôn ngữ và tưởng tượng, hiển thị bằng pixel,” một khả năng mà Luma gọi là “trí thông minh trong pixel.” Các đầu ra bổ sung, bao gồm tạo âm thanh và video, dự kiến sẽ có trong các bản phát hành tiếp theo. Mẫu này không chỉ là công cụ mà còn là nền tảng thay đổi cách doanh nghiệp hoạt động bằng cách tích hợp lý luận trực tiếp vào quy trình sáng tạo.

Các Đại lý Luma Mở Rộng Trí Tuệ Thống Nhất

Dựa trên Uni-1, Luma gần đây ra mắt các Đại lý Luma, bộ công cụ dựa trên AI được thiết kế để xử lý toàn diện quá trình sáng tạo qua văn bản, hình ảnh, video và âm thanh. Các đại lý hoạt động dựa trên dòng mô hình Trí Tuệ Thống Nhất của Luma, được huấn luyện trên một hệ thống lý luận đa phương thức duy nhất. Luma định vị các đại lý như một giải pháp cho các công ty quảng cáo, nhóm marketing, studio thiết kế và khách hàng doanh nghiệp, cung cấp khả năng sáng tạo phối hợp qua nhiều phương thức.

Các Đại lý Luma tương thích với các mô hình AI khác, bao gồm Luma’s Ray 3.14, Google’s Veo 3 và Nano Banana Pro, ByteDance’s Seedream, và các công cụ tạo giọng nói của ElevenLabs. Theo Amit Jain, CEO và đồng sáng lập của Luma, các đại lý tận dụng kiến trúc tích hợp của Uni-1, đã được huấn luyện qua các lĩnh vực âm thanh, video, hình ảnh, ngôn ngữ và lý luận không gian, cho phép chúng lập kế hoạch, thực thi và tạo nội dung trong một quy trình làm việc phối hợp, thông minh.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.41KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.46KNgười nắm giữ:2
    0.23%
  • Vốn hóa:$2.41KNgười nắm giữ:0
    0.00%
  • Ghim