Những điểm mới trong Amazon Bedrock: Hơn 100 mô hình, suy luận thông minh hơn và tích hợp dữ liệu doanh nghiệp

Amazon Web Services đang có những bước đi quan trọng nhằm phổ cập việc ứng dụng AI sinh ra. Tại hội nghị thường niên re:Invent, AWS đã công bố một bản cập nhật lớn cho Amazon Bedrock—nền tảng mô hình nền tảng quản lý—với hơn 100 mô hình mới dễ tiếp cận, tối ưu hóa suy luận nâng cao và khả năng xử lý dữ liệu mạnh mẽ nhằm giúp các doanh nghiệp đẩy nhanh triển khai AI.

Sự bùng nổ của Mô hình: Truy cập hơn 100 Mô hình Nền tảng

Phạm vi các mô hình có sẵn đang mở rộng đáng kể. Ngoài các mô hình nền tảng Amazon Nova của chính AWS, hệ sinh thái nay còn có các đóng góp từ các phòng thí nghiệm AI hàng đầu. Mô hình Ray 2 của Luma AI mang khả năng tạo video vào môi trường sản xuất, cho phép người dùng tạo nội dung video chất lượng cao từ văn bản và hình ảnh với vật lý thực tế và hành vi nhân vật nhất quán. Điều này mở ra khả năng cho các đội marketing, kiến trúc sư và nhà thiết kế muốn nhanh chóng phác thảo các ý tưởng hình ảnh.

Các nhóm tập trung vào mã nguồn nay có thể truy cập vào các mô hình malibu và point của poolside qua Amazon Bedrock, các công cụ đặc biệt thiết kế cho các nhiệm vụ kỹ thuật phần mềm như tạo mã, kiểm thử và tài liệu. Các mô hình này có thể được tinh chỉnh dựa trên các mã nguồn doanh nghiệp, giúp các công ty xây dựng trợ lý AI phù hợp với quy trình và tiêu chuẩn phát triển của riêng họ.

Stability AI’s Stable Diffusion 3.5 Large gia nhập nền tảng để thực hiện các quy trình tạo hình ảnh. Mô hình này hỗ trợ nhiều phong cách nghệ thuật đa dạng và thúc đẩy quá trình tạo ra nghệ thuật ý tưởng cho các ngành từ game đến bán lẻ.

Ngoài các mô hình chủ đạo này, Amazon Bedrock Marketplace hiện đã liệt kê hơn 100 mô hình—bao gồm các tùy chọn chuyên biệt cho tài chính (Writer’s Palmyra-Fin), dịch thuật (Upstage’s Solar Pro), và nghiên cứu sinh học (EvolutionaryScale’s ESM3). Khách hàng chọn mô hình phù hợp với mục đích sử dụng, cấu hình hạ tầng qua AWS, và triển khai qua các API thống nhất có quản trị và bảo mật tích hợp.

Suy luận Thông minh hơn: Lưu cache Prompt và Định tuyến Động

Khi các mô hình mở rộng vào sản xuất, chi phí suy luận và độ trễ trở thành các hạn chế quan trọng. Hai khả năng này giải quyết trực tiếp vấn đề đó.

Lưu cache Prompt cho phép lưu trữ an toàn các nội dung thường xuyên được sử dụng lại, giảm tải xử lý. Kết quả ban đầu cho thấy cải thiện rõ rệt: Trợ lý AI Acrobat của Adobe giảm thời gian phản hồi 72% khi lưu cache các prompt trên Amazon Bedrock. Chi phí giảm tới 90% cho các mô hình được hỗ trợ, trong khi độ trễ giảm tới 85%.

Định tuyến Prompt Thông minh xử lý độ phức tạp của yêu cầu một cách linh hoạt. Hệ thống phân tích các prompt đến bằng các kỹ thuật phù hợp nâng cao và chuyển chúng đến mô hình tối ưu trong một nhóm. Các câu hỏi đơn giản sẽ được gửi đến các mô hình nhỏ, rẻ hơn; câu hỏi phức tạp sẽ chuyển đến các mô hình lớn hơn. Kết quả: giảm tới 30% chi phí trong khi vẫn duy trì chất lượng phản hồi. Argo Labs, một công ty AI giọng nói, sử dụng phương pháp này để xử lý các câu hỏi khách hàng nhà hàng—chuyển các câu hỏi đơn giản có thể trả lời “có” hoặc “không” đến các mô hình nhẹ, trong khi dành tài nguyên tính toán cho các câu hỏi về thực đơn và khả năng đặt chỗ phức tạp hơn.

Tận dụng Dữ liệu: Truy vấn Có cấu trúc và Biểu đồ Tri thức

Các Cơ sở Tri thức Amazon Bedrock nay hỗ trợ truy xuất dữ liệu có cấu trúc trực tiếp. Thay vì chuyển đổi các cơ sở dữ liệu doanh nghiệp thành văn bản không cấu trúc, khách hàng có thể truy vấn dữ liệu có cấu trúc bằng ngôn ngữ tự nhiên, hệ thống sẽ dịch các truy vấn thành SQL thực thi trên các kho dữ liệu và hồ dữ liệu. Octus, một nền tảng trí tuệ tín dụng, dự định sử dụng tính năng này để người dùng cuối khám phá dữ liệu tín dụng có cấu trúc một cách hội thoại, biến quá trình tích hợp kéo dài nhiều tháng thành vài ngày cấu hình.

Khả năng biểu đồ tri thức (GraphRAG) cho phép doanh nghiệp tự động mô hình hóa các mối quan hệ trong dữ liệu của họ. BMW Group dự định triển khai tính năng này cho trợ lý dữ liệu nội bộ (MAIA), sử dụng cơ sở dữ liệu đồ thị để duy trì các mối quan hệ ngữ cảnh giữa các tài sản dữ liệu và liên tục cải thiện độ phù hợp của phản hồi dựa trên các mẫu sử dụng thực tế.

Dây chuyền dữ liệu Tự động: Từ Không cấu trúc đến Có cấu trúc

Dịch vụ Amazon Bedrock Data Automation mới chuyển đổi tự động các tài liệu, hình ảnh, âm thanh và video thành các định dạng có cấu trúc—một cách tự động. Các ngân hàng xử lý hồ sơ vay, các công ty bảo hiểm phân tích yêu cầu bồi thường, và các nhóm quản lý nội dung tài sản kỹ thuật số nay có thể trích xuất, chuẩn hóa và cấu trúc dữ liệu quy mô lớn mà không cần nỗ lực thủ công.

Tính năng tự động này đi kèm với điểm số độ tin cậy tích hợp và dựa trên nguồn gốc của đầu ra để giảm rủi ro “ảo tưởng”. Symbeo sử dụng để tự động hóa các khoản phải trả—trích xuất dữ liệu từ yêu cầu bồi thường bảo hiểm và hóa đơn y tế nhanh hơn. Tenovos dùng để tìm kiếm ngữ nghĩa, báo cáo tăng hơn 50% trong việc tái sử dụng nội dung.

Đà Phát triển Ứng dụng

Cơ sở đã lắp đặt phản ánh thành công của chiến lược này. Amazon Bedrock hiện phục vụ hàng chục nghìn khách hàng—tăng trưởng gấp 4.7 lần theo năm. Adobe, BMW Group, Zendesk, Argo Labs và các đối tác khác đã bắt đầu ứng dụng các khả năng mới này, cho thấy sự tin tưởng vào độ trưởng thành và hướng đi của nền tảng.

Sẵn có và Triển khai

Marketplace Amazon Bedrock hiện có sẵn ngay lập tức. Lưu cache prompt, Định tuyến Prompt Thông minh, các cải tiến về Cơ sở Tri thức (structured data và GraphRAG), cùng với Data Automation đang trong giai đoạn xem trước. Các mô hình của Luma AI, poolside và Stability AI sắp ra mắt.

Thông tin mới về bedrock phản ánh chiến lược rộng lớn hơn của AWS: giảm thiểu trở ngại cho doanh nghiệp xây dựng ứng dụng AI bằng cách tự động xử lý hạ tầng, lựa chọn mô hình và tối ưu hóa chi phí. Đối với các nhóm phát triển, điều này mang lại khả năng tạo mẫu nhanh hơn, chi phí thử nghiệm thấp hơn và dễ dàng chuyển đổi từ thử nghiệm ý tưởng sang triển khai chính thức.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim