Amazon Bedrock 新功能:超過100個模型、更智能的推理和企業數據整合

亞馬遜網路服務(AWS)正積極推動生成式人工智慧(AI)的普及。在其年度 re:Invent 大會上,AWS 宣布對其管理式基礎模型平台 Amazon Bedrock 進行重大升級——引入超過 100 款新可存取模型、先進的推理優化以及強大的資料處理能力,旨在協助企業加速 AI 部署。

模型爆炸:超過 100 款基礎模型的存取

可用模型的範圍正迅速擴大。除了 AWS 自家的 Amazon Nova 基礎模型外,生態系統現在還包括來自領先 AI 實驗室的貢獻。Luma AI 的 Ray 2 模型將影片生成能力帶入生產環境,使使用者能夠從文字和圖像創建高品質影片內容,具有逼真的物理效果和一致的角色行為。這為行銷團隊、建築師和設計師快速原型化視覺概念提供了可能。

專注於程式碼的團隊現在可以透過 Amazon Bedrock 存取 poolside 的 malibu 和 point 模型,這些工具專為軟體工程任務如程式碼生成、測試和文件撰寫而設計。這些模型可以在企業的程式碼庫上進行微調,使公司能建立符合其特定開發實踐和標準的 AI 助手。

Stability AI 的 Stable Diffusion 3.5 Large 加入平台,用於圖像生成工作流程。該模型支持多樣的藝術風格,加速從遊戲到零售等行業的概念藝術創作。

除了這些旗艦新增模型外,Amazon Bedrock Marketplace 現已收錄超過 100 款模型,包括專為金融 (Writer’s Palmyra-Fin)、翻譯 (Upstage 的 Solar Pro) 和生物研究 (EvolutionaryScale 的 ESM3) 等領域的專用模型。客戶可以根據用例選擇模型,透過 AWS 配置基礎設施,並利用內建治理與安全的統一 API 進行部署。

智能推理:提示快取與動態路由

隨著模型進入生產階段,推理成本與延遲成為關鍵限制。兩項功能能直接應對這些挑戰。

提示快取允許經常重複使用的內容被安全快取,降低處理負擔。初步結果顯示顯著改善:Adobe 的 Acrobat AI 助手在 Amazon Bedrock 上快取提示後,反應時間縮短 72%。支持的模型成本可降低高達 90%,延遲則降低最多 85%。

智能提示路由則能根據請求的複雜度動態調整。系統利用先進的匹配技術分析輸入提示,並將每個請求路由到最適合的模型。簡單查詢由較小、較便宜的模型處理;複雜問題則由較大的模型處理。結果是:成本最多降低 30%,同時保持回應品質。Argo Labs,一家語音 AI 公司,採用此方法處理餐廳客戶查詢——將簡單的是非問題導向輕量模型,將較複雜的菜單與空位查詢留給較強的計算資源。

資料應用:結構化查詢與知識圖譜

Amazon Bedrock 知識庫(Knowledge Bases)現已支援直接結構化資料檢索。客戶不再需要將企業資料庫轉換成非結構化文字,而是能用自然語言查詢結構化資料,系統會將查詢轉譯成 SQL,並在資料倉庫與資料湖中執行。信用情報平台 Octus 計劃利用此功能,讓終端用戶以對話方式探索結構化信用資料,將數月的整合工作縮短為數天的配置。

知識圖譜((GraphRAG))功能使企業能自動建模資料中的關聯性。BMW 集團計劃將此技術應用於其內部資料助理 (MAIA),利用圖形資料庫維護資料資產間的上下文關係,並根據實際使用模式持續提升回應相關性。

自動化資料流程:從非結構化到結構化

一項新的 Amazon Bedrock 資料自動化服務能自動將文件、圖像、音訊與影片轉換為結構化格式。銀行處理貸款文件、保險公司分析理賠案件,以及數位資產團隊管理內容庫的工作者,現在都能在無需手動操作的情況下,擷取、正規化並結構化資料。

此自動化工具內建信心評分,並將輸出與來源資料相連,降低幻覺(hallucination)風險。Symbeo 利用此技術加速應付帳款自動化——快速從保險理賠與醫療帳單中擷取資料。Tenovos 則用於語義搜尋,內容重用率提升超過 50%。

推動採用的動能

現有用戶基數反映策略的成功。Amazon Bedrock 現已服務數萬家客戶,年增率達 4.7 倍。Adobe、BMW 集團、Zendesk、Argo Labs 等已開始採用這些新功能,展現對平台成熟度與未來方向的信心。

可用性與推廣

Amazon Bedrock Marketplace 現已立即提供。提示快取、智能提示路由、知識庫(結構化資料與 GraphRAG)以及資料自動化功能目前處於預覽階段。Luma AI、poolside 和 Stability AI 的模型也即將推出。

這些新消息反映了 AWS 更廣泛的策略:透過自動化處理基礎設施、模型選擇與成本優化,降低企業建立 AI 應用的門檻。對開發團隊而言,這代表著更快的原型設計、更低的實驗成本,以及從概念驗證到正式部署的轉換更加容易。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)