Amazon Bedrock 新功能:100+ 模型、更智能的推理和企业数据集成

亚马逊Web Services正在采取重大举措,推动生成式AI的普及。在其年度re:Invent大会上,AWS宣布对Amazon Bedrock——其托管基础模型平台——进行了重大更新,推出了100多款新型可访问模型、先进的推理优化以及强大的数据处理能力,旨在帮助企业加快AI部署。

模型爆炸:访问100+基础模型

可用模型的范围正迅速扩大。除了AWS自家的Amazon Nova基础模型外,生态系统现在还包括来自领先AI实验室的贡献。Luma AI的Ray 2模型将视频生成能力引入生产环境,使用户能够从文本和图像创建高质量的视频内容,具有逼真的物理效果和一致的角色行为。这为市场营销团队、建筑师和设计师快速原型化视觉概念提供了可能。

专注于代码的团队现在可以通过Amazon Bedrock访问poolside的malibu和point模型,这些工具专为软件工程任务设计,如代码生成、测试和文档编写。这些模型可以在企业代码库上进行微调,使公司能够构建适应其特定开发实践和标准的AI助手。

Stability AI的Stable Diffusion 3.5 Large加入平台,用于图像生成工作流程。该模型支持多样的艺术风格,加快从游戏到零售行业的概念艺术创作。

除了这些旗舰模型外,Amazon Bedrock Marketplace现已收录超过100款模型,包括面向金融的(Writer的Palmyra-Fin)、翻译的(Upstage的Solar Pro)以及生物研究的(EvolutionaryScale的ESM3)等专业选项。客户可以根据用例选择模型,通过AWS配置基础设施,并通过具有内置治理和安全性的统一API进行部署。

智能推理:提示缓存与动态路由

随着模型规模进入生产阶段,推理成本和延迟成为关键限制。两项能力直接应对这一挑战。

提示缓存允许频繁重用的内容被安全缓存,减少处理开销。初步结果显示显著改善:Adobe的Acrobat AI助手在Amazon Bedrock上缓存提示后,响应时间减少了72%。支持的模型成本可降低90%,延迟最多降低85%。

智能提示路由根据请求的复杂程度动态处理。系统利用先进的匹配技术分析输入提示,并将每个请求路由到最优模型。简单查询由较小、成本较低的模型处理;复杂问题则由更大模型处理。结果是:成本最多降低30%,同时保持响应质量。语音AI公司Argo Labs采用此方法处理餐厅客户查询——将简单的是非问题路由到轻量级模型,而将复杂的菜单和可用性查询留给计算资源。

数据利用:结构化查询与知识图谱

Amazon Bedrock知识库现在支持直接结构化数据检索。客户无需将企业数据库转换为非结构化文本,而是可以用自然语言查询结构化数据,系统会将查询转换为SQL,并在数据仓库和数据湖中执行。信用情报平台Octus计划利用此功能,让终端用户以对话方式探索结构化信用数据,将数月的集成工作转变为几天的配置。

知识图谱功能(GraphRAG)使企业能够自动建模数据中的关系。宝马集团计划为其内部数据助手(MAIA)实现此功能,利用图数据库维护数据资产之间的上下文关系,并根据实际使用模式不断提升响应相关性。

自动化数据管道:从非结构化到结构化

一项新的Amazon Bedrock数据自动化服务可以自动将文档、图像、音频和视频转换为结构化格式。银行处理贷款文件、保险公司分析理赔、数字资产团队管理内容库的工作都可以实现大规模的自动提取、归一化和结构化,无需人工干预。

该自动化工具内置置信度评分,并以源材料为依据,降低“幻觉”风险。Symbeo利用此技术实现应付账款自动化——更快地从保险理赔和医疗账单中提取数据。Tenovos则用它进行语义搜索,内容重用率提升50%以上。

采纳动力

已部署的基础显示出该策略的成功。Amazon Bedrock目前服务于数万客户,年增长率达4.7倍。Adobe、宝马集团、Zendesk、Argo Labs等已开始采用这些新功能,显示出对平台成熟度和未来方向的信心。

可用性与推广

Amazon Bedrock Marketplace现已正式上线。提示缓存、智能提示路由、知识库增强(结构化数据和GraphRAG)以及数据自动化功能正处于预览阶段。Luma AI、poolside和Stability AI的模型也即将推出。

这些新动态反映了AWS的更大战略:通过自动处理基础设施、模型选择和成本优化,降低企业构建AI应用的门槛。对于开发团队而言,这意味着更快的原型设计、更低的试验成本,以及从概念验证到生产部署的更平滑过渡。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)