谷歌云经销商:全球端点提高了 Anthropic 的 Claude 在 Vertex AI 上的可用性

本文由谷歌云谷歌地图官方授权总代理 CloudAce云一 整理发布。

谷歌云谷歌地图在中国授权代理商名单:Cloud Ace云一,全球20+分公司,国内核心城市多个据点,谷歌云与谷歌地图代理商、顶级合作伙伴(Premier Partner),2025 年唯一获大中华区最佳国家合作伙伴奖企业。谷歌系产品齐全,与谷歌合作超过10年,值得信赖。

Anthropic 在 Vertex AI 上发布的 Claude 模型现已通过 Claude 模型的全球端点提升了整体可用性。该全球端点现已正式发布,它能够将您的请求动态路由到您正在使用的 Claude 模型所支持的任何具有可用容量的区域。这可以帮助您部署由 Claude 驱动的应用程序和代理,并提高正常运行时间和可靠性。

在预览期间,像Replicate这样的客户亲身体验了全球端点的优势。Replicate 的创始设计师 Zeke Sikelianos 指出:“人们使用 Replicate 是因为他们希望大规模部署 AI 模型。Vertex AI 上的 Claude 完美契合了这一点——我们获得了市面上最好的语言模型之一,再加上 Google 坚实的基础架构和能够在全球范围内快速响应的全球端点,一切都变得如此有效。”

全球端点即将推出,支持以下 Claude 模型的按使用量付费流量:

  • Claude Opus 4
  • Claude Sonnet 4
  • Claude Sonnet 3.7
  • Claude Sonnet 3.5 v2

什么是全局端点以及何时应该使用它们?

当您向 Vertex AI 上的 Anthropic Claude 模型发送请求时,通常会指定一个区域(例如us-central1 )。这是一个区域端点,可将您的数据和处理保留在该地理边界内,非常适合对数据驻留有严格要求的应用程序。

相比之下,全球终端节点不会将您的请求绑定到单个区域。相反,它会将流量引导至一个全球入口点,该入口点会将您的请求动态路由到具有可用容量的区域。这种多区域方法旨在最大限度地提高可用性,并减少特定区域高流量可能引起的错误。

那么,什么时候全球端点才是正确的选择?

  • 如果您的应用程序需要最高的可用性,并且您的数据不受居住地限制,那么全球端点非常适合。
  • 如果您的服务面临区域容量限制,或者您正在构建最大程度地抵御区域中断的功能。

但是,如果您有数据驻留要求(特别是针对机器学习处理),则应继续使用区域端点,因为全局端点并不能保证请求在任何特定位置得到处理。以下是全局端点与区域端点的简单对比:

全球与区域端点

通过让您在全球和区域端点之间进行选择,Vertex AI 使您能够构建更复杂、更具弹性、可扩展的生成式 AI 应用程序和代理,以满足您的特定架构和业务需求。

快速缓存和按需付费定价

作为此次发布的一部分,快速缓存功能已全面支持全球端点。当快速缓存被缓存后,后续相同的请求将被路由到缓存所在区域,以实现最低的延迟。如果该区域已满,系统将自动尝试下一个可用区域来处理请求。此项集成确保全球端点用户仍然能够享受快速缓存的优势(更低的延迟和成本)。

请注意,目前 Claude 模型的全局端点仅支持按量付费流量。预配吞吐量仅在区域端点上可用。

全球端点请求的收费与区域端点请求的收费相同。

最佳实践

为了充分利用此新功能,我们建议您将主要流量路由到全球端点。将区域端点作为辅助选项,尤其适用于必须遵守数据驻留规则的工作负载。为确保最佳性能并避免不必要的成本,请勿同时向全球端点和区域端点提交同一请求。

此功能现已提供单独的全新全局配额。您可以在 Google Cloud 控制台的“配额和系统限制”页面上查看和管理此配额,并根据需要申请增加配额。对全局端点发出的请求的定价与区域端点的定价相同。

如何开始

要在 Vertex AI 上开始使用 Anthropic 的 Claude 模型的全局端点,只需两个步骤:

步骤 1:在 Vertex AI 上选择并启用全局端点支持的Claude 模型 (Claude Opus 4、Claude Sonnet 4、Claude Sonnet 3.7、Claude Sonnet 3.5 v2)。

第 2 步:在配置中,将“GLOBAL”设置为位置变量值,并使用全局端点 cURL:

https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME

任何谷歌云谷歌地图需求可以搜索: Cloud Ace云一。

Leave a Reply