谷歌云服务商 | 如何利用谷歌云加速药物研发

传统的药物研发过程需要大量的资金投入、漫长的研发周期,而且失败率极高。从初步研究到获得监管部门的批准,将一种新药推向市场可能需要数十年的时间。在此期间,许多原本前景光明的候选药物最终因疗效不佳或安全问题而失败。只有一小部分候选药物能够成功通过临床试验和监管审核。

作为谷歌云授权代理商,Cloud Ace云一 在本文为大家介绍一个谷歌云在医药行业的成功案例——SandboxAQ,一家为包括医药行业在内的客户提供技术和软件解决方案的公司,利用谷歌云帮助客户加速药物研发。

SandboxAQ 正在帮助研究人员探索广阔的化学空间,深入了解分子相互作用,并精准预测生物学结果。它采用主动学习、绝对自由能扰动解 (AQFEP)、生成式人工智能 (AI)、结构分析和预测数据分析等尖端计算方法 , 最终缩短药物发现和开发时间。所有这些操作都基于云原生基础实现。

药物设计涉及分子设计、合成和测试的迭代循环,称为“设计-制造-测试”循环。许多客户在设计阶段寻求 SandboxAQ 的帮助,通常是因为他们的计算方法不够完善。通过改进和加速这一环节,SandboxAQ 帮助药物化学家将创新有效的分子推向市场。例如,在一个与神经退行性疾病相关的项目中,SandboxAQ 的方法将化学空间从 25 万个分子扩展到 560 万个分子,命中率提高了 30 倍,显著加快了候选分子的发现速度。

SandboxAQ 的软件依赖于大规模计算,为了最大限度地提高灵活性和规模,它们使用了云策略,其中包括谷歌云基础设施和工具。

大规模虚拟筛选活动所需的技术必须灵活且经济高效地扩展。具体来说,SandboxAQ 的工程师需要能够快速迭代科学代码,立即以经济高效的方式大规模运行该代码,并存储和组织其生成的所有数据。

SandboxAQ 借助谷歌云基础架构显著提升了效率和可扩展性。他们将计算吞吐量提升了 100 倍,从而能够并行利用数万台虚拟机 (VM)。此外,它们还将空闲时间减少了 90%,从而提高了利用率。通过将开发和部署整合到 Google Cloud,SandboxAQ 简化了其工作流程,涵盖从代码开发和测试到大规模批处理和机器学习模型训练的各个环节。

SandboxAQ 的所有开发和部署均在云端进行。代码和数据均存储在云服务中,开发工作则在云平台上进行,该平台为科学家和工程师提供自助式虚拟机,其中包含标准化且集中维护的环境和工具。这一点至关重要,因为科学代码通常需要强大的计算硬件。科学家可以使用强大的 96 核机器或配备大型 GPU 的实例。他们还可以创建具有替代配置或 CPU 类型的新机器(如下图所示),从而实现跨异构资源的低摩擦测试和开发流程。

SandboxAQ 的科学家和开发人员使用公司的“bench”客户端管理和访问它们的 Bench 机器(见上文)。它们可以通过 SSH 连接到机器,或者使用任意数量的托管工具,例如基于浏览器的 VNC 服务(用于即时远程桌面),或使用 JupyterLab(用于熟悉的笔记本开发流程)。

当代码准备好大规模运行时,研究人员可以将 SandboxAQ 参数化的计算集作为作业调度到由 Batch 提供支持的内部工具上。Batch 是一项完全托管的服务,用于在 Google 基础架构上调度、排队和执行批处理作业。通过紧密同步开发环境和批处理运行时环境,可以快速大规模地运行更改。在实验室机器上开发的代码会被推送到 GitHub,并立即可用于批处理执行。然后,随着工具被审核并合并到公司 monorepo 的“main”中,这些新工具将自动在 SandboxAQ 科学家的实验室机器上可用。他们可以在任何全局区域的任何谷歌云虚拟机资源上启动并行作业,处理数百万个分子,并利用按需或 Spot VM 。

SandboxAQ 实现了全局解析的传递依赖关系树,从而简化了包和依赖关系的管理。通过这种做法,Google Batch 可以与工程师开发的各个工具无缝集成,从而并行训练模型的多个实例。

机器学习是 SandoxAQ 战略的核心组成部分,因此便捷的数据访问尤为重要。同时,SandboxAQ 的药物研发团队也与拥有敏感数据的客户合作。为了保护客户的数据安全,基准测试和批处理工作负载通过 IAM 管理的统一界面读写数据,从而实现对组织内不同数据源的精细控制。

与此同时,Cloud Logging、Cloud Monitoring、Compute Engine 和 Cloud Run 等谷歌云服务简化了开发工具以监控这些工作负载、轻松向 SandboxAQ 科学家提供日志以及梳理海量输出数据的过程。当新功能测试完成或错误出现时,科学团队可以立即获取更改,而无需费力调整基础设施。然后,当代码稳定后,他们可以将其集成到下游生产应用程序中,所有这些都在谷歌云上以集中安全、统一的方式进行。

简而言之,在谷歌云上拥有统一的开发、批量计算和生产环境,可以减少 SandboxAQ 在开发新工作负载并大规模运行过程中遇到的阻力。凭借用于科学工作负载开发和工程的共享环境,SandboxAQ 使客户能够快速轻松地从实验过渡到生产,从而快速交付客户所需的结果。

关于 Cloud Ace

Cloud Ace 是 GCP 授权经销商 和 MSP 托管服务提供商,拥有 500 多名工程师,在亚太地区及全球拥有顶尖的服务业绩和多个分支机构。

我们提供从云咨询、设计、迁移、开发到运维、培训及生成式 AI 应用的一站式服务,服务超过 2000 家客户,与超过 120 家合作企业共同推动数据迁移,涵盖制造、零售、信息通信、游戏、医疗健康与医药科学等多个行业

此外 Cloud Ace 推出了 GenAIOps 解决方案,助力企业生成式 AI 商业化落地;并成为Langfuse 亚太地区首个经销商,为企业用户提供 LLM 全链路解决方案!

Leave a Reply