英伟达与谷歌云合作,为企业带来人工智能推理能力
英伟达已与谷歌云合作,推出了一项代理式人工智能解决方案,供在英伟达驱动的基础设施上本地使用谷歌 Gemini 人工智能模型的公司使用。
通过将 NVIDIA Blackwell 平台与谷歌分布式云集成,本地数据中心能够符合监管条件和数据主权法。此外,NVIDIA 机密计算可保护 Gemini 模型中的代码,防止未经授权的访问和数据泄露。因此,企业能够限制对敏感数据的访问,包括患者记录、金融交易和机密政府文件。
英伟达和谷歌云为企业推出代理式人工智能
英伟达 Blackwell 支持机密计算,确保企业用户发送给 Gemini 模型的应用程序编程接口的提示以及用于微调的数据不会被查看或修改。此外,模型所有者还可以保护它们免受未经授权的访问或篡改,从而提供双重保护。
AI 代理的能力
代理型人工智能旨在通过提供先进的问题解决能力来变革企业技术。与依赖于学习知识的传统人工智能模型不同,新的 AI 系统能够在动态背景下进行推理、适应和决策。这些能力在 IT 领域尤其宝贵,基于知识的 AI 模型能够诊断问题、解决复杂问题并检测潜在的欺诈交易。
解决安全和完整性需求
由于许多模型使用诸如整合文本、图像、代码和其他数据类型等功能,因此诸如安全和数据主权要求之类的问题未得到解决。
在此次公告中,谷歌云利用 Blackwell GPU 和 NVIDIA 保密计算技术,成为首批提供保密计算能力的云服务提供商之一,能够在包括云和混合环境在内的各种环境中保护代理人工智能工作负载。此外,搭载 Blackwell GPU 和 NVIDIA 保密计算技术的 NVIDIA HGX 平台能够保护人工智能模型和数据,在不牺牲安全性或模型完整性的前提下,提供性能和能效。
AI 可观测性和安全性
在这一公告之后,谷歌云宣布推出新的 GKE 推理网关,旨在通过改进路由和可扩展性来优化 AI 推理工作负载。通过与 NVIDIA Triton 推理服务器和 NVIDIA NeMo Guardrails 集成,它提供了智能负载均衡,确保性能和低服务成本,同时促进模型安全和治理的集中化。
展望未来,谷歌云旨在通过整合 NVIDIA Dynamo 来提升代理式人工智能工作负载的可观测性,NVIDIA Dynamo 是一个开源库,专为在人工智能工厂中服务和扩展推理人工智能模型而创建。