Cloud周报第212期：SAP推出生成式AI助理Joule的扩展功能，增加可自订技能的协作型AI代理-灰度官网

Cloud周报第212期：SAP推出生成式AI助理Joule的扩展功能，增加可自订技能的协作型AI代理

支付動態 · 2024-10-11

在近日在SAP TechEd技术大会上，SAP推出生成式AI助理Joule的扩展功能，包括推出可自订技能的协作型AI代理，未来可以结合跨业务领域的专业知识，通过协作完成复杂的工作流程。

就在OpenAI发表低延迟的GPT-4o即时API服务后，微软随后更新Azure OpenAI服务，推出了低延迟GPT-4o模型API公开预览，支持即时语音与音频交互，适用于即时交互的场景，如客户支持、语音助理和即时语音翻译。

GPT-4o即时API是Azure OpenAI的GPT-4o模型系列之一，通过API，企业可以直接将其整合到内部应用程序，支持低延迟语音输入和输出，打造出更自然的语音对话应用程序。该模型提升语音回应速度，减少延迟并提供更流畅的交互体验。API支持多语言对话，可广泛应用于客服助理、内容创作和即时音频翻译等领域。

该版本的GPT-4o模型初期仅在美国东部和瑞典中部地区推出。目前，德国Bosch已采用此模型，用于汽车环境中的虚拟实境培训，能接收语音指导指令。

GCP 机密运算

Google Cloud更新机密运算产品线，推出C3和C3D两款VM机密运算服务

Google Cloud近日更新机密运算产品线，正式推出C3和C3D两款Google Cloud机密VM（Confidential VMs）服务，前者采用的处理器是英特尔第4代Intel Xeon处理器，内置TDX虚拟机硬件隔离技术，后者则是AMD第4代EPYC，内置SEV安全加密虚拟化技术，借此强化对运算基础架构的安全防护。

相较前一版本，新的机密运算运行个体服务C3，采用AMX指令集扩展架构内置CPU加速，可加速AI和ML工作负载。此外，利用TDX技术，新版本上也能集成通用加密运算平台Anjuna Seaglass与Google Cloud机密VM。

另一方面，采用了AMD SEV技术的C3D，不只使用硬件的内存加密来加强数据机密性，还可以在性能更强的硬件上运行，并能结合Google Titanium硬件提升处理性能。

目前C3D运行个体服务已推出，而C3则先在亚洲、美国和欧洲部分区域推出。

Azure 虚拟机

配备141GB的HBM内存，Azure最新AI超级运算优化虚拟机亮相

微软 Azure 近日推出 AI 超级运算优化虚拟机 ND H200 v5，具备更大 HBM 容量，支持更高训练样本数，并提升GPU利用率与吞吐量，可用于大型语言模型（LLM）和小语言模型 (SLM) 的推理工作负载。

与上一代ND H100 v5 相比，Azure ND H200 v5配备8个Nvidia H200 Tensor Core GPU，不只运算性能更强，HBM内存也增加了 76%，达到141GB，带宽提升 43%达到4.8 TB/s，能更快地存取模型参数，降低应用程序延迟。新款VM还能在单一VM的内存中存取更复杂的LLM，而不需要分散在多个VM上运行。

此外，在设计上，ND H200 v5可以更有效地管理模型权重、键值缓存和训练样本的GPU内存，提升 GenAI 推理工作负载的吞吐量、延迟及成本效率。微软指出，该版本在运行LLAMA 3.1 405B模型的推理工作时，吞吐量比前一代提升 35%。

ND H200 v5也预先集成多项服务，包括 Azure Batch、Azure Kubernetes 服务、Azure OpenAI 服务和Azure机器学习，让企业可快速部署应用。

Vodafone Google Cloud

英国电信商Vodafone与Google扩大联手，未来10年将在非洲和欧洲大推云端服务和GenAI

英国跨国电信商Vodafone与Google近日宣布将签署一项总值10亿美元、为期 10 年的战略合作协议，在此合作下，Vodafone将为非洲和欧洲客户提供Google cloud云端服务和Gemini生成式服务，进一步推动这些地区的数位转型与应用创新。

Vodafone和Google合作的首要重点是帮助企业和消费端行动用户导入最新的硬件，如Google Pixel设备，和AI及云端应用程序在内的数位技术。

Vodafone计划2025年先在欧洲少部分国家推出Google One AI Premium 订阅计划，让企业用户将能够使用Google生成式 AI 平台Gemini Advanced，应用于内部系统，并提供视觉、文本及音频等功能支持。

在安全上，Vodafone将利用Google云端安全营运平台为其企业客户开发新的云原生安全服务。

／微软

更多Cloud动态

1.本土车厂纳智捷采用Google生成式AI模型Gemini打造AI智能客服系统

2.微软云端数据库服务AlloyDB的ScaNN矢量索引功能现已推出，支持最多10亿个矢量运行搜索